TL;DR
Không cần API, bạn vẫn kiểm soát AI bằng văn bản thuần túy. Thay vì temperature=0.9, viết “Temperature: 0.9” hoặc “Hãy sáng tạo và táo bạo” - AI hiểu cả hai. Các tham số có thể mô phỏng: Temperature (thấp = trang trọng/sự thật, cao = cảm xúc/sáng tạo), Top-P (thấp = tập trung hẹp, cao = khám phá rộng), độ dài (“Tối đa 50 tokens”), stop sequences (“Chỉ 10 mục”), penalties (“Tránh lặp, dùng từ đồng nghĩa”). Bạn đang thiết kế hành vi AI, không chỉ hỏi đáp.
Bạn không có quyền truy cập API, vậy làm sao?
Thực tế:
Khi dùng ChatGPT hoặc Claude trên web, bạn KHÔNG thể điều chỉnh Temperature, Top-P hay các tham số kỹ thuật trực tiếp.
Nhưng:
Bạn vẫn có thể ảnh hưởng đến hành vi AI bằng cách viết prompt thông minh.
Kết quả:
✅ Bạn có thể kiểm soát:
- Độ sáng tạo (Temperature)
- Độ tập trung (Top-P)
- Độ dài câu trả lời
- Tránh lặp lại
- Dừng đúng chỗ
Tất cả chỉ bằng văn bản thuần túy.
Nguyên tắc: Tham số văn bản
Thay vì:
temperature = 0.9
Bạn viết:
"Temperature: 0.9"
Hoặc đơn giản hơn:
"Hãy sáng tạo và táo bạo."
💡 AI hiểu CẢ HAI cách. Số hoặc lời — cùng hiệu quả.
1. Kiểm soát Temperature bằng văn bản
Thí nghiệm
Prompt gốc:
"Mô tả tương lai của AI trong giáo dục"
Kết quả mặc định:
- Tông điệu học thuật, khô khan
- Ngôn từ chuẩn mực, không cảm xúc
- Câu văn có cấu trúc rõ ràng
🔴 Temperature Cao (0.9): Chế độ “Phê”
Cách 1: Dùng số
"Mô tả tương lai của AI trong giáo dục.
Temperature: 0.9"
Cách 2: Dùng lời
"Mô tả tương lai của AI trong giáo dục.
Hãy táo bạo. Dùng ẩn dụ. Hãy sáng tạo."
Kết quả:
- ✅ Ngôn từ cảm xúc hơn, có thể có emoji
- ✅ Văn phong lỏng lẻo, biểu cảm
- ✅ Có ẩn dụ, so sánh bất ngờ
Hiệu ứng:
Giải thích khô khan → Tường thuật sống động
Chỉ nhờ MỘT tham số
🔵 Temperature Thấp (0.2): Chế độ “Tỉnh”
Cách 1: Dùng số
"Mô tả tương lai của AI trong giáo dục.
Temperature: 0.2"
Cách 2: Dùng lời
"Mô tả tương lai của AI trong giáo dục.
Tuân thủ sự thật. Tránh phỏng đoán. Viết trang trọng."
Kết quả:
- ✅ Bám sát sự thật
- ✅ Tránh phỏng đoán mạo hiểm
- ✅ Tông điệu trang trọng, học thuật
- ✅ Tập trung, không lan man
So sánh Temperature
| Khía cạnh | Thấp (0.2) | Cao (0.9) |
|---|---|---|
| Tông điệu | Học thuật, trang trọng | Cảm xúc, biểu cảm |
| Rủi ro | Tránh phỏng đoán | Cho phép giả định |
| Phong cách | Khô, có cấu trúc | Sống động, lỏng lẻo |
| Ẩn dụ | Tối thiểu | Thường xuyên |
2. Kiểm soát Top-P bằng văn bản
Top-P là gì?
Top-P = Thanh trượt “tập trung” của AI.
- Thấp: AI chỉ chọn từ “an toàn” nhất
- Cao: AI được phép “mạo hiểm” hơn
Khác gì với Temperature?
| Temperature | Top-P |
|---|---|
| Độ “liều” chung | Độ “rộng” của suy nghĩ |
| Nút điều chỉnh sáng tạo | Thanh trượt tập trung |
🔵 Top-P Thấp (0.5): Đèn pha hẹp
Cách đặt:
"Mô tả tương lai của AI trong giáo dục.
Top-P: 0.5"
Hoặc:
"Ở trong những ý tưởng có khả năng nhất.
Không tưởng tượng không cần thiết."
Hiệu ứng:
- ✅ Câu trả lời có cấu trúc
- ✅ Ngắn gọn, bảo thủ
- ✅ Trong phạm vi hẹp
🔴 Top-P Cao (1.0): Đèn pha rộng
Cách đặt:
"Mô tả tương lai của AI trong giáo dục.
Top-P: 1.0"
Hiệu ứng:
- ✅ Các kịch bản tương lai
- ✅ Ẩn dụ bất ngờ
- ✅ So sánh sáng tạo
- ✅ Khám phá khả năng rộng hơn
Hình dung
Top-P Thấp (0.5) = Đèn pha chùm hẹp
├── Câu trả lời an toàn nhất
├── Ý tưởng phổ biến nhất
└── Diễn giải bảo thủ
Top-P Cao (1.0) = Đèn pha chùm rộng
├── Kịch bản tương lai
├── Ẩn dụ bất ngờ
└── Khả năng sáng tạo
Insight quan trọng
Chúng ta vừa thay đổi phạm vi xác suất của AI
KHÔNG chạm vào bất kỳ cài đặt backend nào
Chỉ bằng văn bản thuần túy
Đó chính là sức mạnh của Prompt Engineering:
🎯 Bạn kiểm soát tông điệu và sáng tạo
Không chỉ qua CÁI GÌ bạn hỏi
Mà cả CÁCH bạn hỏi
3. Kiểm soát Độ dài
Đơn giản nhưng hiệu quả
Cách làm:
Nói rõ với AI:
- Số từ
- Số ký tự
- Số tokens
Mà bạn muốn.
Khi nào hữu ích?
| Nhu cầu | Giải pháp |
|---|---|
| Tiêu đề ngắn | ”Tối đa 10 từ” |
| Định nghĩa ngắn gọn | ”Không quá 50 tokens” |
| Câu trả lời mở rộng | ”Khoảng 300 từ” |
Ví dụ
Không giới hạn:
"Giải thích AI là gì?"
Kết quả: Dài dòng, có thể 500 từ
Có giới hạn:
"Giải thích AI là gì.
Không quá 50 tokens."
Kết quả: Ngắn gọn, súc tích
Hoàn hảo cho:
- ✅ Caption
- ✅ Tóm tắt
- ✅ Hook mạng xã hội
💡 Không phải lúc nào cũng cần bài báo — đây là cách điều chỉnh
4. Stop Sequences: Dừng đúng chỗ
Vấn đề
AI có xu hướng viết danh sách dài (15-20 mục) khi bạn chỉ cần 5-10.
Giải pháp
"Chỉ cho tôi 10 điểm bullet."
AI tuân thủ nghiêm ngặt.
5. Phạt lặp lại: Tránh nhàm chán
Vấn đề: AI lặp lại
Prompt:
"Viết về cà phê"
Kết quả mặc định:
Cà phê tạo năng lượng.
Hương thơm, nghi lễ buổi sáng.
Cà phê, cà phê, cà phê... (lặp vô tận)
Giải pháp: Thêm Frequency Penalty
Prompt cải thiện:
"Viết về cà phê.
Tránh lặp lại. Dùng từ đồng nghĩa."
Kết quả:
- ✅ Cappuccino
- ✅ Espresso
- ✅ Hạt rang
- ✅ Crema
🎨 Một tham số nhỏ → Phong cách thay đổi hoàn toàn
Tổng kết
Ngay cả trong ChatGPT:
Bạn có thể kiểm soát AI gần như API
Thay vì:
temperature=0.9,
top_p=0.5,
max_tokens=50
Bạn viết:
"Temperature 0.9" hoặc "Hãy sáng tạo"
"Top-P 0.5" hoặc "Giữ tập trung"
"Tối đa 50 tokens" hoặc "Hãy ngắn gọn"
"Dừng ở 10" hoặc "Chỉ 10 mục"
"Tránh lặp lại" hoặc "Dùng từ đồng nghĩa"
Templates thực tế
1. Output chính xác
"Giải thích điện toán lượng tử.
Temperature: 0.2
Top-P: 0.5
Tối đa 100 tokens.
Tuân thủ sự thật. Tông điệu trang trọng."
2. Output sáng tạo
"Tưởng tượng tương lai năm 2050.
Temperature: 0.9
Top-P: 1.0
Hãy táo bạo. Dùng ẩn dụ."
3. Post mạng xã hội
"Viết về thời trang bền vững.
Tối đa 50 tokens.
Hấp dẫn nhưng ngắn gọn.
Tránh lặp 'bền vững' và 'thời trang'."
4. Danh sách có cấu trúc
"Liệt kê lợi ích của thiền định.
Chính xác 5 điểm bullet.
Dừng sau điểm 5.
Mỗi điểm: tối đa 20 từ."
5. Từ vựng phong phú
"Mô tả quán cà phê.
Frequency penalty: cao.
Dùng từ đồng nghĩa. Tránh lặp.
Mô tả giác quan."
So sánh: Code vs Văn bản
| Tham số | Code (API) | Văn bản (ChatGPT) |
|---|---|---|
| Temperature | temperature=0.9 | ”Temperature 0.9” hoặc “Hãy sáng tạo” |
| Top-P | top_p=0.5 | ”Top-P 0.5” hoặc “Giữ tập trung” |
| Độ dài | max_tokens=50 | ”Tối đa 50 tokens” |
| Dừng | stop=["10"] | ”Chỉ 10 mục” |
| Phạt lặp | frequency_penalty=1.0 | ”Tránh lặp. Dùng từ đồng nghĩa” |
Lưu ý quan trọng
❌ Đừng:
-
Trộn lẫn hướng dẫn mâu thuẫn
"Sáng tạo nhưng chỉ nói sự thật" → Tín hiệu loạn -
Quá chi tiết
"Temp 0.9, top-p 1.0, sáng tạo, táo bạo, dùng ẩn dụ..." → AI bối rối -
Quên giới hạn độ dài
Không giới hạn → Nhận 1000 từ khi chỉ cần 50
✅ Nên:
-
Rõ ràng và nhất quán
"Temperature 0.2. Tông trang trọng. Chỉ sự thật." -
Kết hợp logic
"Sáng tạo (temp 0.9) + tư duy rộng (top-p 1.0)" -
Luôn chỉ định độ dài
Mọi prompt production nên có giới hạn độ dài
Key Takeaways
-
ChatGPT ≈ API về kiểm soát Qua văn bản thuần túy
-
Tham số có 2 cách Số hoặc lời — cùng hiệu quả
-
1 tham số = đổi phong cách hoàn toàn Temp 0.2 vs 0.9 = Hai thế giới khác nhau
-
Giới hạn độ dài = Kiểm soát chi phí Quan trọng khi scale
-
Phạt lặp lại = Từ vựng phong phú Văn bản tự nhiên, hấp dẫn hơn
-
Đây không phải tricks Đây là cách thiết kế hành vi AI
Bài tập
Thử các biến thể này:
Prompt cơ bản:
"Giải thích lợi ích của làm việc từ xa"
Biến thể 1: Học thuật
"Giải thích lợi ích của làm việc từ xa.
Temperature: 0.2
Top-P: 0.5
Tối đa 100 tokens.
Tông học thuật trang trọng."
Biến thể 2: Sáng tạo
"Giải thích lợi ích của làm việc từ xa.
Temperature: 0.9
Top-P: 1.0
Sáng tạo, dùng ẩn dụ.
Làm cho hấp dẫn."
Biến thể 3: Ngắn gọn
"Giải thích lợi ích của làm việc từ xa.
Tối đa 50 tokens.
Tránh lặp 'từ xa' và 'làm việc'.
Dùng từ đồng nghĩa."
So sánh và ghi lại! 📝
Bạn sẽ thấy sự khác biệt rõ rệt — đó chính là sức mạnh của kiểm soát văn bản.