Điều Khiển Prompt Không Cần Code

TL;DR

Không cần API, bạn vẫn kiểm soát AI bằng văn bản thuần túy. Thay vì temperature=0.9, viết “Temperature: 0.9” hoặc “Hãy sáng tạo và táo bạo” - AI hiểu cả hai. Các tham số có thể mô phỏng: Temperature (thấp = trang trọng/sự thật, cao = cảm xúc/sáng tạo), Top-P (thấp = tập trung hẹp, cao = khám phá rộng), độ dài (“Tối đa 50 tokens”), stop sequences (“Chỉ 10 mục”), penalties (“Tránh lặp, dùng từ đồng nghĩa”). Bạn đang thiết kế hành vi AI, không chỉ hỏi đáp.

Bạn không có quyền truy cập API, vậy làm sao?

Thực tế:

Khi dùng ChatGPT hoặc Claude trên web, bạn KHÔNG thể điều chỉnh Temperature, Top-P hay các tham số kỹ thuật trực tiếp.

Nhưng:

Bạn vẫn có thể ảnh hưởng đến hành vi AI bằng cách viết prompt thông minh.

Kết quả:

✅ Bạn có thể kiểm soát:

Độ sáng tạo (Temperature)

Độ tập trung (Top-P)

Độ dài câu trả lời

Tránh lặp lại

Dừng đúng chỗ

Tất cả chỉ bằng văn bản thuần túy.

Nguyên tắc: Tham số văn bản

Thay vì:

temperature = 0.9

Bạn viết:

"Temperature: 0.9"

Hoặc đơn giản hơn:

"Hãy sáng tạo và táo bạo."

💡 AI hiểu CẢ HAI cách. Số hoặc lời — cùng hiệu quả.

1. Kiểm soát Temperature bằng văn bản

Thí nghiệm

Prompt gốc:

"Mô tả tương lai của AI trong giáo dục"

Kết quả mặc định:

Tông điệu học thuật, khô khan
Ngôn từ chuẩn mực, không cảm xúc
Câu văn có cấu trúc rõ ràng

🔴 Temperature Cao (0.9): Chế độ “Phê”

Cách 1: Dùng số

"Mô tả tương lai của AI trong giáo dục.
Temperature: 0.9"

Cách 2: Dùng lời

"Mô tả tương lai của AI trong giáo dục.
Hãy táo bạo. Dùng ẩn dụ. Hãy sáng tạo."

Kết quả:

✅ Ngôn từ cảm xúc hơn, có thể có emoji
✅ Văn phong lỏng lẻo, biểu cảm
✅ Có ẩn dụ, so sánh bất ngờ

Hiệu ứng:

Giải thích khô khan → Tường thuật sống động
Chỉ nhờ MỘT tham số

🔵 Temperature Thấp (0.2): Chế độ “Tỉnh”

Cách 1: Dùng số

"Mô tả tương lai của AI trong giáo dục.
Temperature: 0.2"

Cách 2: Dùng lời

"Mô tả tương lai của AI trong giáo dục.
Tuân thủ sự thật. Tránh phỏng đoán. Viết trang trọng."

Kết quả:

✅ Bám sát sự thật
✅ Tránh phỏng đoán mạo hiểm
✅ Tông điệu trang trọng, học thuật
✅ Tập trung, không lan man

So sánh Temperature

Khía cạnh	Thấp (0.2)	Cao (0.9)
Tông điệu	Học thuật, trang trọng	Cảm xúc, biểu cảm
Rủi ro	Tránh phỏng đoán	Cho phép giả định
Phong cách	Khô, có cấu trúc	Sống động, lỏng lẻo
Ẩn dụ	Tối thiểu	Thường xuyên

2. Kiểm soát Top-P bằng văn bản

Top-P là gì?

Top-P = Thanh trượt “tập trung” của AI.

Thấp: AI chỉ chọn từ “an toàn” nhất
Cao: AI được phép “mạo hiểm” hơn

Khác gì với Temperature?

Temperature	Top-P
Độ “liều” chung	Độ “rộng” của suy nghĩ
Nút điều chỉnh sáng tạo	Thanh trượt tập trung

🔵 Top-P Thấp (0.5): Đèn pha hẹp

Cách đặt:

"Mô tả tương lai của AI trong giáo dục.
Top-P: 0.5"

Hoặc:

"Ở trong những ý tưởng có khả năng nhất.
Không tưởng tượng không cần thiết."

Hiệu ứng:

✅ Câu trả lời có cấu trúc
✅ Ngắn gọn, bảo thủ
✅ Trong phạm vi hẹp

🔴 Top-P Cao (1.0): Đèn pha rộng

Cách đặt:

"Mô tả tương lai của AI trong giáo dục.
Top-P: 1.0"

Hiệu ứng:

✅ Các kịch bản tương lai
✅ Ẩn dụ bất ngờ
✅ So sánh sáng tạo
✅ Khám phá khả năng rộng hơn

Hình dung

Top-P Thấp (0.5) = Đèn pha chùm hẹp
├── Câu trả lời an toàn nhất
├── Ý tưởng phổ biến nhất
└── Diễn giải bảo thủ

Top-P Cao (1.0) = Đèn pha chùm rộng
├── Kịch bản tương lai
├── Ẩn dụ bất ngờ
└── Khả năng sáng tạo

Insight quan trọng

Chúng ta vừa thay đổi phạm vi xác suất của AI
KHÔNG chạm vào bất kỳ cài đặt backend nào
Chỉ bằng văn bản thuần túy

Đó chính là sức mạnh của Prompt Engineering:

🎯 Bạn kiểm soát tông điệu và sáng tạo
Không chỉ qua CÁI GÌ bạn hỏi
Mà cả CÁCH bạn hỏi

3. Kiểm soát Độ dài

Đơn giản nhưng hiệu quả

Cách làm:

Nói rõ với AI:

Số từ
Số ký tự
Số tokens

Mà bạn muốn.

Khi nào hữu ích?

Nhu cầu	Giải pháp
Tiêu đề ngắn	”Tối đa 10 từ”
Định nghĩa ngắn gọn	”Không quá 50 tokens”
Câu trả lời mở rộng	”Khoảng 300 từ”

Ví dụ

Không giới hạn:

"Giải thích AI là gì?"

Kết quả: Dài dòng, có thể 500 từ

Có giới hạn:

"Giải thích AI là gì.
Không quá 50 tokens."

Kết quả: Ngắn gọn, súc tích

Hoàn hảo cho:

✅ Caption
✅ Tóm tắt
✅ Hook mạng xã hội

💡 Không phải lúc nào cũng cần bài báo — đây là cách điều chỉnh

4. Stop Sequences: Dừng đúng chỗ

Vấn đề

AI có xu hướng viết danh sách dài (15-20 mục) khi bạn chỉ cần 5-10.

Giải pháp

"Chỉ cho tôi 10 điểm bullet."

AI tuân thủ nghiêm ngặt.

5. Phạt lặp lại: Tránh nhàm chán

Vấn đề: AI lặp lại

Prompt:

"Viết về cà phê"

Kết quả mặc định:

Cà phê tạo năng lượng.
Hương thơm, nghi lễ buổi sáng.
Cà phê, cà phê, cà phê... (lặp vô tận)

Giải pháp: Thêm Frequency Penalty

Prompt cải thiện:

"Viết về cà phê.
Tránh lặp lại. Dùng từ đồng nghĩa."

Kết quả:

✅ Cappuccino
✅ Espresso
✅ Hạt rang
✅ Crema

🎨 Một tham số nhỏ → Phong cách thay đổi hoàn toàn

Tổng kết

Ngay cả trong ChatGPT:

Bạn có thể kiểm soát AI gần như API

Thay vì:

temperature=0.9,
top_p=0.5,
max_tokens=50

Bạn viết:

"Temperature 0.9" hoặc "Hãy sáng tạo"
"Top-P 0.5" hoặc "Giữ tập trung"
"Tối đa 50 tokens" hoặc "Hãy ngắn gọn"
"Dừng ở 10" hoặc "Chỉ 10 mục"
"Tránh lặp lại" hoặc "Dùng từ đồng nghĩa"

Templates thực tế

1. Output chính xác

"Giải thích điện toán lượng tử.
Temperature: 0.2
Top-P: 0.5
Tối đa 100 tokens.
Tuân thủ sự thật. Tông điệu trang trọng."

2. Output sáng tạo

"Tưởng tượng tương lai năm 2050.
Temperature: 0.9
Top-P: 1.0
Hãy táo bạo. Dùng ẩn dụ."

3. Post mạng xã hội

"Viết về thời trang bền vững.
Tối đa 50 tokens.
Hấp dẫn nhưng ngắn gọn.
Tránh lặp 'bền vững' và 'thời trang'."

4. Danh sách có cấu trúc

"Liệt kê lợi ích của thiền định.
Chính xác 5 điểm bullet.
Dừng sau điểm 5.
Mỗi điểm: tối đa 20 từ."

5. Từ vựng phong phú

"Mô tả quán cà phê.
Frequency penalty: cao.
Dùng từ đồng nghĩa. Tránh lặp.
Mô tả giác quan."

So sánh: Code vs Văn bản

Tham số	Code (API)	Văn bản (ChatGPT)
Temperature	`temperature=0.9`	”Temperature 0.9” hoặc “Hãy sáng tạo”
Top-P	`top_p=0.5`	”Top-P 0.5” hoặc “Giữ tập trung”
Độ dài	`max_tokens=50`	”Tối đa 50 tokens”
Dừng	`stop=["10"]`	”Chỉ 10 mục”
Phạt lặp	`frequency_penalty=1.0`	”Tránh lặp. Dùng từ đồng nghĩa”

Lưu ý quan trọng

❌ Đừng:

Trộn lẫn hướng dẫn mâu thuẫn

"Sáng tạo nhưng chỉ nói sự thật"
→ Tín hiệu loạn

Quá chi tiết

"Temp 0.9, top-p 1.0, sáng tạo, táo bạo, 
dùng ẩn dụ..."
→ AI bối rối

Quên giới hạn độ dài

Không giới hạn → Nhận 1000 từ khi chỉ cần 50

✅ Nên:

Rõ ràng và nhất quán

"Temperature 0.2. Tông trang trọng. Chỉ sự thật."

Kết hợp logic

"Sáng tạo (temp 0.9) + tư duy rộng (top-p 1.0)"

Luôn chỉ định độ dài

Mọi prompt production nên có giới hạn độ dài

Key Takeaways

ChatGPT ≈ API về kiểm soát Qua văn bản thuần túy
Tham số có 2 cách Số hoặc lời — cùng hiệu quả
1 tham số = đổi phong cách hoàn toàn Temp 0.2 vs 0.9 = Hai thế giới khác nhau
Giới hạn độ dài = Kiểm soát chi phí Quan trọng khi scale
Phạt lặp lại = Từ vựng phong phú Văn bản tự nhiên, hấp dẫn hơn
Đây không phải tricks Đây là cách thiết kế hành vi AI

Bài tập

Thử các biến thể này:

Prompt cơ bản:

"Giải thích lợi ích của làm việc từ xa"

Biến thể 1: Học thuật

"Giải thích lợi ích của làm việc từ xa.
Temperature: 0.2
Top-P: 0.5
Tối đa 100 tokens.
Tông học thuật trang trọng."

Biến thể 2: Sáng tạo

"Giải thích lợi ích của làm việc từ xa.
Temperature: 0.9
Top-P: 1.0
Sáng tạo, dùng ẩn dụ.
Làm cho hấp dẫn."

Biến thể 3: Ngắn gọn

"Giải thích lợi ích của làm việc từ xa.
Tối đa 50 tokens.
Tránh lặp 'từ xa' và 'làm việc'.
Dùng từ đồng nghĩa."

So sánh và ghi lại! 📝

Bạn sẽ thấy sự khác biệt rõ rệt — đó chính là sức mạnh của kiểm soát văn bản.

ANKI CHALLENGE 10

TL;DR

Bạn không có quyền truy cập API, vậy làm sao?

Thực tế:

Nhưng:

Kết quả:

Nguyên tắc: Tham số văn bản

Thay vì:

Bạn viết:

1. Kiểm soát Temperature bằng văn bản

Thí nghiệm

Prompt gốc:

Kết quả mặc định:

🔴 Temperature Cao (0.9): Chế độ “Phê”

Cách 1: Dùng số

Cách 2: Dùng lời

Kết quả:

🔵 Temperature Thấp (0.2): Chế độ “Tỉnh”

Cách 1: Dùng số

Cách 2: Dùng lời

Kết quả:

So sánh Temperature

2. Kiểm soát Top-P bằng văn bản

Top-P là gì?

Khác gì với Temperature?

🔵 Top-P Thấp (0.5): Đèn pha hẹp

Cách đặt:

Hiệu ứng:

🔴 Top-P Cao (1.0): Đèn pha rộng

Cách đặt:

Hiệu ứng:

Hình dung

Insight quan trọng

3. Kiểm soát Độ dài

Đơn giản nhưng hiệu quả

Cách làm:

Khi nào hữu ích?

Ví dụ

Không giới hạn:

Có giới hạn:

Hoàn hảo cho:

4. Stop Sequences: Dừng đúng chỗ

Vấn đề

Giải pháp

5. Phạt lặp lại: Tránh nhàm chán

Vấn đề: AI lặp lại

Prompt:

Kết quả mặc định:

Giải pháp: Thêm Frequency Penalty

Prompt cải thiện:

Kết quả:

Tổng kết

Ngay cả trong ChatGPT:

Thay vì:

Bạn viết:

Templates thực tế

1. Output chính xác

2. Output sáng tạo

3. Post mạng xã hội

4. Danh sách có cấu trúc

5. Từ vựng phong phú

So sánh: Code vs Văn bản

Lưu ý quan trọng

❌ Đừng:

✅ Nên:

Key Takeaways

Bài tập

Thử các biến thể này:

Prompt cơ bản:

Biến thể 1: Học thuật

Biến thể 2: Sáng tạo

Biến thể 3: Ngắn gọn

So sánh và ghi lại! 📝

Câu hỏi ôn tập