[THỰC HÀNH] Prompt Làm Video & Audio Script
📌 TLDR
Tui chỉ bạn cách viết prompt để ra kịch bản video (timeline + cảnh) và kịch bản audio (giọng, nhịp, cảm xúc). Đúng format là AI làm nhanh như “đạo diễn phụ”.
Vấn Đề Thực Tế
Bạn có ý tưởng, nhưng kịch bản bị nhạt, không biết chia cảnh, giọng đọc thì đều đều.
Giống như có món ngon mà không biết bày ra dĩa.
Giải Pháp: Goal → Structure → Voice
- Goal: Video/Audio để làm gì? (bán hàng, giáo dục, branding)
- Structure: Hook → Nội dung chính → Kết
- Voice: tone, nhịp, cảm xúc
Workflow Video (5 Bước)
- Xác định mục tiêu + đối tượng
- Yêu cầu timeline 60s (theo mốc 0-10s, 10-30s, 30-60s)
- Gợi ý hình ảnh cho từng đoạn
- Viết script cho narrator
- Chuyển thành prompt dùng cho tool video
Workflow Audio (4 Bước)
- Xác định loại audio (voiceover, podcast, ads)
- Đặt giọng: tuổi, tốc độ, cảm xúc
- Viết script ngắn, có nhịp nghỉ
- Tạo 2-3 phiên bản để chọn
Ví Dụ Thực Tế (VN Context)
Case: Video 60s về xu hướng cà phê to-go 2026
Tool: Runway/Pika/Veed
Prompt tạo video timeline
Bạn là Video Content Strategist.
Tạo kịch bản video 60s về "Cà phê to-go 2026".
Format:
- 0-10s: Hook
- 10-30s: 2 ý chính
- 30-50s: cơ hội kinh doanh
- 50-60s: kết + CTA
Mỗi đoạn có: lời thoại + gợi ý hình ảnh.
Templates Sẵn Dùng
Template 1: Video script + visuals
Tạo kịch bản video [X] giây.
Đối tượng: [persona]
Mục tiêu: [goal]
Output dạng bảng:
| Time | Voiceover | Visual Suggestion |
Template 2: Audio script có nhịp
Bạn là Sound Director.
Viết script 30-45s cho [podcast/ads/intro].
Giọng: [tuổi], [tone], [tempo].
Chèn [pause] tại các điểm cần nhấn.
Troubleshooting
Issue 1: Script dài dòng
Fix: Giới hạn số từ + yêu cầu câu ngắn
Tối đa 130 từ. Mỗi câu dưới 18 từ.
Issue 2: Visual bị chung chung
Fix: Yêu cầu cụ thể hóa bằng bối cảnh VN
Hình ảnh ưu tiên bối cảnh HN/HCM, quán cà phê nhỏ, kiosk.
Action Plan (Checklist)
- Chọn 1 nội dung bạn đang cần làm video/audio
- Viết prompt theo Template 1
- Viết prompt theo Template 2
- Tạo 2 phiên bản và chọn bản tốt nhất
- Lưu prompt vào thư viện riêng
Kết Luận
Key idea: Kịch bản tốt = biết chia cảnh + biết điều khiển giọng.
Prompt đúng cấu trúc sẽ biến AI thành “đạo diễn phụ” của bạn.