[THỰC HÀNH] Prompt Làm Video & Audio Script

📌 TLDR

Tui chỉ bạn cách viết prompt để ra kịch bản video (timeline + cảnh) và kịch bản audio (giọng, nhịp, cảm xúc). Đúng format là AI làm nhanh như “đạo diễn phụ”.

Vấn Đề Thực Tế

Bạn có ý tưởng, nhưng kịch bản bị nhạt, không biết chia cảnh, giọng đọc thì đều đều.
Giống như có món ngon mà không biết bày ra dĩa.

Giải Pháp: Goal → Structure → Voice

Goal: Video/Audio để làm gì? (bán hàng, giáo dục, branding)
Structure: Hook → Nội dung chính → Kết
Voice: tone, nhịp, cảm xúc

Workflow Video (5 Bước)

Xác định mục tiêu + đối tượng
Yêu cầu timeline 60s (theo mốc 0-10s, 10-30s, 30-60s)
Gợi ý hình ảnh cho từng đoạn
Viết script cho narrator
Chuyển thành prompt dùng cho tool video

Workflow Audio (4 Bước)

Xác định loại audio (voiceover, podcast, ads)
Đặt giọng: tuổi, tốc độ, cảm xúc
Viết script ngắn, có nhịp nghỉ
Tạo 2-3 phiên bản để chọn

Ví Dụ Thực Tế (VN Context)

Case: Video 60s về xu hướng cà phê to-go 2026
Tool: Runway/Pika/Veed

Prompt tạo video timeline

Bạn là Video Content Strategist.
Tạo kịch bản video 60s về "Cà phê to-go 2026".
Format:
- 0-10s: Hook
- 10-30s: 2 ý chính
- 30-50s: cơ hội kinh doanh
- 50-60s: kết + CTA

Mỗi đoạn có: lời thoại + gợi ý hình ảnh.

Templates Sẵn Dùng

Template 1: Video script + visuals

Tạo kịch bản video [X] giây.
Đối tượng: [persona]
Mục tiêu: [goal]

Output dạng bảng:
| Time | Voiceover | Visual Suggestion |

Template 2: Audio script có nhịp

Bạn là Sound Director.
Viết script 30-45s cho [podcast/ads/intro].
Giọng: [tuổi], [tone], [tempo].
Chèn [pause] tại các điểm cần nhấn.

Troubleshooting

Issue 1: Script dài dòng
Fix: Giới hạn số từ + yêu cầu câu ngắn

Tối đa 130 từ. Mỗi câu dưới 18 từ.

Issue 2: Visual bị chung chung
Fix: Yêu cầu cụ thể hóa bằng bối cảnh VN

Hình ảnh ưu tiên bối cảnh HN/HCM, quán cà phê nhỏ, kiosk.

Action Plan (Checklist)

Chọn 1 nội dung bạn đang cần làm video/audio
Viết prompt theo Template 1
Viết prompt theo Template 2
Tạo 2 phiên bản và chọn bản tốt nhất
Lưu prompt vào thư viện riêng

Kết Luận

Key idea: Kịch bản tốt = biết chia cảnh + biết điều khiển giọng.
Prompt đúng cấu trúc sẽ biến AI thành “đạo diễn phụ” của bạn.

ANKI CHALLENGE 10