Tại sự kiện Gemini Day diễn ra ở Ấn Độ, Google đã chính thức trình diễn khả năng của Veo 2 trên sân khấu. Công ty đã chứng minh mức độ chân thực đáng kinh ngạc của các video do AI tạo ra – thực tế, rất khó để tin rằng một số video được tạo ra hoàn toàn bởi trí tuệ nhân tạo. Bên cạnh màn trình diễn ấn tượng, Google cũng chia sẻ một slide chi tiết các yếu tố quan trọng mà người dùng nên đưa vào prompt để đạt được kết quả tối ưu.
Veo 2 hoạt động dựa trên mô tả bằng văn bản của người dùng. Bạn chỉ cần nhập một đoạn prompt, và Gemini sẽ tự động tạo ra một đoạn video ngắn dựa trên đó. Hiện tại, các video được tạo có độ dài tối đa tám giây và độ phân giải 720p. Google gần đây đã mở rộng phạm vi tiếp cận của Veo 2 đến nhiều người dùng đăng ký Gemini Advanced hơn, và giờ đây, công ty đã chia sẻ những mẹo hữu ích để người dùng có thể đạt được kết quả tốt nhất khi tạo video.
Veo 2 hiện vẫn là tính năng độc quyền dành cho người dùng trả phí của Gemini. Với việc tạo video bằng AI đòi hỏi lượng tài nguyên đáng kể, có vẻ như Google khó có khả năng cung cấp tính năng này cho người dùng miễn phí trong tương lai gần.
Các bước tạo video với veo 2 của google Gemini
Theo hướng dẫn từ Google, khi tạo video bằng Veo 2, bạn nên chỉ định rõ các yếu tố sau trong lời nhắc văn bản:
Đối tượng (Subject) | Chủ thể chính của video là gì? |
Hành động (Action) | Đối tượng đang thực hiện hành động gì? |
Bố cục khung hình (Composition) | Khung cảnh được sắp đặt như thế nào? (cảnh quay rộng, góc máy thấp, góc máy từ trên cao, v.v.) |
Chuyển động máy quay (Camera motion) | Máy quay có di chuyển theo chiều ngang (pan) hay phóng to/thu nhỏ (zoom) không? |
Không khí/ màu sắc (Ambiance) | Màu sắc và ánh sáng đóng vai trò như thế nào trong việc tạo nên cảm xúc cho cảnh quay? (tông màu xanh, cảnh đêm, sương mù, v.v.) |
Phong cách (Style) | Bạn muốn video mang phong cách nghệ thuật hoặc cảm xúc như thế nào? (điện ảnh, cổ điển, hoạt hình, v.v.) |
Việc cung cấp đầy đủ các chi tiết này trong prompt sẽ giúp video được tạo ra sát với hình dung ban đầu của bạn hơn ngay từ lần thử đầu tiên. Tất nhiên, nếu kết quả vẫn chưa hoàn toàn như ý muốn, bạn luôn có thể điều chỉnh prompt và tạo lại video.
Một mẹo nhỏ là bạn có thể nhờ chính Genmini tạo ra một prompt cho bạn và bạn sẽ tiến hành sửa chữa dựa trên prompt mẫu đó.
Ví dụ:
Một chú mèo Ba Tư trắng muốt với đôi mắt xanh biếc đang nằm thư giãn trên một chiếc võng đan bằng mây, ánh nắng hoàng hôn màu cam và hồng dịu dàng xuyên qua tán lá cây nhiệt đới, tạo ra những vệt sáng lung linh trên bộ lông mềm mại của nó. Gió nhẹ lay động những chiếc lá, tạo ra âm thanh xào xạc nhẹ nhàng. Góc quay cận cảnh, tập trung vào vẻ thanh bình và đôi mắt mơ màng của chú mèo.
Phân tích prompt này:
- Đối tượng chính: "Một chú mèo Ba Tư trắng muốt với đôi mắt xanh biếc" - Mô tả chi tiết đối tượng trung tâm của video.
- Hành động/Trạng thái: "đang nằm thư giãn trên một chiếc võng đan bằng mây" - Xác định hành động và bối cảnh cụ thể.
- Bối cảnh môi trường: "ánh nắng hoàng hôn màu cam và hồng dịu dàng xuyên qua tán lá cây nhiệt đới, tạo ra những vệt sáng lung linh trên bộ lông mềm mại của nó" - Tạo ra một khung cảnh thơ mộng và giàu hình ảnh.
- Âm thanh: "Gió nhẹ lay động những chiếc lá, tạo ra âm thanh xào xạc nhẹ nhàng" - Thêm yếu tố âm thanh để video thêm sống động (Veo 2 có thể diễn giải các gợi ý về âm thanh).
- Góc quay: "Góc quay cận cảnh, tập trung vào vẻ thanh bình và đôi mắt mơ màng của chú mèo" - Chỉ định loại khung hình và mục tiêu của cảnh quay.