从文本生成视频(文本到视频)是现代 AI 最令人印象深刻的成就之一。您用文字描述您想看到的内容:角色、环境、动作、拍摄风格和情绪 — 在 1–3 分钟内,您将获得一个从未在现实中存在的 3–5 秒视频片段。
结果的质量在很大程度上取决于提示的细节。一个有效的公式包括:动作的主体、具体发生的事情、环境和氛围、风格(电影、动画、纪录片)、相机运动(左移、放大、静态镜头)。例如:“一只姜黄色的猫走在东京的湿漉漉的夜街上,霓虹灯反射在水坑中,摄像机慢慢后移,电影风格,24fps”。
Wan 2.1 需要 3 个积分,非常适合快速测试想法。Kling v2.1 需要 20 个积分,提供具有真实运动物理效果的电影质量 — 是最终内容的最佳选择。