Veo 3.1 Fast 是 Google DeepMind 的旗舰视频模型,以其独特的功能在所有竞争对手中脱颖而出:它生成带有原生声音的视频。所有其他 AI 视频模型仅创建视觉效果——声音必须在视频编辑器中单独添加。Veo 3.1 能够直接理解提示中的声音描述,并在生成图像的同时生成音频。
这意味着海滩场景将伴有海浪和海鸥的声音,城市中的雨将有雨滴敲击鹅卵石的特有噪音,画面中的解说员将同步“说出”指定的语音。原生音频的质量已经足以用于社交媒体内容和宣传材料。
除了声音,Veo 3.1 Fast 还具有逼真的运动物理效果和高质量的复杂场景处理。每个视频 40 个积分的费用反映了该模型的独特性——对于不需要后期处理声音的重要内容,这是首选工具。