Veo 3.1 Fast는 DeepMind의 Google 대표 비디오 모델로, 모든 경쟁자들 중에서 독특한 기능을 가지고 있습니다: 바로 네이티브 사운드로 비디오를 생성하는 것입니다. 다른 모든 AI 비디오 모델은 시각적 요소만 생성하며, 사운드는 비디오 편집기에서 별도로 추가해야 합니다. Veo 3.1은 프롬프트에서 사운드 설명을 이해하고 이미지와 동시에 오디오를 생성합니다.
이는 해변 장면에서는 파도와 갈매기 소리가 들리고, 도시의 비에서는 자갈 위로 떨어지는 빗방울 소리가 들리며, 화면 속 내레이터는 지정된 연설을 동기화하여 '말하는' 것을 의미합니다. 네이티브 오디오의 품질은 이미 소셜 미디어 콘텐츠와 홍보 자료에 충분합니다.
사운드 외에도 Veo 3.1 Fast는 현실적인 모션 물리학과 복잡한 장면의 고품질 처리를 특징으로 합니다. 비디오당 40 크레딧의 비용은 모델의 독창성을 반영합니다 — 후처리 없이 사운드가 중요한 콘텐츠에는 이 도구가 선택됩니다.