Generar video a partir de texto (texto-a-video) es uno de los logros más impresionantes de la IA moderna. Describes con palabras lo que quieres ver: personajes, entorno, movimiento, estilo de filmación y ambiente — y en 1–3 minutos obtienes un clip de video de 3–5 segundos que nunca existió en la realidad.
La calidad del resultado depende en gran medida del detalle de la indicación. Una fórmula efectiva incluye: sujeto de la acción, qué exactamente está sucediendo, entorno y atmósfera, estilo (cinematografía, animación, documental), movimiento de cámara (paneo a la izquierda, zoom, toma estática). Por ejemplo: "Un gato pelirrojo camina por una calle mojada de noche en Tokio, letreros de neón reflejándose en los charcos, la cámara se mueve lentamente hacia atrás, estilo cinematográfico, 24fps".
Wan 2.1 cuesta 3 créditos y es excelente para probar ideas rápidamente. Kling v2.1 por 20 créditos proporciona calidad cinematográfica con física de movimiento realista — óptimo para contenido final.