Kling es una serie de modelos de video de la empresa china Kuaishou, que regularmente se ubica en la cima de los benchmarks independientes de generación de video. La versión v2.1 ha mejorado significativamente el realismo de la física en comparación con sus predecesores: el agua fluye y salpica con remolinos creíbles, la tela responde al viento y al movimiento, el fuego se desarrolla dinámicamente. Por eso, Kling a menudo se llama el mejor modelo para animar retratos y escenas naturales.
El modelo opera en dos modos. En el modo Image-to-Video (i2v), subes una foto y recibes un clip de video con movimiento orgánico. En el modo Text-to-Video (t2v), describes la escena en texto — el modelo la genera desde cero. En ambos casos, puedes controlar el movimiento de la cámara agregando instrucciones como "paneo lento a la derecha" o "zoom cinematográfico hacia afuera" al prompt.
El costo — 30 créditos para I2V y 20 para T2V — refleja los altos costos computacionales de la generación. Si el presupuesto es limitado, Wan 2.1 proporciona un buen resultado por 4 créditos.