Kling é uma série de modelos de vídeo da empresa chinesa Kuaishou, que regularmente ocupa o topo dos benchmarks independentes de geração de vídeo. A versão v2.1 melhorou significativamente o realismo da física em comparação com seus predecessores: a água flui e respinga com redemoinhos críveis, o tecido responde ao vento e movimento, o fogo se desenvolve dinamicamente. É por isso que Kling é frequentemente chamado de melhor modelo para animar retratos e cenas naturais.
O modelo opera em dois modos. No modo Image-to-Video (i2v), você carrega uma foto e recebe um clipe de vídeo com movimento orgânico. No modo Text-to-Video (t2v), você descreve a cena em texto — o modelo a gera do zero. Em ambos os casos, você pode controlar o movimento da câmera adicionando instruções como "panorâmica lenta para a direita" ou "zoom cinematográfico para fora" ao prompt.
O custo — 30 créditos para I2V e 20 para T2V — reflete os altos custos computacionais da geração. Se o orçamento for limitado, Wan 2.1 oferece um bom resultado por 4 créditos.