Kling ist eine Serie von Videomodellen des chinesischen Unternehmens Kuaishou, das regelmäßig an der Spitze unabhängiger Video-Generierungsbenchmarks steht. Version v2.1 hat die Realismus der Physik im Vergleich zu seinen Vorgängern erheblich verbessert: Wasser fließt und spritzt mit glaubwürdigen Wirbeln, Stoff reagiert auf Wind und Bewegung, Feuer entwickelt sich dynamisch. Deshalb wird Kling oft als das beste Modell für die Animation von Porträts und Naturszenen bezeichnet.
Das Modell arbeitet in zwei Modi. Im Image-to-Video (i2v) Modus laden Sie ein Foto hoch und erhalten einen Videoclip mit organischer Bewegung. Im Text-to-Video (t2v) Modus beschreiben Sie die Szene im Text — das Modell generiert sie von Grund auf. In beiden Fällen können Sie die Kamerabewegung steuern, indem Sie Anweisungen wie "langsames Schwenken nach rechts" oder "kinematografisches Herauszoomen" zum Prompt hinzufügen.
Die Kosten — 30 Credits für I2V und 20 für T2V — spiegeln die hohen Rechenkosten der Generierung wider. Wenn das Budget begrenzt ist, bietet Wan 2.1 ein gutes Ergebnis für 4 Credits.