Ein sprechender Avatar ist eine Technologie, die ein Video mit synchronisierter Lippenbewegung zu einer Tonspur erstellt. Sie laden ein Porträtfoto und eine Audioaufnahme (Sprache, Gesang, Voiceover) hoch, und der SadTalker-Algorithmus generiert ein Video, in dem die Person auf dem Foto Ihre Audiodatei mit realistischen Lippenbewegungen, Gesichtsausdrücken und Mikro-Kopfbewegungen 'spricht'.
Das Besondere an der Technologie ist, dass sie mit jedem Porträt funktioniert — nicht nur mit echten Menschen, sondern auch mit gezeichneten Charakteren, Anime-Helden, historischen Porträts. Für das beste Ergebnis benötigen Sie ein klares Frontalgesichtsfoto mit neutralem Ausdruck und minimaler Kopfneigung. Die Qualität der Tonspur beeinflusst direkt das Ergebnis: Eine saubere Aufnahme ohne Hintergrundgeräusche sorgt für klarere Synchronisation.
Das fertige Video wird im MP4-Format gespeichert und eignet sich zum Einbetten in Präsentationen, Websites, Lehrmaterialien oder Social-Media-Posts.