Deep Fake KI von Samsung Wie ein Computer die Mona Lisa zum Leben erweckt

Mithilfe einer Künstlichen Intelligenz haben Forscher die Mona Lisa zum Reden gebracht. Foto: Youtube/Egor ZakharovMithilfe einer Künstlichen Intelligenz haben Forscher die Mona Lisa zum Reden gebracht. Foto: Youtube/Egor Zakharov
Youtube/Egor Zakharov

Hamburg. Wie sähe die Mona Lisa eigentlich aus, wenn sie sich bewegen und sprechen könnte? Forscher haben mithilfe einer KI statischen Bildern Leben eingehaucht. Erstmals können Sie die Mona Lisa in Bewegung betrachten.

Ein Foto, mehr benötigt die Künstlichen Intelligenz (KI) nicht, um ein Video zu erzeugen. Das funktioniert bei Gemälden genauso wie bei Fotos von Privatpersonen. Damit könnte das Erstellen von Deepfakes, also gefälschter Videos, in Zukunft deutlich leichter werden. Damit ein solches Video realistisch wirkt, musste ein KI-System bisher mit ausreichend Foto- oder Videomaterial der Person gefüttert werden, die verändert werden soll. (Weiterlesen: Programm erzeugt täuschend echte Porträts: Erkennen Sie den Unterschied?)

Nur noch ein Foto benötigt

Forscher des Skolkovo Institute of Science and Technology haben zusammen mit dem Samsunf AI Center in Moskau eine KI entwickelt, die anhand eines einzelnen Fotos einer Person ein Video generieren kann. Die Wissenschaftler erweckten eigentlich zweidimensionale Bild wird mit der Software sogar in verschiedenen Perspektiven zum Leben. Zusätzliche Informationen erstellt das System aus eigenen Lerndaten heraus. Veröffentlicht und dokumentiert wird das Projekt auf arxiv.org (PDF) von Samsung AI Center.

Um die KI sogenannte "Talking-Head-Models" erstellen zu lassen, in denen das Gesicht einer Person spricht, gingen die Forscher folgendermaßen vor: Der Computer erstellt zunächst ein Modell des zu animierenden Gesichts, das in einem Video über ein anderes Gesicht gelegt werden soll. Dazu reicht ein Bild, etwa das von Da Vincis Mona Lisa. Zwar verbessern mehr Basis-Bilder das Ergebnis, die Demonstration der "lebendigen" Mona Lisa überzeugt dennoch. Mund-, Kopf- und Augenbewegungen variieren dabei je nach Mimik und Bewegungsmuster, die auf Basis von drei verschiedenen Schauspielern als Modell vorgegeben werden. Mit nur 32 Bildern können laut den Forschern jedoch bereits Videos mit realistischen Ergebnissen entstehen.

Weiterlesen: So wird Kindergekritzel zu fotorealistischen Kunstwerken


Weitere Angebote, Produkte und Unternehmen der noz MEDIEN