Manipulierte Videos, sogenannte "Deepfakes", haben in der Öffentlichkeit für Aufsehen gesorgt. So wurde das Gesicht von Michelle Obama auf den Körper einer Pornodarstellerin montiert. In einem weiteren Fake-Video bezeichnete ihr Gatte Barack US-Präsidenten Donald Trump als "Vollidioten". Eine Software imitierte dabei Lippenbewegungen und Mimik des Comedian Jordan Peele und rechnete diese in Bildvektoren um.

Computergenerierte Bilder waren bis vor ein paar Jahren nur in aufwendigen Hollywood-Produktionen möglich. Mit der Verbreitung von KI-Systemen benötigt man für die Manipulation von Ton und Bild aber keine teuren Spezialeffekte mehr, sondern bloß noch eine Software.

Mittlerweile machen sich die Technik auch Kriminelle zunutze. Kürzlich wurde bekannt, dass Betrüger den Chef eines britischen Energieunternehmens mit einer computergenerierten Stimme am Telefon austricksten und um 220.000 Euro erleichterten. Die Anrufer spiegelten mithilfe einer KI-Software die Identität des deutschen Chefs des Mutterunternehmens vor und forderten das Opfer auf, einen sechsstelligen Geldbetrag an einen ungarischen Zulieferer zu transferieren. Die Sache sei dringlich, die Summe müsse binnen einer Stunde überwiesen werden. Der gutgläubige Firmenchef schöpfte keinen Verdacht, der leichte deutsche Akzent und das Stimmmuster klangen ihm vertraut. Also wies er den Betrag an das genannte Konto an. Doch wie sich später herausstellte, landete das Geld nicht bei den ungarischen Geschäftspartnern, sondern in Mexiko. Der Firmenchef war Betrügern auf den Leim gegangen, wie das "Wall Street Journal" berichtete.

Phishing-Attacken etwa per Mail, bei der die Opfer instruiert werden, Geld an dubiose Konten zu transferieren, gibt es schon länger. Bei der jüngsten Masche handelt es sich aber um eine neue Dimension von Cyberkriminalität. Sie ist auch deshalb so bedrohlich, weil dafür kaum technisches Know-how erforderlich ist. Der Stimmgenerator soll laut Medienberichten kommerziell verfügbar gewesen sein. Das heißt, jeder kann sich im Internet eine Software herunterladen und damit Stimmen verfälschen.

Photoshop für Audio

Forscher des chinesischen Suchmaschinenunternehmens Baidu haben unlängst ein Verfahren vorgestellt, das nur wenige Sekunden Ausgangsmaterial benötigt, um eine Stimme digital zu reproduzieren. Adobe hat ein "Photoshop für Audio" demonstriert, bei dem man Dialoge so einfach wie ein Foto bearbeiten kann. Und Google hat mit seinem Programm Duplex eine KI kreiert, die sich am Telefon wie ein Mensch anhört. Der Suchmaschinenriese hat zudem eine Sprachsoftware entwickelt, die gesprochene Sprache übersetzt und dabei die Stimmcharakteristika des Sprechers beibehält.