Sprach-KI

Internet-Trend lässt die mächtigsten Männer gegeneinander Uno spielen

24.02.2023, 08:26 Uhr
· Online seit 22.02.2023, 18:53 Uhr
Trump, Biden, Obama und Bush kennt man von Pressekonferenzen, pathetischen Reden und Wahlkampfveranstaltungen. Jetzt machen im Netz zahlreiche Videos die Runde, welche die US-Präsidenten beim Gamen zeigen. Was steckt dahinter?

Quelle: CH Media Video Unit / Melissa Schumacher

Anzeige

Auf den ersten Blick wirken die Videos, die auf Plattformen wie Youtube, Reddit oder Tiktok hochgeladen wurden, authentisch. Die Stimmen klingen vertraut: der etwas zittrige Tonfall Joe Bidens, der südliche Akzent von George W. Bush, der stets coole Barack Obama oder der gehässige Donald Trump.

Doch schnell machen sich Zweifel breit. Die Männer blaffen wie unflätige Teenager. Sie fluchen, beschimpfen sich wüst und plappern in einer für viele kaum verständlichen Gamersprache. Spätestens, wenn auch der 1963 ermordete John F. Kennedy in der ruppigen Runde erscheint, wird klar: Hier stimmt so einiges nicht.

Künstliche Intelligenz imitiert Präsidenten

Es sind natürlich nicht die echten US-Präsidenten, die in den Videos zu hören sind. Die Clips sind eine Kombination von Szenen aus verschiedenen Videogames und Programmen, die mittels künstlicher Intelligenz (KI) die Stimmen der Politiker täuschend echt nachahmen können. In einem anderen Fall wurde eine Partie Uno simuliert.

Früher hätte man für solche Fakes Menschen mit einem Talent für die Stimmenimitation engagieren müssen. Heute übernehmen dies Computerprogramme. Füttert man sie mit Vorlagen von Stimmen und einem Text, spucken sie eine Audiodatei aus, die klingt, als ob sie der Betreffende tatsächlich aufgenommen hätte.

Missbrauch einer neuen Technologie

Bei Videos hat sich für dieses Verfahren der Imitation der Begriff «Deepfake» eingebürgert. Aber auch mit Stimmen funktioniert die Technologie, wie die gamenden Präsidenten zeigen. Erst Ende Januar hatte das US-Start-up ElevenLabs ein neues Programm für eine Text-zu-Sprache-KI vorgestellt. Wenig später tauchten schon die ersten Fälle auf, in denen damit die Stimmen von Prominenten nachgemacht wurden.

Das Programm wurde eigentlich dafür entwickelt, um Texte wie E-Books auf eine natürlich wirkende Weise vorlesen zu können. Die im Internet aufgetauchten Soundfiles liessen allerdings Promis wie Emma Watson oder Joe Rogan rassistische, transphobe und aggressive Dinge sagen, wie das Magazin «Motherboard» berichtete. ElevenLabs kündigte Massnahmen an, um diesem Missbrauch der Technologie einen Riegel zu schieben.

veröffentlicht: 22. Februar 2023 18:53
aktualisiert: 24. Februar 2023 08:26
Quelle: Today-Zentralredaktion

Anzeige
Anzeige
32today@chmedia.ch