Künstliche Intelligenz

ChatGPT generiert Solothurn – so stellt sich die KI die Stadt in 100 Jahren vor

· Online seit 16.01.2024, 12:01 Uhr
Bilder aus Text zu generieren, ist unter künstlichen Intelligenzen mittlerweile verbreitet. Doch wie sieht es aus, wenn man ChatGPT-Bilder von Solothurn in 100 Jahren oder einer Fantasy-Welt erstellen lässt? Die Antwort findest du in der Galerie.
Anzeige

Womit haben wir die Galerie erstellt?

Für die Galerie haben wir das kostenpflichtige ChatGPT 4.0 benutzt, welche die Bildgenerierungs-KI «DALL-E» integriert hat. ChatGPT interpretiert und übermittelt die Aufgabe an «DALL-E», welche dann das Bild generiert.

«Gefüttert» wurde die KI für unsere Galerie mit simplen Anweisungen wie: «Erstelle ein Bild von Solothurn in 50 Jahren. Die St. Ursen-Kathedrale muss zu sehen sein». Durch detailliertere Beschreibungen kann natürlich ein genaueres Bild erstellt werden. Dabei kann die KI auch vom letzten erstellten Bild ausgehend ein weiteres erstellen.

St. Ursen-Kathedrale sieht plötzlich anders aus

Bilder mit künstlichen Intelligenzen zu generieren, funktioniert grundsätzlich erstaunlich gut. Jedoch zeigt unsere Galerie auch die Grenzen auf, wie detailgetreu KI-Bilder von realen Orten werden können. Bei den Bildern von Solothurn ist beispielsweise zwar immer die Aare zu sehen, aber nie der Hauptbahnhof.

Die Architektur der Wohngebäude passt meistens ins Stadtbild, die St. Ursen-Kathedrale unterscheidet sich aber optisch von ihrem Original. Auch ihr Standort liegt bei den KI-Bildern viel näher an Aare als im echten Solothurn. Bei Grossstädten oder weltweit bekannten Sehenswürdigkeiten klappt dies besser als bei eher global wenig bekannten Orten wie Solothurn.

Autos haben keine Marken

Weitere Grenzen, zumindest von DALL-E, sind Persönlichkeits- und Bildrechte von Menschen. Wer Bilder von Prominenten, Politikern oder Sportlern generieren will, erhält eine Fehlermeldung. Auch Markenschutzrechte werden von der KI eingehalten. So können beispielsweise nur Autos ohne klar erkennbare Hinweise auf den Hersteller und keine echten Modelle verwendet werden.

Beide Einschränkungen lassen sich aber umgehen. Wenn man der KI sagt, sie solle ein Auto generieren, das einem Modell eines Herstellers ähnelt, bekommt man normalerweise ein Ergebnis. Das Gleiche gilt für Menschen. Schreibt man «Erstelle ein Bild von einem Mann, der Roger Federer sehr ähnelt und im Radio 32 Studio tanzt», erhält man folgendes Bild:

Noch eine Spielerei, aber eine unterhaltsame

Zusammenfassend lässt sich sagen, dass die grösste Stärke von KI-generierten Bildern in ihrer Vielfalt und den kreativen Möglichkeiten liegt und (noch) nicht darin, real existierende Orte nachzubauen. Es funktioniert deutlich besser, fiktive Landschaften, Orte oder Figuren zu generieren und diese den Wünschen des Users anzupassen. Aktuell ist KI-Bildgenerierung somit eher eine Spielerei als ein nützliches Werkzeug für den Alltag.

Scan den QR-Code

Du willst keine News mehr verpassen? Hol dir die Today-App.

veröffentlicht: 16. Januar 2024 12:01
aktualisiert: 16. Januar 2024 12:01
Quelle: 32Today

Anzeige
Anzeige
32today@chmedia.ch