und die reale Welt es gar nicht mitbekommt…
KI Bildgenerierung mit ChatGPT: letzte Woche hat OpenAI ein Update veröffentlich, mit dem die Welt der KI-Bilderstellung auf den Kopf gestellt wurde. Seit dem geistern zahllose Beiträge mit Beispielen durch das Internet. Doch es ist viel mehr, als nur ein neues Tool oder ein Update. Warum genau ist das aber jetzt so wichtig und hat so grosse Auswirkungen?
Zu den Anfangszeiten der KI-Bilderstellung war die Erstellung von Bildern ein echtes Insider-Thema. Für die richtig guten Ergebnisse musstest Du auf Discord gehen und dort mit MidJourney arbeiten. Und genau wissen, was Du da tust.
Ich habe das tatsächlich gelernt, verschiedene Trainings und Kurse dazu besucht und die Ergebnisse waren dann auch richtig gut. Manchmal überraschend, manchmal herausragend, doch immer mit gewissen Herausforderungen.
Zu Beginn waren es die Finger und Gesichter, Text in Bild sowieso und bei komplexen Bildaufbauten wurde es schnell schwierig bis unmöglich. Allein schon, das Ganze auf Discord zu machen, war für viele Benutzer schon ein grosse Hürde und dazu kamen die schier unendlich erscheinenden Möglichkeiten.
Die Entwicklung der KI-generierten Bilder war atemberaubend, die Fortschritte enorm.
Aber seht selbst, meine kleine Zeitreise durch 2 Jahre MidJourney Entwicklung:

Die Fortschritte waren beeindruckend und mit den neusten Versionen kann man Bilder erzeugen, die von realen Bildern kaum mehr zu unterscheiden sind.
Und mit dem Browser-Frontend wurde MidJourney für die meisten User auch zugänglich – ohne tiefgehende Kenntnisse in Discord und sehr einfach in der Bedienung. Ein echter „Milestone“.
Alles gut also?
Nein, bei Weitem nicht. Text im Bild war praktisch nicht möglich, jedenfalls mit MidJourney nicht.
Und komplexe Bildaufbauten, die nicht dem Standard entsprechen, schwierig umzusetzen. Kreative Ideen stiessen dann schon mal an Grenzen.
Ein Auto, dass in eine Wand kracht. Schwierig.
Ein alter Mann in einem Ohrensessel, der vor einem Kamin sitzt und ein Buch liesst, auf dem Kamin steht eine Uhr. Schwierig.
Uhren zeigen praktisch immer 10 nach 10 an (weil die Trainingsdaten oft von Werbeplakaten kommen und dort die Uhren immer so eingestellt sind).
Was genau ist also passiert, dass die KI-Welt auf den Kopf gestellt hat?
Verändert hat sich die Bedienung, das Eingabeformat, mit dem man Bilder anfordern kann. Seit letzter Woche kann man in ChatGPT und in SORA Bilder erstellen, basierend auf dem neuen Image-Creation Modell und mit einem Frontend, dass an Einfachheit nicht zu überbieten ist.
Mit einem einfachen Satz kann man Bilder erzeugen, die wirklich auch das darstellen, was man gesucht hat. Oder sich einen Comic erstellen lassen, zu einem Thema. Basierend auf eigenen Bildern.
Ich habe das für Euch ausprobiert und meine Reise zur KI in einem Comic in 4 Bildern erstellt:

Wer mich kennt, wird mich vermutlich wiedererkennen und die Umsetzung ist einfach genial.
Zeitaufwand: 2 Minuten. Das Ergebnis? Entscheide Du, ich finde es unglaublich.
An den „Brand“ Farben sollte ich noch arbeiten, er hat jetzt die Farben für meine IT-Firma und die AI-Consulting Agentur durcheinander gewirbelt, aber in dem Fall ist das für mich auch ok und auf die Schnelle auf dem Handy wollte ich es nicht übertreiben 🙂
Genauso einfach ist es jetzt, Texte vorzugeben, die genau so dann auch in den Bildern wiedergegeben werden. Ein mega Gewinn für alle, die im Marketing arbeiten. Oder ein bestehendes Bild einfach in einen neuen Kontext zu rücken. Wie die Weinflasche, die jetzt in einem völlig anderen Bildaufbau steht.

Und bestehende Bilder können mit einem einfachen Text-Prompt bearbeitet werden. Freistellen, verändern, anpassen und z.B. für eine Marketing-Kampagne mit Brand-Farben versehen.
Oder einfach auch nur die Veränderung / Anpassung eines Bildes in Stil oder Ausführung.

Das alles ist so einfach geworden, dass es jetzt praktisch wirklich jeder kann. Und es ermöglicht Dir, Deine Kreativität freien Lauf zu lassen. Alles, was Du Dir vorstellen kannst, kannst Du jetzt auch ganz einfach in einem Bild umsetzen.
Das ist der echte Fortschritt, die echte Veränderung. Die Bedienung ist so einfach und leicht geworden. Und die Ergebnisse folgen deinen Anforderungen.
Das Marketing, die Arbeit mit KI-generierten Bildern wird sich sehr schnell massiv verändern. Und das ist der wirkliche Fortschritt dieser neuen Version der Bildgenerierung.
Hast Du es schon ausprobiert? Versuche es einfach, geh auf ChatGPT und sage ihm, er solle ein Bild erzeugen.