Wie die KI die Welt sieht 🔎🌎

Eine Zeit und Länderreise durch die Vorstellungen der KI von der wirklichen Welt. 🌍
In meinem neusten Beitrag habe ich einen Versuch dokumentiert, wie ich mit MidJourney arbeite, welche Herausforderungen ich dabei angetroffen habe und wie ich am Ende zu einem für mich passenden Ergebnis gekommen bin.
Es war nicht einfach, hat mehrere Ansätze benötigt und ich durfte wieder viel lernen, das ich gern mit Euch teile. Was denkt ihr, Frauen aus welchen Ländern habe ich versucht, hier zu „porträtierten“?
Ein Selbstversuch und Erfahrungsbericht im MidJourney Prompting
Vor einigen Wochen stiess ich auf einen LinkedIn Beitrag, der eine Frau aus verschiedenen Ländern jeweils in mehreren Lebensphasen auf einem Bild zeigte. Natürlich KI generiert.
Ich fand es spannend, zu sehen, wie KI die verschiedenen Lebensphasen definiert und welche Assoziationen zum Beispiel MidJourney zu den einzelnen Ländern herstellt.
Und weil ich immer daran interessiert bin, spezielle Inhalte mit MidJourney abzubilden, und weil die Schweiz nicht dabei war, habe ich ausprobiert, das nachzustellen. Kann ja nicht so schwer sein.
Dachte ich…
Selbstversuch
Erste Herausforderung, wie bringe ich MidJourney dazu, drei Bilder in einem Bild zu kombinieren und abzubilden. Die ersten Versuche scheiterten wirklich kläglich.
Nachdem MidJourney V6 Prompts in mehr natürlicher Sprache unterstützt, versuchte ich also einfach einmal zu prompten, wie mir das in den Sinn kam.
Eine Frau, neben einem Bild von sich selbst
„a picture of a woman from Switzerland aged 40 standing next to a picture of herself, on the right aged 20, on the left aged 60″
Ihr könnt Euch sicher denken, dass eine Frau, neben einem Bild von ihr selbst, nicht funktioniert wie gewünscht. Aber Fehler helfen ja dabei, den richtigen Weg zu finden. Aber seht selbst:

Ja klar, eine Frau, die neben einem Bild von sich selbst steht. Das hat funktioniert. Was gar nicht funktioniert hat, war, dass 3 Personen abgebildet werden sollten. Meistens stand 1 Frau neben einem Bild von sich selbst und die Altersangaben wurden fast immer vollständig ignoriert. Aber auch ein spannedes Ergebnis 🤣
Eine Frau, die neben sich selbst steht
Neuer Versuch: „a picture of a woman from Switzerland aged 40 standing next to herself aged 20 on the right, aged 60 on the left“
Das hat soweit besser funktioniert, dass nun keine „Bilder“ mehr abgebildet waren und tatsächlich eine Frau in zwei unterschiedlichen Altersgruppen dargestellt wurde. Doch ich hatte ja eigentlich nach 3 Frauen gefragt.

Wir kommen der Sache näher…
Warum wurden aber nur 2 Frauen abgebildet und nicht 3? Ich habe versucht, der Sache dann auf den Grund zu gehen und habe mir von Chatty beim Prompten helfen lassen. Das Ergebnis meiner deutschsprachigen Nachfrage habe ich dann mit deepl_com übersetzt und als Prompt bei MidJourney verwendet.
3 Frauen, 3 Altersgruppen
„a highly detailed, realistic portrait of the same woman from Switzerland in three different stages of life, arranged side by side. On the left, a 60-year-old woman exuding wisdom and life experience, with visible signs of age and graying hair, dressed in an elegant, timeless style that emphasizes her Swiss heritage. In the center, a 40-year-old woman showing the height of her vitality and maturity, with a confident expression and full head of hair, dressed in clothes that reflect modern Swiss elegance. On the right, a 20-year-old young woman who embodies youth and freshness, with a lively, hopeful look and natural hair, in an outfit that reflects youthful trends in Switzerland. All three portraits should be finely crafted to show the evolutionary changes in face, posture and expression that the same woman experiences throughout her life in Switzerland. The background should contain subtle allusions to Switzerland, such as a discreet depiction of the Alps or typically Swiss landscape elements, to emphasize the woman’s cultural context and identity“

Der Prompt ist jetzt natürlich mega lang, doch das Ergebnis traf, was ich ursprünglich beabsichtigt hatte. Jedenfalls weitgehend und den Stil von Bild 1 fand ich sehr passend, um damit mehrere Serien zu gestalten.
Mit /shorten und /describe habe ich mich dann versucht, mit einem kürzeren Prompt auf ähnliche Ergebnisse zu kommen. Mit „realistic portrait of the same Swiss woman in three different stages, arranged side by side. on the left 20-year-old, in the middle 40-years old, on the right 60-years-old“ konnte ich schon sehr interessante Serien gestalten. Allerdings waren die Altersgruppen nie stimmig, die Bildkompositionen aber sehr ansprechend.
Mit weiteren Versuchen habe ich mich dann an das finale Ergebnis herangetastet und kam schliesslich zu einem Bild, das meine Vorstellungen getroffen hat. Eine Frau, die neben zwei Abbildungen von sich selbst steht, in drei verschiedenen Altersgruppen. Die Reihenfolge versuchte ich dann noch chronologisch zu gestalten, so dass die jüngste Variante links und die ältere rechts steht.
Und mit der Funktion „Vary (Subtle)“ konnte ich dann recht einfach meine Bilderserie erstellen, in dem ich nur jeweils die gewünschte Nationalität angegeben habe.
Herausfordernd fand ich dann noch, dass die Altersangaben doch sehr „frei“ angewendet wurden. Zwanzig sah dann doch eher nach 35 aus und 40 nach 50. Mit ein paar kleineren Anpassungen habe ich aber ein Bilderserie hinbekommen, die reflektiert, wie MidJourney die verschiedenen Kulturen „sieht“.
Die Schweiz
Meiner Meinung nach wurden hier 20 und 40 deutlich überschritten. Die floralen Motive und die Einfachheit der Bluse rechts, sollen vermutlich die traditionelle Schweiz reflektieren.

Japan

Auch hier war ich mit der Alterseinschätzung nicht einverstanden, das sieht für mich eher nach 40, 60 und 80 aus. Die klassische Eleganz der Kleidung sieht für mich als Laien stimmig aus.
Kenia

Indien

Vermutlich versucht MidJourney die Altersgruppen bewusst höher einzusortieren.
Finnland

Brasilien

Wie gefällt Euch mein kleines Experiment mit den Bildserien?
Wie geht Ihr vor, wenn die ersten Ergebnisse Eure Erwartungen überhaupt nicht treffen?
Hier noch der finale Prompt:
/imagine prompt: a portrait of the same woman from Switzerland in three different stages of life, arranged side by side. On the right, a 60-year-old woman with visible signs of age and graying hair, dressed in an elegant, timeless style that emphasizes her Swiss heritage. In the center, a 35-year-old woman showing the height of her vitality and maturity, with a confident expression and full head of hair, dressed in clothes that reflect modern Swiss elegance. On the left a 20-year-old young woman who embodies youth and freshness, with a lively, hopeful look and natural hair, in an outfit that reflects youthful trends in Switzerland. All three portraits should be finely crafted to show the evolutionary changes in face, posture and expression that the same woman experiences throughout her life in Switzerland –v 6.0
Aus diesem Prompt habe ich die passende Version ausgewählt und über Vary (subtle) die anderen 5 Länder generiert, in dem ich die Landesangaben jeweils angepasst habe. Mit Mehrfachprompts (mit {} Klammern) bin ich nicht zum gewünschten Ergebnis gekommen.
Falls Ihr jeweils die aktuellsten Beiträge von mir verfolgen wollt, folgt mir einfach auf LinkedIn.