Setzt KI um, worum ich sie bitte? Ich sage, jein

Bei meinem letzten Beitrag war es wieder so weit: Ich fand kein passendes Beitragsbild auf Pixabay. Also suchte mir die KI heraus, die die besten Ergebnisse in meinem Test erzielt hatten, (Bing, Leap, Picsart, Starryai) und schrieb Prompts. Es gibt Gründe, warum ich bei drei der KI schnell aufgab und den ursprünglichen Plan, der mir vorschwebte, fallen ließ.

Denn eine KI dazu zu bekommen, dass sie umsetzt, was ich in den Prompt schreibe, erfordert Kreativität und Hartnäckigkeit. Und manchmal muss man sich einfach geschlagen geben. Aber wieso ist das so schwierig?1Spoiler: Ich habe dazu leider nur Vermutungen, keine Antworten

Die KI und die Umsetzung eines Duells

Die KI erstellen Bilder anhand von Vorlagen, an denen sie gelernt haben. Wenn ich Prompts für KI-Bildgeneratoren schreibe, müssen sie aus diesen Vorlagen etwas Neues erschaffen, das meinen Vorgaben entspricht. Viel zu oft tun sie das aber nicht oder die Umsetzung ist recht interessant, wie ihr in meinem Test zu KI-Bildgeneratoren nachlesen könnt.

Ich habe dennoch weiter experimentiert und deshalb ziert meinen letzten Beitrag „Einen Köder schreiben – Praxisbeispiel Meuterei“ ein KI-erstelltes Bild von einer Piratin mit Schwert in der Hand. In diesem Beitrag hatte ich die erste Szene eines Manuskripts bearbeitet. Dort duelliert sich die Kapitänin eines Piratenschiffs mit einem unzufriedenen Matrosen. Zu diesem Duell wollte ich ein Bild haben.

Prompt schreiben? So geht das … oder so … oder so …

Prompt nicht umsetzen a la Leap: Eine Runde Piraten an Deck eines Schiffs
Prompt Leap: Piratin kämpft mit dem Schwert gegen einen Piraten auf dem Deck eines Schiffs, realistisch, beide werden von der Seite gezeigt

Im Prinzip ist es ganz einfach: Ich schreibe einen Prompt und erhalte davon eine bildliche Umsetzung. Im Internet finden sich viele Tipps, was man tun muss, wenn es nicht klappt. Sie lauten im Wesentlichen:

Möglichst knappe Prompts verfassen, möglichst detaillierte Prompts verfassen, möglichst eindeutige Prompts verfassen, die wichtigsten Wörter an den Anfang stellen, viele Adjektive benutzen, Stichpunkte benutzen, ganze Sätze benutzen …

Was ich nicht gefunden habe, sind Artikel darüber, woran es liegt, wenn die KI trotzdem Prompts nicht umsetzen. Also außer, dass mein Prompt angeblich nicht gut genug war. Jetzt sagt mir mal, was an dem Prompt für Leap nicht verständlich ist. Jedem Künstler, der mir das liefert, wenn ich ihm solche Anweisungen gebe, würde ich was erzählen.

Prompt umsetzen? Viel Luft nach oben

So setzt Leap meinen Prompt auch um: Mittelalterliche Segelschiffe auf See
Prompt Leap: Piratin Duell gegen einen Piraten mit Schwert an Deck eines Schiffs, Foto, beide werden von der Seite gezeigt

Leap generiert, trotz meiner Meinung nach recht eindeutigem Prompt, gern Schiffe. Schiffe auf dem Meer und im Hafen, mit Besatzung und ohne, als Holzschnitt oder mittelalterliches Gemälde. Vorne rechts auf diesem Bild findet sogar ein Duell statt. Es war das einzige, das bei 16 Versuchen herauskam. Aber klickt drauf und schaut euch die Gestalten aus der Nähe an. Leap denkt sich anscheinend: Schiffe kann ich, dabei bleib ich. Schiffe waren mir aber nicht nah genug an dem dran, was ich wollte.

Bing und Picsart setzten den Prompt vollständiger um – nur sehen die Menschen nicht wie Menschen aus. Und dazu, wie sie die Schwerter halten, sag ich mal nichts. Es wurde auch bei wiederholten Versuchen nicht besser. Ich kann den KI-Bildgeneratoren jetzt nur zugute halten, dass sie sich, obwohl sie offensichtlich keine Vorlagen haben, bemüht haben, meine Vorgaben einzuhalten.

Umsetzung des Prompts durch Bing und Leap: Eine Piratin und ein Pirat duellieren sich an Bord eines Schiffs
Prompt Bing, links: Piratin Frau kämpft mit dem Schwert gegen einen Piraten an Deck eines Schiffs, realistisch, beide werden von der Seite gezeigt
Prompt Picsart, rechts: pirate woman fighting a pirate man, sword fight, onboard a ship

Der Prompt und die Piratin

Starryai dagegen lieferte direkt ein richtig gutes Bild einer Piratin an Deck eines Schiffs. Das Problem war nur, auch die KI ignorierte den Rest des Prompts. Egal, wie oft ich bestimmte Worte darin unterbrachte, was ich bekam, waren Bilder einer Piratin, die verträumt in die Ferne sah, gelegentlich ergänzt durch einen Piraten oder Piratin, der/die sie anschmachtet.

Starryai setzt den Prompt nicht wie gewünscht um. Links schaut eine Piratin in die Ferne, rechts blickt ein Pirat eine Piratin verliebt an
Prompt 1, links: swordplay, duel, swordfight, onboard a ship, on deck, open air, open sea, ready for battle, female warrior pirate threatening a pirate with a sword, figthing, dangerous, holding a sword, high tension, ready to attack
Prompt 2, rechts: one pirate woman fighting a pirate man, swords fight, swordplay, fighting against each other, swords, duel, dueling, onboard a ship, on deck

Wenn die KI den Prompt ansatzweise erfüllte, wurde die Qualität der Bilder (deutlich) schlechter. Das rechte hätte ich sogar beinahe schon als Beitragsbild akzeptiert, aber über Hartnäckigkeit verfüge ich zum Glück in ausreichendem Maße.

Je kreativer, desto mehr Fehler machte Starryai bei der Umsetzung des Prompts: Oben zwei Piraten mit Schwertern, unten eine Piratin mit Schwert in Kampfpose
Prompt 1: swordplay duel on deck of a ship
Prompt 2: swordplay, duel, swordfight, onboard a ship, on deck, open air, open sea, ready for battle, female warrior pirate threatening a pirate with a sword, figthing, dangerous, holding a sword, high tension, ready to attack

Dass Starryai ebenfalls Vorlagen hat, von denen es nicht abweichen will, merkt ihr2bzw. vor allem ich, die ich alle 80 Bilder gesehen habe daran, dass ich fast immer dieselbe Piratin erhalten habe. Oder daran, wie ähnlich sich die drei Piraten sehen. Dafür stimmte die Qualität (meistens) und der Bildinhalt entsprach eher dem, was ich mir vorstellte, als die Schiffe.

Jetzt sagt ihr vielleicht: Das Beitragsbild von „Einen Köder schreiben“ sieht doch klasse aus. Aber das sagt ihr nur, weil es so klein ist. Dadurch könnt ihr nicht die Finger der Hand zählen, die das Schwert hält.3Es sind sechs, falls es euch interessiert. Außerdem benötigte ich dafür 20 Versuche, d. h. 80 generierte Bilder. Der Prompt ist derselbe wie der zur verträumten Piratin bzw. der mit dem leuchtenden Schwert. Auch das ist ein Mysterium: Warum lässt Starryai meistens den Großteil des Prompts außer acht und realisiert ihn sporadisch doch?

Eine Lösung habe ich nicht

Will ich, dass mein Prompt umgesetzt wird, oder will ich qualititativ hochwertige Bilder, die nur eine geringe Ähnlichkeit mit dem haben, was ich mir vorgestellt habe? Schwierige Entscheidung. Allerdings glaube ich nicht, dass ich bei Bing oder Picsart jemals richtig menschlich aussehende Duellanten erhalten hätte. Aber auch bei Starryai musste ich einen hohen Aufwand betreiben, damit die KI von ihrem Standardmotiv abwich und ich mein Bild von einer Piratin mit Waffe erhielt, bei dem die Fehler nicht zu auffällig sind.

Mit auf den Weg geben kann ich euch eigentlich nur: Ihr seid nicht Schuld, wenn KI-Bildgeneratoren eure Prompts nicht umsetzen. Die KI sind einfach noch weit davon entfernt, Anweisungen so exakt auszuführen zu können, wie es ein Mensch tun würde. Da bleibt nur, einen Kompromiss zu finden.

Falls ihr euch für Artikel von echten Experten zum Thema Bildgenerierung durch KI interessiert und noch mehr Beispielbilder sehen wollt, klickt doch mal hier und hier.

2 Gedanken zu “Setzt KI um, worum ich sie bitte? Ich sage, jein

  1. Liebe Katrin,
    sehr spannend, mit Bildern und der KI habe ich mich bislang wenig befasst.

    Bei Texten sagt man, dass es wichtig ist, der KI zunächst eine Rolle zu geben. Act as the best copy writer … (Auf Englisch ist besser als auf Deutsch.)
    Dann ist es wichtig, zu sagen, wofür man den Text braucht. Hätte das vielleicht etwas geändert?
    Ein Tipp aus dem Textbereich ist noch, Adjektive wie unkonventionell, originell etc. einzubauen, damit die KI aus ihrem Einheitsbrei herauskommt.

    Ich bin auf deine weiteren Versuche gespannt!

    1. Liebe Andrea,

      von den ersten beiden Tipps habe ich für Prompts bei KI-Bildgeneratoren noch nichts gelesen. Den dritten Tipp probiere ich demnächst mal aus. Mal sehen, wie lange meine Hartnäckigkeit anhält, KI zur Umsetzung meiner Vorstellungen zu bewegen. 🙂

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert