Ihr kennt SEO, die Optimierung von Websiten zur besseren Auffindbarkeit durch Suchmaschinen? Mein SEO-Tool Yoast SEO meckert bei jedem meiner Artikel: Keyword kommt nicht im ersten Absatz vor, nicht genug Zwischenüberschriften, kein Bild verwendet usw.
Ich begebe mich daher z. B. regelmäßig auf Bildersuche, meistens bei Pixabay, einer großen und kostenlosen Bilddatenbank. Als Lektorin, die über das Lektorieren und Schreiben schreibt, drängen sich meist Fotos mit Stiften, Buchstaben, Büchern, Bücherregalen, lesenden Menschen etc. auf. Das ist auf Dauer … na ja … langweilig. Deshalb versuche ich, etwas Kreativeres zu nehmen. Nur ist das gar nicht so einfach. Für meinen letzten Artikel, Story Structure: Köder mich!, stellte ich mir eine Fährte aus Süßigkeiten vor, der Kinder in einen Wald folgen – eine Fährte aus Ködern sozusagen. Das ist nichts, das ich in einer Bilddatenbank auftreiben kann. So kam es dazu, dass ich einen Test der KI-Bildgeneratoren startete, die kostenlos verfügbar sind.
Hier kommt die KI ins Spiel
Die letzten Monate wird ständig über die riesigen Fortschritte geredet, die man bei KI gemacht habe. KI-generierte Bilder seien kaum noch von echten zu unterscheiden (und das trifft auf einige durchaus zu, wie ihr in diesem Spiegel-Quiz herausfinden könnt). Ich dachte mir also: Warum nicht einen KI-Bildgenerator ausprobieren? Was dabei herauskam, das präsentiere ich euch in diesem Beitrag. Denn einige Ergebnisse sind sehr kurios und es lohnt sich immer zu zählen, wie viele Beine1sowie Arme, Finger, Augen, Füße und Hörner die Tiere oder Menschen haben.
Ich habe mich an kostenlose Programme gehalten oder an die kostenlose Variante von kostenpflichtigen Programmen. Eine Freundin hat mich außerdem ihren Midjourney-Account nutzen lassen. Midjourney ist einer der beliebstesten, aber auch kostenpflichtigen, KI-Bildgeneratoren.
Wie das Ganze funktioniert
Bis vor Kurzem hatte ich keine Ahnung davon, wie man mit KI Bilder generiert, und vielleicht geht es euch genauso. Daher eine Einführung.
Im Prinzip ist es simpel: Ihr verfasst einen Prompt, was in dem Bild zu sehen sein soll wie „Zwei Kinder folgen einer Spur aus Süßigkeiten in einen Wald, strahlender Sonnenschein“. Dann klickt ihr auf Erstellen und erhaltet normalerweise vier Entwürfe. Bei manchen KI-Bildgeneratoren kann man auch ein Bild als Vorlage nehmen.
In den Prompt kann man alles Mögliche schreiben: Nahaufnahme der Kinder, Junge trägt Kniestrümpfe und Sandalen, Mädchen größer, Gothikoutfit, im Stil von Picasso, primäre Farben Rot, Blau und Gelb.
Die KI-Bildgeneratoren neigen alle dazu, Teile des Prompts zu ignorieren, sodass man eventuell mehrere Versuche unternehmen muss – oder irgendwann aufgibt. Ich kann nicht die einzige sein, die daran verzweifelt, denn ich habe einen Prompt gesehen, der in etwa so lautete:
„Anime Girl in a dress, Anime City, ANIME ANIME ANIME“
Je nach Programm gibt es weitere Funktionen. Stil ist eine häufige, bei der man z. B. Fotografie, Anime, Wasserfarben oder 3D-Modell auswählen kann. Aber keine Sorge, wenn es Stil nicht gibt, kann man das auch einfach im Prompt hinzufügen. Eine weitere nützliche zusätzliche Funktion ist Negative Prompt. Hier kann ich angeben, was ich auf keinen Fall im Bild sehen will, sagen wir, Erwachsene, Bäume oder Pferde mit drei Ohren.
Diese KI-Bildgeneratoren habe ich getestet
- Bing
- Canva
- Craiyon
- DeepAI
- Dream
- DreamStudio
- getimg
- Leap
- Midjourney
- Picsart
- Pixray
- Prodia
- Shutterstock
- Starryai
Ich habe zwei Prompts verwendet. Manchmal sahen sich die Ergebnisse einer KI zu einem Prompt alle ähnlich, andere lieferten recht unterschiedliche Entwürfe.
Prompt Nr. 1: Zwei Kinder folgen einer Fährte aus Süßigkeiten in einen Wald, Anime
Als Erstes hatte ich mir einen Account für DreamStudio erstellt. DreamStudio ist die zweite sehr beliebte bildgenerierende KI. 25 Credits bekam ich geschenkt, das reichte für 29 Bilder. Wie hat es geklappt? Das eine Ergebnis ist das Beitragsbild für den letzten Blogartikel geworden.
Eins der anderen ist dieses. Klickt gern auf das Bild und schaut es euch in Vergrößerung an. Besitzt das Mädchen einen zweiten Arm? Warum endet der andere Arm in einem Stummel? Ein Auge ist braun, das andere blau und das blaue ist nicht vollständig. Mit den Beinen und Füßen des Jungen stimmt auch etwas nicht.
DreamStudio hatte bei allen meinen Prompts arge Probleme, wenn es um Menschen ging, egal welchen Stil ich gewählt habe, obwohl mir die Umsetzung von Anime gefällt.
Wie haben die anderen KI-Bildgeneratoren im Test abgeschnitten?
Wie viele Füße hat das linke Mädchen bei Bing? Wo befindet sich das Kind bei Canva? Ein Wald ist das jedenfalls nicht.
KIs brauchen keine Münder, warum sollten also Menschen welche haben?
Falls ich mal einen Horrorfilm drehen will, werde ich die Bilder von DeepAI nutzen.
Auf die Beine achten. Beim Bild von getimg und Picsart auch auf die „Hände“.
Anime ist das nicht für mich und auch sonst, ich sag mal, es überzeugt mich nicht. Das Mädchen im gelben Kleid darf auch beim Horrofilm mitmachen.
Links: Zwei Mädchen, drei Beine. Und diese Hände. Rechts: Ganz ordentlich.
Bei Shutterstock kann man zwar kostenlos Bilder erstellen, muss aber zahlen, wenn man sie herunterladen will. Ich kann euch aber sagen, dass die Ergebnisse nicht überzeugender waren. Aber: Als eins der wenigen Programme hat die KI es hinbekommen, eine Spur aus Süßigkeiten darzustellen und das in jedem der vier generierten Bilder.
Und wie hat sich Midjourney geschlagen?
Hat ebenfalls altbekannte Probleme mit Gliedmaßen und Gesichtern. Der Junge im rechten Bild ist in Wahrheit ein Mädchen. Ihr müsst euch nur den Schatten anschauen, um das zu erkennen.
Prompt Nr. 2: Mysteriöser Wald mit Einhorn
Okay, dachte ich mir, das war für die KIs wohl zu schwierig, versuchen wir etwas Einfacheres. Spoiler: Ein Einhorn ist für die KI nicht einfacher. Selbst ein Pferd ist es nicht.
Bitte neben dem Zählen darauf achten, wo das Horn2oder die Hörner sitzt.
Der mysteriöse Wald von Bing gefällt mir am besten und das transparente Einhorn auf dem linken Bild fände ich sogar richtig gelungen, wenn es nicht so einen seltsamen Hals hätte.
Wenn ich nicht wüsste, dass das rechte Bild von einer KI generiert ist, würde ich glatt glauben, dass sei aus einer Kunstausstellung.
Warum sind so viele dieser Programme der Meinung, Einhörner hätten rosa zu sein? Laufen Einhörner mit fünf Beinen besser als welche mit vier?
Wenn das Einhorn links doch nur ein zweites Ohr hätte!
Wenigstens gibt Prodia sich Mühe, unterschiedliche Interpretationen des Prompts zu erstellen. Das rechte Einhorn ist gerade bei der Akupunktur.
Ich wäre mit dem Mädchen zufrieden, wenn sie keine Plüschohren hätte. Ihr seht bestimmt, was sonst nicht stimmt. Seitdem ich das rechte Bild gesehen habe, habe ich furchtbar Lust, einem Pferd die Mähne so zu färben. Schade, dass das Horn nicht echter wirkt.
Als Letztes ein Suchbild: Wo versteckt sich das Einhorn? Ich habe es noch nicht gefunden. Wenn jemand von euch es entdeckt, gebt mir bitte Bescheid. Ein solches Ergebnis habe ich aber bei jedem Programm mindestens einmal erhalten. Zählen ist nicht die große Stärke von KI, scheint es mir. Ob aus zwei Kindern drei werden oder aus einem Einhorn keins … pi mal Daumen kommt’s ja trotzdem hin. Vielleicht lassen sich die KIs auch vom Piloten im kleinen Prinzen inspirieren, der ein Schaf gezeichnet hat, wer weiß.
Kann Midjourney im Vergleich punkten?
Ich bin nicht sicher, ob es sich links um ein Pferd mit zwei Ohren handelt, wovon eins an einer seltsamen Stelle wäre, oder ob das ein Horn sein soll. Die Wunden am Hals deuten außerdem darauf hin, dass es von Lord Voldemort angefallen wurde.
Lohnt es sich für mich?
Nach meinem Test der KI-Bildgeneratoren kann ich sagen: Es macht Spaß, mit ihnen herumzuspielen. Aber um das zu erhalten, was man möchte, muss man einiges an Zeit investieren und die Prompts immer wieder umschreiben – und manchmal klappt es nicht wie mit den Kindern, die Süßigkeiten folgen.
Es geht, selbst wenn ich ein Gespür für die Prompts bekommen habe, wahrscheinlich nicht schneller als Pixabay zu durchsuchen. Und das war es, auf das ich gehofft hatte. Trotzdem denke ich, dass ich einige der Bildgeneratoren die nächsten Monate weiter ausprobieren werde.
Und falls euch mal langweilig ist, muntert es euch vielleicht auf, eure eigenen Prompts einzugeben.
Hättet ihr erraten, dass das Beitragsbild ein Einhorn darstellen soll? Tja, Pixray hat „mysterious wood“ als „mysteriöses Holz“ interpretiert. Kreativ ist die Umsetzung des Prompts auf jeden Fall.
Super Artikel und tolle Bilder!
Interessante Versuchsanordnung und sehr unterhaltsame Auswertung! : )
Ich beschäftige mich bisher ausschließlich mit KI-generierten Texten, an Bilder hab ich mich noch nicht rangewagt, es scheint sich aber wirklich zu lohnen!
Komisch, was ist wohl so schwierig an Beinen, Hörnern und Händen?