Teil 2: KI's an unerwarteter Stelle.
Unerwarteterweise gibt es im Bereich Grafik bereits unglaubliche Fortschritte im Bereich künstlicher Intelligenz.
Wir haben verschiedene Bots getestet.
Dall-E 2
«DALL·E 2 is a new AI system that can create realistic images and art from a description in natural language.»
So schreiben die Entwickler auf ihrer Homepage. Es genügen ein Google Account und eine Registrierung, und schon kann man loslegen. Man gibt einfach einen Text ein, das geht auch auf Deutsch, und Dall-E 2 beginnt zu zeichnen.
25 Bilder pro Monat sind kostenlos.
Ich beginne einmal zur Illustration mit einem einfachen Textbeispiel.
Male einen süssen, traurigen Goldfisch, der in einem Glas schwimmt.
Wie man sieht, ergab es 4 Varianten Goldfisch in einem Glas. Jedoch schwimmt er bei Nummer eins zum Beispiel ausserhalb des Glases.
Nummer 4 sieht einigermassen so aus, wie ich mir das vorgestellt habe, nur ist er weder süss, noch besonders klein.
Ich könnte jetzt das Bild direkt auf der Page bearbeiten oder dieses Bild mit einem bereits bestehenden vermischen lassen, doch Dall-E 2 hat bereits seine Schwächen gezeigt. Wenn man genau hinschaut, sieht der Fisch nur ungefähr aus, wie ein Fisch, jedoch sind die Flossen sehr verkrüppelt geraten und Augen hat er auch nicht.
Ich versuche also, noch mehr Variationen mit einem Klick auf Variations zu erstellen.
Also von dem obigen Bild erstellt er jetzt Variationen. Das dauert etwa eine Minute.
Schon besser. Aber ich bin nicht zufrieden.
Ich gebe diesmal zusätzlich ein: Ein hyperrealistisches 3D Bild von einem traurigen Goldfisch der in einem Kugelglas schwimmt, Pixar Style
Ich bin ein bisschen enttäuscht. Das war das Beste von abermals 4 Bildern. Aber ich habe ja eine Weile geübt und bin mittlerweile erfahren in 3D Programmen und sogenannten Renderings. Ich erstelle also mit ausgeklügelten Worten noch eine letzte Version, die meiner Idee mehr oder weniger nahekommt.
Diesmal habe ich eingegeben:
Ein Bild aus einem Pixar Film, das einen traurigen Goldfisch zeigt, hi-res, octane rendering, raytrayced, animation style
Auf vielen Seiten kann man übrigens diese Stichworte (sogenannte Prompts) unter den
Bildern nachschauen. Doch, auch wenn man dieselben eingibt, wird das Bild nie exakt dasselbe sein.
Doch Dall-E kann schon mehr, und nach wirklich langem Ausprobieren kamen ein paar brauchbare Bilder heraus, aber manchmal erschuf die KI völlig abstruse Storys, die anscheinend nichts mit meinen Eingaben zu tun hatten. Wenn man den Stil nicht genau definiert, wählt diese KI irgendeinen Stil. Das Gute an ihr ist sicher einmal die Freewareversion mit den 25 Bildern pro Monat, auch die sehr einfache Bedienung, und die recht grossen Formate der Ergebnisse. Mich selbst störte jedoch die Ungenauigkeit zum Beispiel in Gesichtern und menschlichen Figuren. Auch die Stile wirken immer irgendwie zusammengemixt.
Hier kann man ein paar meiner Versuche sehen, bei welchen auch die Stichworte sichtbar sind, damit vielleicht Anfänger sich schneller zurechtfinden.
Wahrscheinlich wäre ich viel schneller zum Ziel gekommen, wenn ich von Anfang an gleich nach bestehenden Bildern mit Prompts gesucht hätte. Diese gibt es zum Beispiel hier.
Midjourney Bot
Nachdem ich viele andere KI's, die ungefähr dasselbe machen, ausprobiert habe, bin ich am Midjourney Bot hängengeblieben. Ich hatte ihn früher schon ausprobiert, doch er war mir auf die Schnelle schlicht unsymphatisch wegen seiner für Anfänger komplexen Einrichtung und Bedienung.
Zuerst muss man sich da nämlich auf Discord, einer Plattform für Spiele, Chats und vielem mehr registrieren. Das an sich ist erstmal gratis. Dann muss man den Midjourney Bot zu seinen Servern hinzufügen.
Dann kommt man in einen Chat, wo man erstmal den richtigen finden muss, und kann seine Eingaben dazwischen tippen und irgendwann erscheint dann das eigene Bild, zwischen hunderten von anderen. Man kann auch nicht einfach wie bei Dall-E direkt eingeben, sondern man muss immer zuerst immer vorgefertigte Prompts eingeben, und erst dann kann man dem Bot erklären, was man möchte.
Für mich war es jedenfalls kompliziert am Anfang.
Hier einige Anleitungen.
Zuerst von Midjourney selbst.
Hier ein anderes Tutorial auf Deutsch. Es sind in der Testversion übrigens mehr als 25 Bilder, doch wie das genau ausgerechnet wird, ist mir bis jetzt schleierhaft. Ich habe mich anfänglich auch mit verschiedenen E-Mails registriert, das funktionierte auch.
Mittlerweile habe ich einen Monat bezahlt, weil ich derart begeistert war. Aber erst, nachdem ich meinen eigenen Server erstellt hatte. Wenn man im sogenannten Relaxed Modus arbeitet, kann man das Monatsabo wohl kaum ausreizen. Hier einige Beispiele von mir. Die Prompts lassen sich aus den Bilddaten herauslesen. Da ich den Bot für einen Monat gekauft habe, darf ich die Bilder auch für kommerzielle Zwecke nutzen. ;)
Mein Fazit ist klar: Midjourney ist der helle Wahnsinn und wohl eine neue Kunstform, welche bald wohl überall, auch in Filmen eingesetzt wird. Auch als Grafiker werde ich wohl zukünftig häufig auf eine Zusammenarbeit mit solchen Maschinen zurückgreifen, auch wenn Midjourney noch seine Schwächen hat, wie zum Beispiel die Darstellung von Händen. Doch ehrlich gesagt hat man nach einer Weile das gefühl, dass diese Maschine wirklich selbst kreativ ist, auch wie sie selbst Texte erstellt, die zwar gut aussehen, jedoch nichts heissen.(siehe nächster Teil.) Für mich eine unglaubliche, aber auch süchtig machende Erfahrung. Doch, dass solche Algorithmen dermassen in die darstellende Kunst eingreifen werden, hätte ich mir nicht im Traum vorstellen können.
Eigene Beispiele
Hier viele Beispiele mit den dazugehörigen Eingaben (Prompts)
Comments