Kann „Prompt Design“ Kunst aus Bildgeneratoren erschaffen? Ist das, was die verschiedenen Modelle mittlerweile auch mit unterschiedlichen Ästhetiken ausgeben, deshalb Kunst, weil sie vermeintlich
„intelligent“ sind, oder nur, weil es so aussieht wie Kunst? Nach welchen Kriterien sollte oder kann sich das Kunsturteil richten?
Ich selbst halte das, was aus DALL-E, Midjourney oder Stable Diffusion generiert wird, nur in wenigen Einzelfällen für Kunst, wohl aber für ein kollaboratives Mittel, um Kunst zu
schaffen. Wenn Kunst alles sein kann, ist Kunst eigentlich nichts Konkretes mehr. Dann wäre Kunst eines von vielen kulturellen Phänomen und könnte auch Kunsthandwerk, Illustration,
Kalenderspruchbilder, Schnappschussfotografie oder Seidenmalerei im Volkshochschulmalkurs Pirmasens sein. Dann bitte auch auf diesem Level und mit diesem Anspruch. Die Teilnehmer*innen des
erwähnten Volkshochschulkurses könnten sich als silk painting artists bezeichnen, ohne dass selbstbewusste ai artists auch nur daran denken sollten, den Reklamierarm zu
erheben.
Was die Bildgeneratoren können, sind bis ins Detail ausgearbeitete und stilistisch passende Entwürfe, wenn man mit ihnen lange genug für die gewünschten Ergebnisse arbeitet. Ohne konzeptuelle
Ideen generieren die Tools aber nur Bildphänomene, die sich allenfalls wie ein religiöser Fetisch mit Wirkmächtigkeit aufladen lassen wie andere Bildphänomene auch.
So überrascht es nicht, dass alles an Kraut und Rüben, was durch die Bildgeneratoren gezogen werden kann, als Kunst deklariert und ohne Not mit der vollen Bedeutungsschwere des Kunstbegriffs aufgeblasen wird. Die von ihrer Hybris durchgeglühtesten ai artists gestehen den Bildgeneratoren noch nicht einmal die kollaborative Funktion und Relevanz zu, die den Tools angesichts der Bildgenese eigentlich gebührt. Die unveränderten Bilder werden als eigene Kreationen präsentiert, sie sollen schließlich wie auf einer globalen Kunstmesse warengerecht für sich und für das Können der Künstler*innen stehen, bloß nicht als Ergebnis einer Kollaboration mittels prompt engineering. Nur wenige Nutzer*innen leisten sich darüber hinaus die Ehrlichkeit und Aufrichtigkeit, ihre mittels Prompts generierten Bilder als Fantasy-Illustrationen, Plattencover-Ästhetiken oder Anime-Variationen zu deklarieren, nein, alles ist hier scheinbar Kunst. Was da in den ersten Monaten an Spielarten des Neosurrealismus in der Tradition des bereits schlechten Alterswerkes von Dalí in die sozialen Netzwerke gepostet wurde, hatte mit Kunst eher so überhaupt gar nichts zu tun. Unter dem Hashtag #stablediffusion findet man auf Grund der fehlenden Restriktionen des gleichnamigen Tools immer noch Unmengen an sexistischem und latent pädophilem Schund im Anime-Stil. Die Schöpfer solcher Werke nennen sich natürlich auch ai artists, haben aber mit dem Künstlerbegriff soviel zu tun wie ein mehrfach vorbestrafter Billigporno-Regisseur mit Federico Fellini. Anfang der 1980er Jahre schrieb der Künstler und Kunst-Essayist Hans Platschek ein Buch mit dem Titel Über die Dummheit in der Malerei. Kaum auszudenken, welche Qualen er heute durchleiden müsste, würde er noch leben und ein Buch zum Bodensatz der KI-Kunst schreiben wollen, ohne sich dem Vorwurf einer bösartigen Hetzschrift auszusetzen.
Deep Impact
Gut, nach diesem leicht emotionalen Intermezzo bleibt festzuhalten, dass es natürlich auch genug interessante, reflektierte und inspirierende Ausnahmen unter den ai artists gibt.
Einer davon ist Vladimir Alexeev, besser bekannt unter dem Namen Merzmensch. Es lohnt sich, seinem Instagram-Account zu folgen. Alexeevs eigene Arbeiten und seine Artikel haben dazu geführt, dass ich mich intensiver mit den Möglichkeiten des
Bildgenerators DALL-E 2 beschäftigt habe.
Andere großartige Beispiele, von denen ich mehrere ohne Probleme als KI-Kunst akzeptiere, finden sich auch auf dieser Liste.
Ich selbst verwende DALL-E als Werkzeug für meine Kunst auf eine komplexe und individuelle Weise, die ich für meine Art der Malerei nutze. Um das zu erreichen, musste ich über Wochen versuchen herauszufinden, wie ich welche Ergebnisse mittels DALL-E erzielen kann, um daraus Motive zu generieren und aus einer Vielzahl dieser Motive die passenden als Vorlagen-Mockups für meine Arbeit auszuwählen.
Das kommt einer kollaborativen Arbeit in Design-Projekten näher als der üblichen Vorgehensweise in der Kunst, konzeptuelle Überlegungen in Entwürfe zu visualisieren und bis zur Vorlage weiterzubearbeiten. Dies ist aber nur mein Weg, es gibt andere und es werden zukünftig mit der Weiterentwicklung von Bildgeneratoren noch mehr. Einer wurde bereits zu Beginn des Gesamttextes genannt, das Midjourney-Siegerbild aus dem Kunstwettbewerb in den USA, dort wurde das generierte Bild in Photoshop und anderen Tools weiter optimiert, verfeinert und vielleicht auch verändert.
Hier einige Beispiele meiner eigenen aktuellen Arbeiten als Gemälde, frei nach generierten DALL-E-Vorlagen, weitere Beipiele sind auf meinem Instagram-Account zu finden.
Welche Auswirkungen haben die Bildgeneratoren und die mit ihnen geschaffen Bilder nun konkret auf die Kunst und angrenzende Bildphänomene? Zunächst einmal ist festzuhalten, dass Midjourney, Stable Diffusion oder DALL-E bei allem Hype bislang nur geringen Einfluss auf die Arbeit von Künstler*innen in den Bereichen Malerei, Grafik, Fotografie oder Illustration haben. Das wird vermutlich auch noch über viele Jahre so bleiben, wenn auch die KI-Evangelisten und einige Redakteure mit dem aktuellen Paradigmenwechsel gleich die Dämmerung der bildenden Kunst verkünden. Es ist aber davon auszugehen, dass sich mit den zukünftigen Möglichkeiten dieser Tools auch die Bereitschaft oder sogar die Notwendigkeit einer Auseinandersetzung entwickeln könnte. Wie beim Siegeszug des Internets und der Smartphones wird es auch hier zu einer Diskrepanz kommen zwischen den vor allem jüngeren Künstler*innen, die bestehende Phänomene digitaler Bildkulturen aktiv mitgestalten, und Älteren, die schon mit Online-Präsenzen oder Social Media überfordert sind. Spätestens dann, wenn KI-Bilder Bestandteil des Kunstmarktes werden, bekommen sie eine entscheidende Relevanz. Die neuesten Versionen von Midjourney und Stable Diffusion zeigen schon jetzt nahezu perfekte Umsetzungen klassischer Stile realistischer Illustrationen.
Die Entwicklung befindet sich in einer steil ansteigenden Kurve der Optimierung und Verbesserungen. Den Hintergrund dieser Entwicklung von KI-generierten Bildgebungsverfahren erklärt Ethan Mollick anschaulich in einem Twitter-Thread am Beispiel des eBooks.
In den Bereichen Illustration und Bilddistribution waren KI-generierte Bilder nach dem ersten Hype ein kurzer Trend, der sich etwas gelegt hat. Das wird aber wiederkommen, sobald mit neueren Versionen Ergebnisse erzielt werden, die kaum noch von Stockfotos oder -illustrationen zu unterscheiden sind. Webseitenbetreiber und Online-Magazine können dann endgültig auf zeitaufwändige Suche nach dem passenden Motiv verzichten und inhaltsbezogene, redaktionelle Bilder für einen Bruchteil der Lizenzkosten selbst generieren.
Mittlerweile sind die Illustrationen einiger Bildgeneratoren so gut, dass sie eine aufwendige Auftragsvergabe für jegliche Form der Computergrafik kaum noch rechtfertigen, die Möglichkeiten
werden auch Storyboards für Animationsfilme verändern oder neue Bildformate erzeugen und Architekten werden zukünftig noch einfacher und ohne CGI-Techniken ihre Entwürfe visualisieren:
In der künstlerischen Praxis bleibe ich sicher nicht einer der Wenigen, die Bildgeneratoren als Möglichkeit für konzeptuelle Projekte und Vorlagen verwenden. Für ausgearbeitete Entwürfe eignen
sich diese Tools jetzt schon hervorragend. Interessant ist nicht nur ein experimentelles Projekt von Jörg M. Colberg, Bilder seines Fotobuchs „Vaterland“ mit DALL-E zu wiederholen, es zeigt auch eine Alternative konzeptueller
Werkprozesse, Vorstellungen und Gedanken zunächst zu visualisieren, bevor sie als Grafik, Gemälde oder Fotografie umgesetzt wird.
Interessant werden die Ergebnisse dann, wenn sie nicht als Selbstzweck affizierender Wahrnehmung dienen, sondern als Grundlage für weitere, neue und menschlich reflektierte Werke. Dabei sollte es
wie in allen anderen Bereichen der Kunst egal sein, in welcher Technik oder in welchen konzeptuellen Zusammenhängen diese künstlerische Verarbeitung stattfindet. Das kann digital über Inpainting
und Outpainting innerhalb der Bildgeneratoren selbst passieren, viele nutzen Photoshop oder anderen Bildbearbeitungsprogramme, das kann auch eine Auseinandersetzung mittels klassischer
Kunsttechniken sein. Selbst eine konzeptuell anspruchsvolle Präsentation von Ergebnissen wäre denkbar, die weit mehr zu zeigen hat als eine Summe von Bildern.
Wenn ich auch gegen die allzu glatten, perfekt gerenderten Formen und gefälligen Ergebnisse gewettert habe, so kann es doch passieren, dass ich mit dieser Bewertung schon in einigen Jahren im
Abseits stehe. Die Smartphone-Fotografie hat in den sozialen Medien mit ihrer Ästhetik zu einer Veränderung der Wahrnehmung und Bewertung von fotografischen Bildern geführt. Fast unbemerkt haben
Bildbearbeitungsprogramme darauf reagiert, die Optimierungsfunktionen führen fast alle in eine Ästhetik perfekter Smartphone-Fotos mit gesättigten Farben, großer Schärfentiefe und klaren
Kontrasten.
Es ist gut möglich, sogar wahrscheinlich, dass sich mit den KI-Bildern auch veränderte Ästhetiken in der Illustration von Buch- und Musikcovern, als Stock-Grafik und in Werbekampagnen durchsetzen
werden. Das wiederum würde Einfluss auf die Kunstpraxis haben und damit auch auf kanonische Parameter des Kunsturteils.
Notwendigkeiten und Perspektiven
Da diese neuen Bilder in der Welt sind, müssen sich einige Künstler*innen mit einem Dilemma auseinandersetzen, das sich aus der Gegenüberstellung ihrer eigenen Werke mit der ästhetischen Wirkmächtigkeit der KI-Bilder ergibt und das Selbstverständnis verschiedener Bildgattungen der künstlerischen Praxis in Frage stellt. Da Bildgeneratoren schon heute in der Lage sind, perfekte Bilder im Stil fotorealistischer und neosurrealistischer Kunst auszugeben, geraten Künstler*innen dieser Richtungen plötzlich in eine völlig neue Konkurrenz- und Rechtfertigungssituation, sofern ihre Werke nur auf formalästhetischen Parametern ohne konzeptuell-inhaltliche Ansprüche basiert. Dieses Rechtfertigungsproblem hatte ich schon zum Plagiatsvorwurf anhand der Anime-Stils kurz thematisiert. Mit weiter zunehmender Perfektion werden KI-Tools auf dem Feld rein ästhetischer Aufmerksamkeitsökonomie jeden Wettlauf gewinnen. Wer in diesen Stilrichtungen zuhause ist, wird sich fragen lassen müssen, welchen künstlerischen Mehrwert die eigenen Werke bieten und was das eigene Selbstverständnis als Künstler*in rechtfertigt. Sich auf handwerkliche Perfektion, den überirdischen Musenkuss oder einen kreativen Schöpfungszwang zu berufen, ist kaum noch hinreichend, wenn ein bewusstloses KI-Tool dies alles genauso gut beherrscht, die Ergebnisse innerhalb weniger Minuten vorliegen und das Tool von allen Menschen mit Internetanschluss bedient werden kann.
Dazu passt die interessante These von Wolfgang Ullrich, nach der es nicht mehr
ausreiche, Kunst aus der Warte eines mittlerweile entleerten Autonomiebegriffs zu rezipieren, zu bewerten und zu kaufen. Kunst im
Sinne von Ad Reinhardts Diktum „Kunst ist Kunst-als-Kunst, alles andere ist alles andere“ reiche nicht mehr. Es bedürfe zusätzlicher Qualitätsmerkmale des politischen Engagements
und/oder partizipativer Möglichkeiten der Identifikation, der Fankultur oder des Empowerments. Die Bildgeneratoren, soviel ist sicher, werden diese Krise der autonomen Kunst noch verschärfen
durch ihre Fähigkeit, Bilder so aussehen zu lassen, als sei es Kunst als Kunst.
Eine absolute Kunstdämmerung zu befürchten ist allerdings unnötig, und menschliche Kreativität wird nicht einfach durch Rechenmaschinen ersetzt. Die Bedingungen und Parameter des Kunstbegriffs
werden sich aber vermutlich verändern und damit auch das Selbstverständnis und die Rezeption künstlerischer Tätigkeit. Das Smartphone und Social Media haben die Fotografie nicht begraben, im
Gegenteil, sie haben aber die Fotografie und ihr Selbstverständnis völlig verändert.
Vielleicht sorgen die Bildgeneratoren aber auch für eine Stärkung der in die Krise gekommenen Kunst. Folgt man Ullrichs Thesen, sind es weniger die Werke einzelner autonome Künstler*innen selbst, die eine Krisensituation erfahren, es ist die Idee der autonomen Kunst als Dogma und Standarderklärung, die in der Krise steckt. Das Dilemma, von dem weiter oben die Rede war und sich auch als Aspekt eines Wettbewerbs mit KI-Lösungen interpretieren lässt, führt vielleicht auch zu einem stärkeren Bewusstsein darüber, welchen Stellenwert individuelle, menschliche Kreativit in der Gesellschaft einnimmt.
Die Bildgeneratoren, das sollte aus allem bisher gesagten klar geworden sein, schaffen keine singulären Werke individueller Nutzer*innen, sondern Ideen von Bildphänomenen aus den Bereichen Kunst, Illustration oder Fotografie. Daran ändert auch die Tatsache nichts, dass jede wiederholte Prompteingabe zu unterschiedlichen Ergebnissen führt. Der Mensch vor dem Rechner kann seine Vorstellungen von Kunst nicht mit den Bildgeneratoren individuell aushandeln, er ist vereinzelter Teil des Kollektivs von Nutzer*innen, die die Interpretationen der Bildgeneratoren lediglich als Vorschlag ablehnen, akzeptieren oder in ihrem Sinne weiterverwerten können.
Diese Tools zwingen durch ihre Perfektion und ihr schöpferisches Potenzial die Künstler*innen andererseits dazu, reflektierter und individueller ihr Werk zu betrachten und zu legitimieren, als es
die unkonkrete Idee autonomer Kunst je vermochte. Durch dieses Zurückgeworfensein auf den eigenen, individuellen Kunstanspruch könnte die unausweichliche Auseinandersetzung mit den
Bildgeneratoren auch zu einer Stärkung konzeptuell anspruchsvoller, autonomer Kunst führen, selbst wenn die Idee der Kunstautonomie verblassen sollte. Vertreter*innen der postautonomen Kunst
werden sich durch diese Entwicklungen dagegen noch klarer positionieren in ihrem Anliegen, mehr als nur Kunst zu schaffen.
Da Kunst nicht in einer abgeschlossenen Parallelgesellschaft stattfindet, wird dieser Einfluss der Bildgeneratoren auch davon abhängen, wie schnell und nachhaltig sie sich als weiteres digitales
Bildphänomen etabliert. Angesichts der Dominanz von Smartphone-Apps und Social Media wird es irgendwann möglich sein, Meme, Gifs oder ganz neue Formen der bildbasierten Teilhabe zu generieren und
direkt in den sozialen Netzwerken zu teilen. Spätestens dann werden KI-Bilder keine KI-Bilder mehr sein, sondern ein weiterer Teil der alltäglichen Bildphänomene, die uns umgeben.