· 

Rechenmaschinenkunst. Teil 4: Artefakte und Werkprozesse

></body></html>
Mit dem KI-Tool DALL-E generiertes Bild eines großen Renaissance-Künstlerateliers.
DALL-E-Prompt: Renaissance art studio with artists, apprentices and assistants at work, as a highly detailed oil painting in the style of David Hockney

Ruft man sich noch einmal die Kritikpunkte der Gegner von Bildgeneratoren aus Teil 1 in Erinnerung, geht es ihnen vor allem um die vollständige maschinelle Form der Bildgenese, an der der Mensch nach Eingabebestätigung des Prompts überhaupt nicht mehr beteiligt sei.

Es stimmt natürlich, der Kernprozess der Bildschöpfung wird in fremde Hände gelegt, genau genommen in die der Entwickler. Der von den Enthusiasten gern angebrachte Vergleich zur Fotografie hinkt hier ein wenig, ein Mensch mit der Kamera oder einem Smartphone kann nicht nur den Bildinhalt als Motiv erfassen, er behält über jedes singuläre Artefakt des fotografischen Bildes die Kontrolle und kann das Ergebnis antizipieren.

Bildgeneratoren entsprechen dagegen eher einer black box der Bildgenese, die Ergebnisse des Prozesses entziehen sich der Kontrolle und sind bezüglich Komposition und Bildinhalt nur als Wahrscheinlichkeit einer möglichen Erscheinung antizipierbar.

Diese Unterschiede gelten jedoch nur auf der basalen Beschreibung von Bildgeneratoren und Fotografie. Das Unerwartete, Zufällige, Überraschende, Experimentelle, das Arbeiten gegen die vorgesehenen Regeln von Apparat und Technik blieb seit den Anfängen auch immer ein Aspekt der Fotografie, vor allem in der Konzeptkunst, bis zur Gestaltung fotografischer Phänomene auf rein digitalem Wege. Trends zu analoger Fotografie mit Objektiv- und Kamerabasteleien, abgelaufenen Filmen, exotischen Entwicklerflüssigkeiten oder Effektfilmen lassen sich ebenfalls als Gegenrichtung zur kontrollierten Perfektion der Technik begreifen, als bewusster Verzicht auf die Hoheit über den Prozess der Bildgenese und als Verzicht der vollständigen Antizierbarkeit fotografischer Bilder zugunsten des Überraschenden, Neuen und Unbekannten.

 

In Maßen lässt sich auch gegen die Modelle der Bildgeneratoren arbeiten, mit paradoxen oder gegensätzlichen Eingabeaufforderungen können visuelle Oxymorone erzeugt werden, wenn man zum Beispiel bei DALL-E den Prompt „cute cat in the style of Piet Mondrian, painted by Rembrandt, highly detailed by Jackson Pollock“ eingibt:

Vier Ergebnisse mit der Eingebeaufforderung: cute cat in the style of Piet Mondrian, painted by Rembrandt, highly detailed by Jackson Pollock

Wichtiger erscheint mir aber die Frage zu sein, inwieweit Bildgenerator, Fotokamera oder Pinsel bestimmend sind für den gesamten Prozess der Bildgenese. Dieser Prozess beginnt nicht mit einer Eingabebestätigung auf dem Rechner, dem Drücken eines Kameraauslösers oder dem Anmischen des ersten Farbtons auf der Palette und er endet nicht mit dem Download eines generierten Digitalisats, dem Exportieren eines entwickelten Fotos oder dem letzten Pinselstrich auf einem Gemälde.

 

Die Bedeutung wichtiger technischer Aspekte im Werkprozess wurde im dritten Teil ausführlich thematisiert und in Korrelation mit dem Vorgehen der Bildgeneratoren gebracht, dennoch darf man den Gesamtzusammenhang des Werkbegriffs nicht auf die Techniken der Bildschöpfung fokussieren oder gar reduzieren.

 

Menschliche Artefakte in der bildenden Kunst entstehen in der Regel nach einer linearen Abfolge von Schritten. Am Anfang steht die Bildidee und/oder eine konzeptuelle Überlegung. Diese Überlegung bildet die Grundlage für Skizzen oder Entwürfe, aus denen der finale Entwurf als Vorlage ausgewählt oder als Detailskizze ausgearbeitet wird. Erst dann folgt die Umsetzung des eigentlichen Artefakts, das durch die Künstler*innen als Kunstwerk legitimiert wird. Schon im Barock, vor allem aber seit Beginn der Moderne, wurden einige Zwischenschritte verkürzt oder in die endgültige Umsetzung integriert. Skizzen und Entwürfe wurden zunehmend ein Teil des Werkprozesses oder finden ohne Visualisierung rein gedanklich statt, wie schon am Beispiel des Künstlerwettstreits oder Cozens‘ Methode gezeigt wurde. Dennoch bleibt auch hier eine lineare Abfolge erhalten.

Unkontrolliert und unreflektiert umgesetzte Werke bilden nur eine Minderheit in der Kunstgeschichte, vor allem in der Dada-Bewegung oder surrealistischen Richtungen und es waren selten Sternstunden der Kunstgeschichte. Duchamps Werke oder Schwitters‘ Merzkunst als unreflektierte Automatismen oder gar unbewusste Handlungen zu klassifizieren, wäre eher eine Beleidigung.

 

Eine kreative Handlung beruht immer auf der angemessenen Entscheidung innerhalb einer Auswahl an Möglichkeiten. Auch diese Entscheidungen sind Teil des linearen Werkprozesses und nicht immer von vornherein festgelegt. Auf vielen der bis ins Detail geplanten Gemälden der Vormoderne finden sich sogenannte Pentimenti, „Reuestriche“, die eine Abänderung des ursprünglichen Bildkonzepts belegen. Unabhängig von den Parametern bietet der künstlerische Werkprozess also stets die Möglichkeit, dem eingeschlagenen Weg eine andere Richtung zu geben.

 

Diese relative Wahlfreiheit ist auch in der apparatebasierten Fotografie gegeben. Der Mensch hinter dem Apparat kann seinen Standpunkt oder den Winkel der Kamera frei wählen, Filmmaterial oder digitale Einstellungen bestimmen und mittels Brennweite, Blende und Belichtungszeit die Bildidee beeinflussen, um am Ende das gewünschte fotografische Artefakt zu erhalten.

Androiden-Assistenz

Bei den Bildgeneratoren ist diese Freiheit der Entscheidung innerhalb einer Auswahl an Möglichkeiten nicht gegeben, nicht erfahrbar und auch nicht durchsetzbar, weder bei der Wahl der Motive in der black box der Bilddatenbanken, noch im Prozess der Bildgenese selbst. Die Bilder entstehen dort nicht im Sinne einer nachvollziehbaren Bildgenese, sie tauchen unvermittelt als fertige Instant-Werke auf dem Rechner und in der Wahrnehmung auf.

 

Ist aber diese vergleichende Übertragung von Werkprozessen analoger Techniken auf die Vorgehensweise der Bildgeneratoren überhaupt angemessen?

 

Dass nach einer Eingabeaufforderung der Prozess der Bildgenese ohne menschliche Kontrolle und Einflussmöglichkeit vor sich geht, bedeutet nicht, dass am gesamten Bildfindungsprozess Entscheidungen innerhalb einer Auswahl ausgeschlossen sind. Man könnte vielmehr von einer wiederholten Abfolge des Werkprozesses sprechen. Die Ideenskizzen in der bildenden Kunst oder die bewusste Wahl von Motiv und Technik in der Fotografie fände so eine Entsprechung in der Ausformulierung der Prompts bei den Bildgeneratoren. Der Begriff „Prompt-Design“ als Analogie zur Gestaltung passt insofern, dass hier trotz aller Unklarheiten über die Ergebnisse die eigentliche kreative Entwurfsarbeit stattfindet.

Bildende Künstler*innen müssen ihre Fertigkeiten zumindest so vervollkommnen, dass sie neben Skizzen und Entwürfen auch Werke als Kunst schaffen können. Fotograf*innen müssen zunächst ihr Werkzeug beherrschen lernen, um danach Sujets und Motive entsprechend ihrer Anforderungen fotografisch umzusetzen.

Beherrschen lassen sich die Bildgeneratoren nicht, das ist vermutlich von den Entwicklern auch nicht gewünscht. Ich würde deshalb eher von Zusammenarbeit oder Kollaboration sprechen. Bildgeneratoren sind weit mehr als reine Werkzeuge wie Stift oder Pinsel, selbst ein Fotoapparat vermag keine eigenständigen Bilder zu generieren.

 

Betrachtet man Bildgeneratoren im Werkprozess wie Assistenz-Androiden in Science Fiction-Filmen, hoch spezialisiert, eigenständig, aber nicht-menschlich, so könnte man ihnen eine Funktion und die Legitimation auf Grund ihrer Fähigkeit einer eigenständigen Bildgenese zugestehen. Ich halte es für sinnvoll, diese Tools unaufgeregt als Mittel und Helfer für die eigenen Zwecke des künstlerischen Schaffens zu betrachten und so auch zu nutzen.

Mit dieser Einstellung lässt sich auch die latente Furcht vor Szenarien einer noch prekärer werdenden Kunstlandschaft relativieren. Wie im dritten Teil gezeigt, hat es auch in der Vergangenheit immer wieder einschneidende, ja paradigmatische Veränderungen im Werkprozess gegeben, ohne dass die Kunst selbst in der Geschichte verschwand. Künstler*innen benötigen keine zwölfjährige Ausbildung mehr, die in den ersten Jahren nur aus dem korrekten Anreiben der verschiedenen Ölfarben bestand, bevor mit der Zeichnung, ersten Hilfsarbeiten an Gemälden und Ausführungen von Teilbereichen begonnen wurde. Die Zinktube gehört heute genauso zur Atelierausstattung wie der Computer und gelegentlich der Projektor.

Prompt-Design vs. KI-Kunst

Da die Eigenständigkeit der Bildgeneratoren als virtuelle Androiden weder transparent, noch antizipierbar oder nachvollziehbar ist, sollte man bezüglich der Kontrollmöglichkeiten des Menschen im Werkprozess vielleicht eher von Prompt Design als von AI Art sprechen, sofern man Kunst jenseits von bewusstlosen Rechenoperationen betrachtet. Wenn Prompts die Funktion von Entwurfswerkzeugen haben, die zu beherrschen nahezu unmöglich ist, stellt sich natürlich die Frage, ob und an welchem Punkt überhaupt noch eine uneingeschränkte Entscheidungshoheit des Nutzers gegeben ist, um den Ergebnissen einen menschlich-artifiziellen Charakter zuzuweisen und sie nicht als reine KI-Spielereien zu bewerten.

 

Eine Antwort liefert die Funktion von Kontaktabzügen in der apparatebasierten Fotografie. Im Gegensatz zur bildenden Kunst steht die Auswahl der Skizzen und Entwürfe nicht vor der eigentlichen Umsetzung des Werks, das fertige Werk selbst in Form der Fotografien steht zur Auswahl. Bei den Bildgeneratoren ergibt sich die Entscheidungshoheit ebenfalls erst im Nachgang der Bildgenese. Da man selbst nicht der gezielte Schöpfer der Bilder, sondern nur der Formulierung von Prompts ist, muss man grundsätzlich mit einer weitaus höheren Quantität an Bildergebnissen rechnen als bei der Fotografie. Nutzerin und Nutzer der Tools werden bestätigen, dass dieser Aufwand auch nach hunderten von umgesetzten Prompts nicht unbedingt geringer wird, will man sich von den affizierenden Ergebnissen nicht blenden lassen und ganz bestimmte Ergebnisse erzielen. Im Vergleich zur Beurteilung der eigenen Werke entspricht die Auswahl dann eher einer kuratorischen Praxis in einer Teamarbeit, bei dem bis zur Präsentation die Vorschläge oder Ergebnisse der ausführenden Assistent*innen unbekannt sind.

 

Es stellt sich aber die Frage, wie lange Prompt Design die Grundlage der Bildgenerierung bildet, ist hier doch auch eine immer größer werdende Kompetenz in die Fähigkeiten der Formulierung notwendig, um zielgenaue Ergebnisse zu generieren. Diese auf Text-, nicht auf Bildschöpfung bezogene Kompetenz führt oft dazu, dass Nutzer*innen ihre komplexesten Prompts nicht mehr öffentlich teilen, sondern wie Geheimrezepte hüten. Ich selbst veröffentliche die für meine Gemälde verwendeten Prompts mittlerweile auch nicht mehr.

 

Das egalitäre Versprechen, alle Nutzer*innen könnten unter gleichen Bedingungen mit gleichen Ergebnissen starten, ist nach wenigen Monaten einer Kompetenzfalle gewichen, die nahezu alle technischen Innovationen auszeichnet. Wer recht früh dabei war, wird mit den neuesten Versionen der Tools und mit der gestiegenen Professionalisierung bessere Ergebnisse erzielen als Neueinsteiger*innen. Die von der Komplexität der Prompts abhängige Qualität der Ergebnisse bleibt zwar frei von der Notwendigkeit künstlerischer Fähigkeiten, anstatt in Bildkunst sind dafür jedoch Kompetenzen in der Wortkunst gefragt. Diejenigen, die in Sprache, Erzählung und Beschreibung zuhause sind, werden schneller zu besseren Bildergebnisse kommen als visuell orientierte Menschen.

 

Die neuesten Versionen von Midjourney, DALL-E und Stable Diffusion zeigen bereits, dass die Zukunft eher in der Feinabstimmung und auf KI-basierter Nachbearbeitung liegt als auf immer anspruchsvoller werdende Eingabeaufforderungen.

 

Die oft mit vielen Fehlversuchen und Feinabstimmungen zur Reife gelangten Prompts wurden anfangs von vielen Nutzer*innen in den Discord-Kanälen oder Sozialen Medien geteilt und wer sich weigerte, erhielt oft rüde Kommentare oder Beschimpfungen. Kein Wunder, dass es bald ein Portal gab mit der Möglichkeit, diesen Aufwand zu kapitalisieren. Unter promptbase.com entstand ein eigener Marktplatz im Internet, auf dem man Prompt-Eingaben für bestimmte Bildergebnisse für einstellige Eurobeträge kaufen kann:

Einen anderen Weg beschreiten Portale wie lexica.art, die Ergebnisse mit dazugehörigen Prompts für Bildgeneratoren präsentieren. Vermutlich werden zukünftig sowohl kommerzielle wie freie Portale die Zukunft der Modelle bestimmen. Hier ließe sich eine kurze Analogie zur Geschichte von Blogsystemen ziehen. Das heute überall verbreitete WordPress war in den Anfangsjahren konkurrierender Lösungen technisch weder das beste noch das intuitivste System, aber das erste, das kommerzielle und freie Design-Templates als Vorlagen für technisch nicht so versierte Nutzer*innen bewarb und vor allem dadurch zum Marktführer aufstieg.

 

Je mehr und je besser Nutzer*innen Prompts und die damit generierten Ergebnisse präsentieren können, umso einfacher wird es, für nahezu alle Bereiche Inspirationen oder Entwurfsvorschläge für die künstlerische Arbeit zu finden. Die Portale könnten damit zukünftig im Werkprozess von Künstler*innen eine Funktion einnehmen, die in frühreren Jahrhunderten Vorlagenbücher in den Ateliers hatten, später Fotografien und Magazine, heute Social Media-Kanäle.

Screenshot des Portals lexica.art
Screenshot des Portals lexica.art mit Stable Diffusion-Beispielen zum Suchbegriff "Caspar David Friedrich"

Im fünften und letzten Teil versuche ich eine Conclusio zu formulieren, ob und auf welche Weise sich Künstler*innen mit Bildgereatoren auseinandersetzen sollten und welche Auswirkungen die sich rasant entwicklenden Tools auf die bildende Kunst und ihrer Rezeption haben werden.

 

Teil 1 der Artikelserie

Teil 2 der Artikelserie

Teil 3 der Artikelserie

Teil 4 der Artikelserie

Teil 5 der Artikelserie