Bislang blieben die klassischen Produktionsmittel und -methoden der bildenden Kunst weitgehend unbehelligt von den neuesten Entwicklungen der Digitalmoderne. Die Entstehung der meisten
Zeichnungen, Grafiken, Malereien, Skulpturen und Installationen hat sich seit Beginn des Kunstbegriffs kaum verändert: Die Herrschaft über die Werkgenese lag bislang in der sprichwörtlichen Hand
der Künstler*innen.
In seinem Buch mit dem etwas reißerischen Titel „Geheimes Wissen – Verlorene Techniken der Alten Meister wiederentdeckt“ versuchte der britische Maler David Hockney anhand eigener Experimente
nachzuweisen, dass die Malerei seit der Frührenaissance mit ihren zentralperspektivischen und wirklichkeitsgetreuen Darstellungen vor allem das Ergebnis technisch-optischer Hilfsmittel war. Es
gibt einige Fehler in seinen Thesen, ganz so geheim war das Wissen auch nicht, dennoch hat er den Fokus auf den Bereich einer technischen Geschichte der Kunst gelegt, der nur selten thematisiert
wird. In der Kunstwissenschaft wurde Hockneys Buch kaum rezipiert, spielt Technik dort ohnehin keine große Rolle und beschränkt sich meistens auf das verwendete Malmittel und den Bildträger.
Ähnlich dem KI-Effekt werden auch hier die technischen Innovationen der perfektionierten Ölmalerei und neuer optischer Hilfsmittel nicht als ein konstitutives Merkmal der Renaissance-Malerei
betrachtet, sondern als gegebene und damit sekundäre Phänomene.
Aus heutiger Sicht erscheinen die flämischen Bilder von Jan van Eyck, Robert Campin oder Rogier van der Weyden längst als konventionelle und bewährte, ja fast schon überkommene Beispiele einer glatten, wirklichkeitsnahen Feinmalerei, die über Albrecht Dürer bis zu Salvador Dalí fortgeführt wurden. Zu Beginn des 15. Jahrhunderts müssen diese Bilder in ihrer detaillierten Naturnachahmung aber ungläubiges Staunen ausgelöst haben. So wie heute Maler nicht gern zugeben, dass sie mit analogen und digitalen Hilfsmitteln wie Projektoren oder Grafiktabletts arbeiten, werden auch Künstler früherer Jahrhunderte kaum über die Verwendung von Prismen, Spiegeln oder Apparaten wie der Camera Obscura und Laterna Magica gesprochen haben. Der Begriff „Geheimes Wissen“ passt also.
Die technische Professionalisierung der Malerei, die Verwendung optischer Hilfsmittel und die Entdeckung perspektivischer Darstellungen stellte einen Paradigmenwechsel dar und führte zu Beginn des 15. Jahrhunderts vermutlich zu einem stark affizierenden Erlebnis der Wahrnehmung, vergleichbar mit den Rezeptionserlebnissen der ersten Daguerreotypien im 19. Jahrhundert und beindruckenden Ergebnissen der Bildgeneratoren heute.
Kunst, so wird gern argumentiert, wird durch Künstler*innen geschaffen, nicht durch Technik.
Die Idee vom Künstler ist mit der Idee des schöpferischen Menschen verbunden, der mittels Inspiration, Kreativität oder Eingebung Kunstwerke schafft, die unabhängig von den technischen Mitteln zu betrachten sind. Diese Überzeugung sorgte aber nicht nur für eine Marginalisierung der kunsthistorischen Bedeutung technischer Innovationen. Die Fotografie musste einen fast 150 Jahre währenden Kampf um die Gleichberechtigung als eigenständige Kunstgattung führen und war immer dem Vorwurf einer „niederen Apparatekunst“ ausgesetzt, teilweise bis heute.
Übersehen werden in dieser Gegenpositionierung Technik versus Kunst allerdings zahlreiche Überschneidungen. Die ersten Daguerreotypien wurden mit modifizierten Modellen der Camera Obscura
hergestellt, die schon Künstler wie Canaletto für exakte Vorzeichnungen ihrer Gemälde benutzten. Maler des Realismus wiederum nutzten früh Fotografien als Vorlagen, zur Ideenfindung ihrer
Kompositionen, ja sogar als Bildträger. Parallel zur Entwicklung der Daguerreotypien wurden seit 1841 industriell gefertigte Ölfarben in Zinktuben vertrieben, Kunstbedarfshändler boten Leinwände
auf Keilrahmen in standardisierten Formaten an, die in modernen Fabriken hergestellt wurden. Das gesamte Jahrhundert brachte immer wieder neue, leuchtende Farbtöne der gerade erst entstandenen
Chemiefabriken auf den Markt. Diese Innovationen sorgten für eine bequeme Freiluftmalerei, bildeten die Grundlage für den Impressionismus und ermöglichten es Autodidakten wie Rousseau, Gauguin,
van Gogh oder Cézanne, sich ohne Lehrjahre maltechnischer Grundlagenaneignung als Künstler zu betätigen. Die industrielle Revolution mit all ihren technischen Innovationen revolutionierte auch
die Praxis der bildenden Kunst.
Der Kunstanspruch eines Werkes der Malerei oder Fotografie kann durch die verwendeten technischen Mittel also weder legitimiert noch abgesprochen werden. Gegner der Bildgeneratoren argumentieren
deshalb oft mit dem nicht menschlichen Prozess der Bildgenese eines „dummen“ Rechenprozesses, der menschliche Kreativität allenfalls imitieren könne und sich vor allem bei Stilen und Werken von
Künstler*innen unverschämt, wenn nicht illegal bedienen würde.
Ist die anthropozentrische, ja kunstreligiös-elitäre Hervorhebung menschlicher Schöpfungskraft berechtigt, oder gibt es künstlerische Werkprozesse, die denen der Bildgeneratoren ähnlich sind und
dennoch als eindeutige Beispiele menschlicher Kunstschöpfung gelten? Betrachtet man die geistigen Prozesse menschlicher Bildschöpfungen genauer, zeigen sich nämlich einige Unschärfen im Versuch
einer klaren und eindeutigen Abgrenzung zum Vorgehen der Bildgeneratoren.
In der bildenden Kunst mag ein Vergleich mit dem Surrealistischen Automatismus naheliegend sein, aber das wäre abwegig. Diese Methode wurde aus dem automatischen Schreiben („Écriture automatique“) auf die bildende Kunst übertragen, bei der das Bewusste im Werkprozess zugunsten des Unbewussten unterdrückt werden sollte. Rechenmaschinen haben aber weder Bewusstsein noch Unterbewusstsein, von der allzu gewagten Herleitung des Unbewussten zu Rechenprozessen ganz zu schweigen.
Bilderrauschen
Für die weiteren Überlegungen zunächst ein Blick auf die Vorgehensweise der Bildgeneratoren, hier als grob holzschnittartige Zusammenfassung am Beispiel von DALL-E 2. In den Fußnoten habe ich weiterführende Links zur technischen Vorgehensweise der Bildgeneratoren zusammengefasst [1].
Grundlage ist ein System mit Millionen von Bildern („CLIP“), das auf die Relevanz der Text-Prompts auf die Bildinhalte trainiert wurde. Dann wird mittels eines anderen Systems („GLIDE“) die möglichst übereinstimmende Semantik von Text- und Bildinhalt gesucht. Entscheidend, auch im Zusammenhang mit diesem Abschnitt, ist dabei die Verwendung eines sogenannten Diffusionsmodells. Dabei wird in Schleifen ein Rauschen erzeugt und wieder entfernt, um so im Zusammenspiel mit den Schritten zuvor stets völlig neue Bilder zu generieren. Selbst bei mehrfachen Wiederholungen mit einem Prompt werden nie zwei identische Bilder erzeugt.
In diesem Zusammenhang ist auch ein Plagiatsvorwurf gegenüber den die Bildgeneratoren zweifelhaft und eine Klage vermutlich folgenlos. Was die meisten Tools generieren, sind unbekannte
Bilder. Sie können einen Stil von im Prompt angegebenen Künstler*innen umsetzen, aber sie kopieren oder plagiieren keine existierenden Motive. Das Diffusionsmodell verhindert sogar
dieses Risiko. Bis heute sind die Tools (noch) nicht in der Lage, auch nur ansatzweise akzeptable Kopien oder Plagiate zu schaffen, die in juristischem Sinne als Übernahme von Werken bekannter
Künstler*innen gelten würden. Die Ergebnisse erinnern an solche Werke, aber auch hier eher als Imitation denn als eindeutige Zuordnung eines konkreten, individuellen Stils.
Wenn das OLG Hamm in einem Urteil vom 24.08.2004 (ger. Az.: - 4 U 51/04) festgestellt: „Die Übernahme von am Computer erstellten Grafiken, Farbtönen und Formatierungen für eine Webseite verstoßen nicht gegen das Urheberrechtsgesetz, weil das Design von Webseiten in der Regel die für einen Urheberrechtsschutz notwendige Schöpfungshöhe nicht erreicht“ ist die Frage berechtigt, ob einem Tool zur Generierung von Bildern die Fähigkeit zu einer Urheberrechtsverletzung überhaupt zugesprochen werden kann, wenn schon eine von Menschen gestaltete Website keine Schöpfungshöhe erreicht. Selbst die Übernahme eines Bildteils aus einem urheberrechtlich geschützten Werk stellt nicht automatisch eine Urheberrechtsverletzung dar. Im März entschied das Berliner Landgericht, dass ein von Maler Martin Eder eindeutig kopierter Baum des Computerkünstlers Daniel Conway durch collagenartige Integration in ein neues Werk als Pastiche zulässig ist.
Ein Sonderfall bei den Ergebnissen der Bildgeneratoren sind Illustrationen im Anime-Stil, die jedoch auf formal strengen Gestaltungsprinzipien in der Umsetzung beruhen. Schon seit rund 20 Jahren gibt es zahlreiche Anleitungsbücher und Video-Tutorials für Anime-Zeichnungen oder -Comics. Hier stellt sich die Frage, inwieweit ein nach festen Regeln vorgegebener, kunsthandwerklicher Stil überhaupt eine Schöpfungshöhe im Sinne der bildenden Kunst darstellt und deshalb als eine von wenigen Ausnahme durch die ansonsten stilistisch beschränkten Bildgeneratoren ebenfalls sehr genau umgesetzt werden kann.
Es gibt jedoch auch Grauzonen am Rande zum Plagiat, ein bekannt gewordenes Beispiel ist das Werk des Illustrators Greg Rutkowski, dessen Motive recht eindeutig in den Ergebnissen der Bildgeneratoren wiederzufinden sind. Rutkowski fordert zurecht die Verantwortung der Plattformbetreiber ein und schlägt vor, dass lebende Künstler*innen aus den Datenbanken ausgeschlossen werden sollten. Eine Opt-Out-Möglichkeit wäre hier sicher die beste Lösung, unabhängig vom Aufwand für die Betreiber der Bildgeneratoren.
Farbenchaos und Blots
Auch in der bildenden Kunst gibt es Beispiele der Bildschöpfung, die dem Vorgehen der Bildgeneratoren ähneln, obwohl sie aus der Vormoderne stammen und mit technischen Hilfsmitteln nichts zu tun
haben.
Im 17. Jahrhundert berichtet der Maler und Kunsttheoretiker Samuel van Hoogstraaten (1627-1678) wohl eher anekdotisch über einen Künstlerwettstreit zwischen François Knibbergen, Jan van Goyen und
Jan Porcellis mit dem Ziel, an einem Tag ein Landschaftsgemälde zu vollenden. Als Hintergrund des Wettstreits ist hier anzumerken, dass sich im 17. Jahrhundert in den Niederlanden eine frühe Form
des modernen Kunsthandels entwickelt hatte, Zeit und Effizienz bildeten dabei wichtige ökonomische Faktoren. Jan van Goyen legte demnach zuerst grob und rasch Farbflächen an, um in diesem Chaos
seine Landschaft zu erkennen und diese dann zu vollenden. Knibbergen malte sein Bild Zug um Zug und Bildbereich für Bildbereich. Porcellis vollendete sein Bild zunächst vollständig im Kopf.
Obwohl er als Letzter mit der Arbeit begann, war er für Hoogstraaten der Sieger, dessen Bild eine „ausgewählte Natürlichkeit“ besessen habe.
Hoogstraaten akzeptierte das unkonventionelle Vorgehen van Goyens als gleichwertige Methode der Bildfindung. Die beiden anderen Künstler malten das, was sie entweder als Vorlagen für die
Bildbereiche in ihren Köpfen hatten (Knibbergen) oder zunächst als detaillierte Gesamtkomposition gedanklich antizipierten (Porcellis).
Miriam Volmert schreibt in ihrem Artikel Vom Chaos der Farben zum Blot, (Hier der Link zur PDF):
„Das imaginative Erschaffen einer Landschaft erfolgt bei van Goyen erst auf der Basis einer Auslagerung, die die gesamte farbige Gefasstheit der Landschaft bestimmt und deren akzidentielles
Ausmaß letztlich unklar bleibt. Statt einer Leonardos Ausführung folgenden kontemplativen Anregung der Imagination durch das Betrachten von rein zufälligen natürlichen Fleckenstrukturen [der
Künstler solle etwa in den Strukturen verwitterter Mauern und geäderter Steine lesen und er werde ganze Landschaften und Schlachten entdecken, N.P.] und einer sich dann daran anschließenden
inneren Ausarbeitung eines Bildkonzepts bindet dieses direkte Auftragen eines eigenen »Chaos der Farben« eine Dynamisierung der Schaffensvorgänge, die auch die Rolle der memoria
[Gedächtnisspeicher] überdenken lässt: So erscheint diese weniger als ein allen weiteren Vorgängen zugrunde liegender Speicher denn als eine (wieder)erkennende Erinnerungskraft, die am Akt des
Sehens und Schaffens selbst in einem unmittelbareren Maße beteiligt wird.“
Interessant als Analogie zum Vorgehen der Bildgeneratoren mittels Diffusionsmodellen wird hier von Vollmer beschrieben, dass es sich bei van Goyens Vorgehen um eine Art des zielgerichteten
Zufalls handelt, das „Chaos der Farben“ wird zu einer Zwischenstufe des Unklaren, Ungefähren, um aus dem inneren Bildspeicher des Künstlers immer wieder neue Variationen von Formen und Details zu
generieren.
Das anfängliche Chaos und die Funktion des Zufalls bei van Goyen ließe sich schon als Analogie zum Vorgehen der Diffusionsmodelle betrachten, die das Rauschen zwar zunächst den fest zugewiesenen
Bildern hinzufügen, dann aber wieder so weit entfernen, bis das hinreichende Ergebnis erzielt wird. Noch evidenter wird das allerdings bei dem Künstler und Kunsttheoretiker Alexander Cozens, der
in der zweiten Hälfte des 18. Jahrhunderts eine Methode entwickelte, um Landschaftsbilder aus monochromen Flächen zu komponieren. Er legte 16 Platten mit verschiedenen, aus Blots bestehenden
Vorlagen an, die er in einem Buch veröffentlichte.
Cozens Technik erinnert ein wenig an chinesische Tuschzeichnungen, haben mit ihnen und ihren Traditionen aber nur wenig zu tun. Künstler sollten aus den Blots auf Papier vor allem die Gesamtheit des Bildes im Auge behalten und weiterentwickeln. Der Kunsthistoriker Werner Busch schreibt in einem Text zu Cozens (Hier der Link zur PDF-Datei) vom gelenktem Zufall:
„in zweifacher Hinsicht […]. Erstens entwirft sich der Künstler seine abstrakten, der Assoziation offenen Strukturen selbst, und zweitens tut er dies nicht unvoreingenommen. Cozens' erste
Regel zur Anfertigung eines blot lautet unmissverständlich: Erfülle deinen Sinn intensiv mit einem Gegenstand.“
Es geht Cozens also nicht um völlig freie Ansammlungen von Farbklecksen, nicht um die Wiedergabe einer äußeren Landschaft und auch nicht um das bloße Abrufen erlernter oder vorher sorgsam
kopierter Landschaftsbilder aus dem inneren Bildspeicher. Der Zufall soll bewusst zielgerichtet auf ein Bildergebnis fokussiert sein und ist nicht mit Leonardos Assoziationsmethode oder
Rorschach-Interpretationen zu verwechseln. Ziel und Gegenstand ist die bestimmte Erscheinung einer Landschaft. Dadurch werden laut Busch „systematische Abstraktionen“ ermöglicht, die
eine artifizielle Authentizität der im Atelier entworfenen Bilder gewährleisten.
Wenig überraschend, dass sich Thomas Gainsborough und vor allem der späte John Constable mit Cozens Methode beschäftigt haben. Beide Künstler hatten sich von der idealtypischen Landschaftsmalerei abgewandt und legten, wie Cozens es empfahl, Wert auf die Gesamterscheinung ihrer Gemälde.
Systematische Abstraktionen und gelenkter Zufall in aus Bildspeichern trainierten Modellen für die Erscheinung von neu geschaffenen Bildern? Natürlich gibt es keinerlei Korrelation zwischen van Goyens oder Cozens Methoden und den Diffusionsmodellen der Bildgeneratoren, aber es zeigt sich, dass das Prinzip des systematischen, geregelten Zufalls in der Bildschöpfung keinesfalls neu ist, auch nicht in der Kunst.
Wie verhält sich aber mit der letzten Instanz der Künstler*innen selbst, die am Ende der kreativen Prozesse den eigenen Kunstanspruch festlegen? Darum geht es im vierten Teil der Artikelserie.
[1]
Links zu Youtube und Websites:
- How does DALL-E 2 actually work?
- How AI Image Generators Work (Stable Diffusion / Dall-E)
- How DALL-E 2 Actually Works
Genauer zum Thema Diffusion und zur Geschichte von Text-zu-Bild-Generatoren: