Wo bitte geht’s nach Hollywood?

Künstliche Intelligenz kann schon seit langem Bilder erschaffen und optimieren. Einer der ersten, der sich intensiv mit diesem Thema befasst hat, war Klemens Oezelt – sein Output ist so gut, dass sogar Hollywood und Netflix seinen Support suchen. „kontur“ hat ihn in seinem Loft-Büro in Wien getroffen.
Klemens Oezelt startete seine Fotografenkarriere ganz klassisch mit einer Knipse-Kamera, gefühlt eine Million Jahre später – was die rasante Evolution seines neuen mächtigen Mediums skizziert – benutzt er eine Technologie, von der manche Leute glauben, sie sei das Tor zum Ende dieser Welt. Doch im Gegensatz zu vielen seiner Kollegen sieht der gebürtige St. Pöltener die Möglichkeiten der Künstlichen Intelligenz (engl. AI = Artificial Intelligence) rosarot. „Als KI zum ersten Mal auftauchte, kannte sich keiner aus, aber mich hat es von Anfang an fasziniert, weil ich das Potenzial sofort erfasst habe. Obwohl 95% meiner Freunde damals sagten, dass es sinnlos und reine Zeitverschwendung sei, habe ich mich acht bis zehn Stunden am Tag reingekniet.“ Die Vielfalt an Möglichkeiten und die Komplexität des Programms, hauptsächlich Midjourney, wecken seinen Pioniergeist und seine Experimentierfreude: „Es gab keine Anleitung. Jeden Schritt habe ich mir erarbeitet und diese Lernerfolge haben mich immer weiter motiviert.“ So startete er als einer der Ersten im Land irgendwann einen AI-Instagram-Account – mit ungeahnten Folgen.
Eines Tages meldete sich ein Production Designer aus Los Angeles, der schon für Hollywood Filme rund ums DC Universe die surrealen Welten erschuf. „Es gibt Scouts, die weltweit nach AI-Accounts suchen. Irgendwann sind sie auf mich gestoßen und haben gefragt, ob ich nicht bei einer neuen Netflix-Produktion mitarbeiten möchte.“ So erfand er eine eigene Fantasy-Welt, in der Fabeltiere wie Waschbären & Co. in einem Setting á la „Der König von Narnia“ regieren, denn mittlerweile sind auch KI produzierte Filme keine Vision mehr. „Die Art meiner Bilder ist dafür geeignet – man kann ihnen Leben einhauchen.“ Inzwischen hat er an verschiedenen Storyboards zu KI-generierten Serien und Filmen mitgewirkt und eigene Charaktere entwickelt, unter anderem für einen der wohl bekanntesten Köpfe aus Hollywood. Parallel dazu lässt er für eine große Wiener Agentur KI-generierte Werbeträume wahr werden. Doch Klemens Oezelt bleibt bescheiden. Sein Wunsch: „Einfach weiter in das virtuelle Rabbit Hole eintauchen.“

Sprachbezogene konzeptuelle Kunst.
Die Schwierigkeit bei der Erstellung eines KI-generierten Bildes ist die sprachliche Kunstfertigkeit, die sich Oezelt in über 20.000 Prompts – also schriftlichen Befehlen für die Erstellung von Fotos – erarbeitet hat. „Durch das intensive Auseinandersetzen mit der Materie habe ich irgendwann herausgefunden, wie man mit dem Tool spricht: Dabei beeinflusst allein die Reihenfolge der Worte am Ende das Ergebnis und auch mein spezifisches Fachwissen aus der Retusche hilft beim Color Grading.“ Sein Know-how aus der Fotografie, Malerei sowie dem Fantasy- und Gamingbereich ist ebenfalls dienlich, etwa beim Setzen der richtigen Lichtpunkte.
Mit derzeit maximal 400 Wörtern müssen die Mimik einer Person, ihre Bewegung, Kleidung, Umwelt, Gegenlicht, Tageszeit, etc. so formuliert werden, dass die KI am Ende das gewünschte Ergebnis ausspuckt. „Die Herausforderung besteht nicht darin, irgendein schönes Bild zu erzeugen, sondern ein exakt der Vorstellung entsprechendes und in der Folge ein komplettes Storyboard – also eine ganze Geschichte, mit über 1500 verschiedenen Fotos – in der eine Person aus verschiedensten Perspektiven und in unterschiedlichsten Situationen gezeigt wird und diese immer gleich aussehen muss. Nichts ist zufällig“, erklärt der Experte, der die komplexen Szenarien bereits im Vorfeld in seinem Kopf hat. Im Rahmen des Prompt Engineerings kann eine Darstellung unendlich oft wieder hochgeladen werden, um sie immer weiter zu verändern oder die Geschichte fortzusetzen, d. h. die Hauptfigur erhält ein Schwert oder es kommen weitere Charaktere hinzu. „Ich schmiede das Bild inhaltsbasiert in die gewünschte Richtung. Mit der Zeit habe ich gelernt, welche Wörter wichtig sind und wie komplizierte Details abstrakt beschrieben werden können – es ist quasi eine eigene Sprache. Alles, was im Prompt nicht erwähnt wird, stellt die KI letztlich zufällig dar. Deswegen reduziert sich meine Eingabe auf das Wesentliche“, so die Essenz seines impliziten Wissens.

Mit diesem Know-how reist er nun virtuell durch die Zeit und erzeugt Bilder vom Bau der Chinesischen Mauer oder erweckt das Buch der fünf Ringe von Miyamoto Musashi, über japanische Kampfkunst, zum Leben. „Wenn ich etwas generiere, habe ich das Gefühl, dass ich in mein Unterbewusstsein eintauche und genau die richtigen Dinge heraushole. Es ist eine Art visionäre Kunst, bei der sich die eigene Individualität und Subjektivität letztlich im Output abbilden und die Grenzen nur mehr im eigenen Verstand liegen“, bringt Klemens Oezelt das unerschöpfliche Potenzial auf den Punkt. Charmante „Makel“ wie Sommersprossen, Narben, Falten, Nasenhaare inklusive, denn diese lassen das Bild letztlich nur noch realer und sympathischer erscheinen.
Wenn Oma in den Boxring steigt.
Neben den Storyboards und Agenturaufträgen arbeitet der 38jährige derzeit an der Illustration eines Kinderbuches, an abstrakten Bildern, die entfernt an die surrealen Szenerien und Gemälde von Salavdor Dali erinnern sowie an unmöglichen Darstellungen, sprich Inhalten, die so in der Realität nicht existieren wie etwa Omas auf einem Jetski, im Boxring oder einem Stahlgerüst eines New Yorker Hochhauses: „Der Aufwand, um eine solche Szenerie tatsächlich zu shooten, wäre enorm, wenn nicht sogar undurchführbar. KI als Hilfsmittel macht alles so viel schneller und einfacher. Man kann die Arbeit zu jeder Zeit durchführen und mit den richtigen Eingaben verbinden sich Realität und Fiktion auf wunderbare Weise. Auch (Werbe-)Konzepte und Ideen können rasch und kostengünstig umgesetzt werden, um Kunden oder Geschäftspartnern einen ersten visuellen Eindruck zu vermitteln“, unterstreicht der KI-Profi die Vorteile.

Lichtgeschwindigkeit.
Beeindruckend ist in diesem Zusammenhang tatsächlich die Schwuppdizität, mit der sich die neue Technologie perfektioniert: „Wir hatten noch nie ein Werkzeug, das sich schneller weiterentwickelt hat, als wir es tun. Es macht Überstunden, während wir schlafen“, fasst Klemens Oezelt die Evolution des Programms zusammen. Das Tempo der Updates ist rasant und mit jeder Verbesserung ändert sich der Algorithmus, was wiederum die Formulierung der Prompts beeinflusst.
Apropos Wortwahl:
Die KI ist auf eine positive Sprachformulierung getrimmt und beim Thema Gewalt und Nacktheit durchaus sensibel, d. h., Worte wie „schießen“, „Schwert“ oder „nackt“ sind geblockt. „Wenn das Storyboard nun aber vorgibt, dass jemand aus der Nase blutet oder ertrinkt, muss es geschickt mit positiv besetzten Begriffen umschrieben werden, etwa mit Marmelade statt Blut oder Ertrinken statt Tauchen – viele geben einfach die falschen Prompts.“ Was uns das sagt? Am Ende ist jede Technologie eben nur so gut, wie der Mensch, der sie bedient… aber wer weiß, vielleicht emanzipiert sich die KI irgendwann, wird empfindungsfähig, und distanziert sich von der natürlichen Intelligenz.
Text: Christiane Schöhl von Norman
Fotos: Klemens Oezelt/www.studioparadiso.at