Kunst inn, kunst ut

Ordskiftet om hvorvidt datamaskiner kan være kreative, tilspisser seg stadig.

Høsten 2022 gjorde TikTok-brukeren Robotoverlords furore med en rekke bilder under tittelen «The last selfie ever taken». Bildene er skremmende, og kunne vært konseptskisser til en postapokalyptisk film. De viser humaniode skikkelser med mørke hull til øyne, noen kledd i filler, andre i boblejakker. Disse skapningene er utstyrt med mobiltelefoner, og tar bilde av seg selv. I bakgrunnen vises ruiner, branner og eksplosjoner. Kanskje ser vi (jamfør navnet «Robotoverlords») en verden der en løpsk kunstig intelligens har tatt makten og gjort verden ulevelig for menneskene.

Robotoverlords selv har ikke malt disse bildene. De er generert av en kunstig intelligens. Robotoverlords’ bildegalleri er del av en ny bevegelse på sosiale medier, der folk deler bilder laget av kunstig intelligens-systemer som Midjourney eller Dall-E2. 

Metoden er enkel: Man oppretter en bruker, og skriver inn noen ord som en «bestilling». Deretter foreslår programmet en rekke bilder som svar på teksten. Disse programmene har eksistert en stund, men gjorde et voldsomt sprang i kvalitet for et års tid siden. Siden er de blitt enda bedre, og stadig flere brukere har fått tilgang til dem, først med prøvekontoer for utvalgte, deretter gratis prøvekontoer for hvem som helst, og nå full tilgang for alle som vil betale. 

Når serien «The last selfie ever taken» ble ekstra populær, var det nok fordi motivet passet så godt til denne nye kunstformen. Bilder av endetiden får en ekstra aura av relevans når de er laget av en kunstig intelligens, siden KI i seg selv så ofte opptrer i framtidsfantasier. I tillegg er en utbredt trope i science fiction at menneskene lager supercomputere for å få endegyldige svar på vanskelige spørsmål, eller beregne hvordan framtida vil fortone seg. Når dataprogrammet leverer sitt bilde av apokalypsen, er det som noe objektivt, presist og matematisk. Datamaskinen har avgitt sin utregning, sin dom over menneskeheten.

Vil kunstnere bli arbeidsledige?

Robotoverlords’ bilder – og mange flere som dem – har i høst og vinter gitt et nytt skyv til debatten som de siste årene har foregått i enkelte kretser om hvorvidt datamaskiner kan være kreative. Vil kunstnere bli arbeidsledige snart, når programmer spyr ut bilder på egen hånd? 

Et tidligere akselerasjonspunkt for denne diskusjonen var da auksjonshuset Christie’s i 2018 oppnådde en salgssum for sitt første «KI-kunstverk», «Portrait of Edmond de Belamy», på 4,5 millioner kroner. Bildet var laget av en algoritme, og programmeringskollektivet som sto bak algoritmen hadde et motto: «Kreativitet er ikke bare for mennesker.» Men hva slags kreativitet lå egentlig til grunn for dette maleriet?

Algoritmen som lagde portrettet av Belamy var et såkalt adversarial GAN-nettverk. Programmet består av to deler, en som genererer bilder, og en annen som sensurerer dem. «Kritiker»-programmet er trent på en database av tusenvis av malerier, og avviser alt som ikke «passer inn» i den samlingen. Dermed vil kritiker-algoritmen trene opp bildeskapingsalgoritmen til å lage bilder som mer og mer ligner på et slags minste felles multiplum av treningsmaterialet.

Den oppvakte leser vil legge merke til at den kreativiteten som beskrives her minner om den som bedrives av kunstforfalskere eller pastisjmakere – å lage et kunstverk som ligner tilforlatelig på noe som allerede finnes. Å lage noe som kan «passere» som en Heinrich Campendonk eller en Claude Monet.

Noen vil innvende at dette nærmest er det motsatte av kreativitet, om vi med «kreativitet» mener å lage noe «originalt». Andre vil si at forestillinger om «originalitet» og «autentisitet» er naive myter, og at programmets virkemåte beskriver ganske godt det meste av kunstnerisk aktivitet, både for enkeltindivider og kunstinstitusjonen: Målet er å frembringe noe som er gjenkjennbart som tilhørende en sjanger, med nok variasjoner til at det framstår som noe nytt.

Det begge disse forståelsene av kreative uttrykk synes å glemme er nettopp at de er «uttrykk», altså at verket lages av et subjekt som uttrykker noe, at noen skaper med en intensjon, kanskje til og med et budskap. I tilfellet med Christie’s-bildet ble alt det meningsbærende arbeidet gjort av mennesker: De valgte et motto utformet for å skape debatt og oppmerksomhet. De fant på å sette algoritmen som «signatur». De diktet opp et navn på bildet, med referanse til den ikke-eksisterende herr Belamy. De bestemte seg for å selge det for penger. Alt som gjorde verket til et konseptuelt kunstverk med en god historie og filosofisk sprengkraft, var menneskeskapt. Det datagenererte innholdet på lerretet var utbyttbart – som så mange maskinproduserte readymades siden Duchamps urinal.

Dårlige portretter

Har programmer som DALL-E og Midjourney oppnådd noe som ligner mer på menneskelig kreativitet? Har de kommet nærmere å gjøre kunstnere arbeidsledige? Disse algoritmene er litt forskjellige fra den bak Belamy-bildet, siden de baserer seg på såkalte «diffusjonsmodeller». Det vil si at de er trent opp ved at programmene gradvis innfører vilkårlig støy i bilder, for så å reversere prosessen. Programmene lærer altså hvordan de kan omforme vilkårlig støy, en piksel om gangen, inntil helheten blir noe de gjenkjenner som et «meningsfylt» bilde. Bildene er i tillegg formet ut fra hvor godt de svarer til ordene i brukernes «bestillinger». Programmet prøver altså å lage bilder som med en viss sannsynlighet ville blitt ledsaget eller beskrevet av ulike ord eller fraser, som «astronaut», «sint» eller «som malt av Salvador Dalí».

Programmenes utregninger baserer seg på noe annet som allerede finnes. Og de har ikke noe begrep om hva som skal skje med kunsten etter at den er skapt. Kunst med intensjon forholder seg til fortida, men også framtida. Den har en avsender med en ambisjon om at folk skal bli berørt på en viss måte, tenke nye tanker, endre sine handlinger. Kunsten skal få følger.

MidJourney lager ganske dårlige portretter av meg. Statistisk sett har programmet beregnet (ut fra navnet?) at jeg er en hvit, skjeggete, middelaldrende mann. Det er for så vidt helt riktig. Av Taylor Swift lager både Midjourney og DALL-E langt bedre bilder. Det skyldes at det finnes mange bilder av henne på nettet, og internettet er den virkeligheten programmene forholder seg til. 

MidJourney og DALL-e bruker hemmelige datasett, så det er umulig å vite hvor alle bildene kommer fra. De er skrapet sammen fra store deler av Internett, og sortert og vektet etter kriterier vi ikke kjenner til. Men som med alle slike visuelle datasett, er det grunn til å tro at de består av bilder som gjenspeiler skjevheter ellers i samfunnet. I en artikkel i nettmagasinet Motherboard fra april i fjor illustrerer journalist Janus Rose poenget ved å be DALL-e om bilder av «CEO», «Nurse» og «Personal assistant». I første tilfelle er responsen en rekke bilder av hvite menn i dress, i de to siste forestiller alle bildene kvinner.

Programmererne er selvsagt klar over problematikken, og jobber aktivt for å rette opp en del eksisterende skjevheter. Dette gartnerarbeidet er på sett og vis prisverdig, men det står i et paradoksalt forhold til det som for øyeblikket er noe av tjenestenes appell. Disse programmene kjenner jo ikke virkeligheten utenfor nettet, og vi vet at de ikke kan «beregne» noen «sanne» svar, som om de eksisterte i en novelle av Isaac Asimov. Serier som «The last selfie ever taken» er et destillat av «alt på internettet», en slags «wisdom of crowds» for visuelle uttrykk. Jo mer «korrigert» datasettet er, jo mindre «objektiv» blir algoritmen, og jo mindre kan vi fantasere om at det er «internettets kollektive underbevissthet» som manifesterer seg i piksler. Med andre ord skaper nettopp fraværet av et kunstnersubjekt bildenes fascinasjonskraft. Det er mylderet av alle digitale menneskelige ytringer, fascinasjoner, feil og fordommer som har skapt en kollektiv apokalypsefantasi som i bildene til Robotoverlords, eller bekrefter kjønnsstereotypienes digitale fotavtrykk, som i CEO-bildene.

Som konseptuell kunst

Vi har de siste årene blitt vant til å se «data-kunst» uten subjektive avsendere: Videoer som resiterer nonsenstekster spyttet ut av en algoritme, som Sascha Pohflepps Recursion (2016). Skulpturer som beveger seg i intrikate mønstre basert på hermetisk informasjonsutveksling, som Joris Strijbos’ Axon (2016). Eller planter som lager musikk basert på programmer som oversetter overflatespenning til toner, som hos Mileece eller Data Garden. 

Slike datagenererte kunstverk befinner seg i en moderne tradisjon som ønsker å minske det menneskelige subjektets innflytelse, eller å unngå dets innskrenkninger, ved å overlate kunstneriske valg enten til tilfeldigheter eller til systemer. Konseptuell kunst har jobbet på denne måten siden 60-tallet. Tanken var at man ved hjelp av maskiner, systemer eller tilfeldigheter kunne bevege seg utenfor intuisjonens fengsel. Intuisjonen er jo tross alt bare vårt biologiske system for mønstergjenkjenning, ytterligere begrenset av kulturelle rammer og konvensjoner. Hvorfor skulle vi godta de begrensede mulighetene dette systemet byr på? Nei, for å oppdage noe nytt og forfriskende, var tanken at man måtte gi slipp på de formene og klisjeene som er nedfelt i vår subjektive intuisjon.

Samtidig har denne tradisjonen alltid vært avhengig av en kunstnerpersona som avsender, et menneske som gjør et heroisk forsøk på å bryte ut av det subjektive, ut av det tradisjonelle, det meningsbærende, eller det figurative. Kunst med innslag av tilfeldigheter, som Marcel Duchamps Three Standard Stoppages (1913-14), John Cages Not Wanting to Say Anything About Marcel (1969) eller Jackson Mac Lows dikt, var i alle fall delvis underordnet kunstnerens aura. Duchamp og Cages verk – i likhet med jeg-er-en-maskin-Warhols hendelsesløse verk – ble, paradoksalt nok, lest som uttrykk for de ikoniske kunstnernes filosofiske kraft, deres samfunnsdiagnose og deres genialitet. 

Klassisk konseptkunst og en del moderne skulpturkunst handler først og fremst om å komme på en idé: Jeff Koons fikk i 1994 ideen «giant balloon dog sculpture made in metal», og satte håndverkere til å lage skulpturene. Idag kan alle formulere en tilsvarende «prompt» i MidJourney, og få et ferdig kunstverk i løpet av sekunder. Men betyr det at alle nå kan bli en kunstner? Er Robotoverlords neste generasjons kunstner, fordi hen putter de rette ordene inn i maskinen? Sannsynligvis ikke. Hen har ikke den nødvendige historien eller statusen som kunstner innenfor institusjonen, og blir derfor i høyden en amatørkunstner.

Kommer noen til å savne illustratørene?

Det er altså lite å frykte for denne verdenens Bjarne Melgaarder eller Damien Hirster, eller andre kunstnere hvis verk kunne tenkes å dukke opp på en Christies’-auksjon. Som med alle andre stadier i automatiseringens historie, er det mindre synlige og mer sårbare grupper som blir rammet. 

Mange av artiklene om KI-programmer som nå trykkes, har til felles at illustrasjonene er laget av KI-programmene selv. Også denne. Allerede nå lurer illustratører over hele verden på om de kommer til å beholde levebrødet sitt. Kommer noen til å savne dem? 

Få har savnet de produktfotografene som er blitt arbeidsledige de siste tiårene. Om man i dag ser et reklamebilag med bilde av et par hodetelefoner, en boks karamellis eller en sirkelsag, er det sannsynlig at det som ser ut som et fotografi i realiteten er en av de troverdige «3D-renderingene» som i 2022 med letthet kan genereres basert på digitale produksjonstegninger.

Det går en linje fra de første spinnemaskinene som erstattet mennesker i Englands tekstilindustri på 1700-tallet, via traktorenes industrialisering av jordbruket, til datamaskinene som de siste tiårene har tatt kontoristenes plass. Nå står de kreative bransjene for tur. De aller mest generiske formene for innhold vil være de første til å automatiseres – for eksempel artikler eller nettsider som kun trenger et bilde som passer til «direktør» eller «sykepleier». En aviskarikatur eller illustrasjon til en artikkel som denne vil være vanskeligere å erstatte, nettopp fordi vi er vant til at illustrasjonen skal formidle en idé som kommer fra illustratørens hode og den skapende akten.

Kunne Midjourney produsere en illustrasjon til denne saken? Jeg prøvde meg med ulike prompter som «AI software taking over illustrators’ jobs in the style of Vagant», eller «Artist imagining AI art in the style of Andreas Töpfer». Resultatet er bilder som er pene og harmoniske, og med velvilje kan sies å alludere til en slags menneske/maskin-dikotomi. Det er vanskelig å fornemme noen klar idé eller vilje bak dem, dessverre. Eller heldigvis.

En ubrutt linje

Den digitale teknologien brukes i dag først og fremst til to ting: 1) Å effektivisere og 2) å øke forbruk. Det første gjelder selvgående biler, programmer som gjenkjenner kvitteringer og automatiske chat-boter. Det går en ubrutt linje fra da maskinene erstattet menneskene i fabrikkene på 1700-tallet, til dagens «strømlinjeforming» av bedrifter. Den andre funksjonen ser vi i alt Facebook og Google gjør – disse selskapene er først og fremst reklamebyråer, som har som hovedoppgave å fange oppmerksomheten vår ved underholdning, og å styre den mot tjenester og produkter som vi kan kjøpe.

Da er det også logisk at de bildene som vil være mest etterspurt – og som programmene vil være flinkest til å lage – er bilder av pene mennesker, omgivelser eller former som egner seg til markedsføring. Omsetningen vil bli påvirket av den reelle prisen på strøm og prosessorkraft, så etter hvert vil nok disse tjenestene bli dyrere. Men de vil nok uansett være billigere enn selv en underbetalt tegner eller en fotograf i Taiwan med Procreate eller Photoshop og internettoppkobling.

Da er vi tilbake ved hvem som skaper verdiene. Reflekterer prisen for å bruke Midjourney den reelle ressursbruken? En ting er kostnadene for selskapet, en annen er miljøfotavtrykket som forårsakes av forbruket av datakraft. Men til syvende og sist er alt dette bygd på et gigantisk datasett som allerede eksisterer, og som selskapene ikke har betalt noe som helst for. 

«Smarte» programmer gir inntrykk av å være smarte på den samme måten som evolusjonen gir inntrykk av å være smart. Ta for eksempel den kompliserte og tilsynelatende sinnrike virkemåten til øynene våre: Ingen tenkte den ut, men mekanismen ble prøvet og feilet fram av de trillionene av skapninger som bukket under gjennom milliarder av år, fordi de ikke klarte å fange opp synsinntrykk, og dermed overlot scenen til de som så litt bedre.

På en lignende måte ligger en stor del av æren for KI-programmenes skaperkraft hos den massive mengden av menneskeskapte bilder som har latt dem prøve og feile seg fram.

Som med alle «smarte algoritmer» blir den viktigste inputen holdt utenfor regnskapet: Hver eneste arbeidstime som er nedlagt av hver eneste fotograf, kunstner, illustratør og modell som er inkludert i de millionene av bilder som programmene har blitt trent på. Fordi hver enkelt av dem har bidratt med relativt lite, er det mulig å trekke på skuldrene av denne urettferdigheten. Den skriver seg inn i en utbredt praksis med å stjele hundrelapper fra mange personer, som til sammen blir til milliarder av dollar for eierne av store selskaper. 

Både mediene og teknologiselskapene liker å framstille den digitale teknologien som «noe nytt som forandrer alt». Men en slik framstilling kan få oss til å glemme det faktum at denne teknologien blir brukt til akkurat det samme som teknologi hovedsakelig ble brukt til i den industrielle revolusjonen og den første IT-revolusjonen: Å flytte og akkumulere verdier. 

Kanskje var det ikke bare det apokalyptiske science fiction-elementet som gjorde at Last selfie-serien spredde seg så hurtig på TikTok. Kanskje hadde det også gjøre med at det dreide seg om selvportretter. En selfie er jo noe vi lager for å uttrykke følelser og kommuniserer dem til andre mennesker. Men i dette tilfellet er altså bildene laget av et dataprogram uten noe begrep om hva mennesker eller følelser er, et program som sorterer piksler på en måte som statistisk sett skal ligne på hvordan piksler har vært sortert på på nettet tidligere, ut fra visse ord. Som det heller ikke forstår betydningen av.

Kanskje den største misforståelsen er å snakke om kunst som om kunsten var et produkt. Kunst som erkjennelsesredskap handler i stor utstrekning om prosessen, om alt kunstneren lærer i arbeidet med verket. Om alt hen lærer i dialog med andre kunstneres arbeid. Om alt vi andre lærer når vi betrakter og snakker om verkene. Å automatisere kreative prosesser gir omtrent like mye mening som å lage en robot som kan ta joggeturen for deg om morgenen. En robot som kan dra på fest med vennene dine i ditt sted. En robot som kan gråte på dine vegne. 

I den grad kunst skal være noe som har med vår virkelige verden å gjøre, og befatte seg med menneskelige behov, oppfatninger og vurderinger, er det vi som må ta eierskap til den.

Europa

Vagant er et skandinavisk tidsskrift for kritikk og essayistikk. Tidsskriftet har litteratur som utgangspunkt, tar for seg alle kunstarter og rommer også idédebatt og kulturjournalistikk.

Redaksjonen utgir fire numre i året, i tillegg til ukentlige oppdateringer av nettsiden. Første nummer utkom i 1988. Siden 2017 utgir redaksjonen tidsskriftet på egen hånd. Vi oppfordrer alle lesere til å tegne abonnement på papirutgaven.

Vagant redigeres etter Redaktørplakaten, og er medlem i Eurozine og Norsk tidsskriftforening.