Guide Kom i gang med Dall-E 2 og Midjourney

«Alle» vil lage AI-«kunst»

Men hva er det for noe?

Dette bildet ble laget av at vi skrev «phasmatodea people on the moon looking down on earth rainbow»

Både The Economist og Cosmopolitan har nylig gitt ut respektive publikasjoner med forsidebilder laget av ulike AI-verktøy, og sosiale medier tilsynelatende flommer over av ulike marerittaktige bilder.

Da undertegnede ble bedt om å skrive en kjapp sak om AI-verktøyene som lager «kunst» på bestilling, endte istedenfor hele den utvidede redaksjonen opp med en ukelang masseproduksjon av AI-«kunst». Men hva i alle dager er det for noe?

Gir deg unike bilder på bestilling

Bilder som lages av kunstig intelligens er egentlig ikke noe nytt, men på veldig få år er det fryktelig mye som har utviklet seg. Tilbake i 2015 kunne en maskinlæringsalgoritme gjenkjenne enkelte objekter i et bilde. Videre var den i stand til å skrive en bildebeskrivelse av hva det var den så – eller gjenkjente. Disse nye AI-verktøyene som nå er blitt så populære, er et resultat av at en rekke forskere ønsket å snu det hele på hodet.

Hva kunne man få til hvis man ga en kunstig intelligens en testbeskrivelse først, som den så kunne lage helt nye bilder av, basert på billedteksten du beskriver?

Resultatet er en ny rekke ulike AI-verktøy, som er i stand til å skape unike bilder, fremfor å kun lage bilder basert på det som finnes i en database.

Hvorvidt disse verktøyene åpner for at man enklere lener seg på autogenererte bilder, fremfor å lage egne illustrasjoner vil tiden vise. Potensialet er der, selv om det per nå fremstår mer som er verktøy som gjør dagene hakket morsommere. Med det sagt nærmer bildene seg en realistisk likhet som er såpass tett på virkeligheten at forskjellen mellom de to blir stadig vanskeligere å oppfatte.

Den mest kjente er kan hende Dall-E, hvis navn er en sammenstilling av den surrealistiske kunstneren Salvador Dalís navn, og den fryktelig søte roboten Wall-E. Dall-E er både kommet i ny utgave – Dall-E 2, samt som en «mini»-versjon, som er den man ser på sosiale medier.

Men det finnes en rekke andre også, som for eksempel Midjourney.

Både Dall-E 2 og Midjourney er i beta-stadiet enda, men du kan få tilgang til dem begge. Mens Midjourney er enkelt tilgjengelig for alle, må du stille deg på en lang venteliste for å få tilgang til Dall-E 2. Vi fikk ikke pressetilgang fort nok, men vi har heldigvis verdens beste lesere som låner oss sin private tilgang. Hvilket betyr at vi kan vise de reelle forskjellene her.

Dall-E 2 versus Midjourney – hva er best?

Dall-E 2 «devil drinking coffee in a cafe surrounded by war» Midjourney «devil drinking coffee in a cafe surrounded by war»

Hvilket av dem som er «best» er umulig å svare på. De har ulike funksjoner og kvaliteter, og fungerer således til ulike oppgaver. De reagerer også svært ulikt på ulike «prompts», alle teksten du ber den om å lage et bilde av.

Vi oppdaget for eksempel at Dall-E 2 krevde kortere beskrivelser for å være presis, mens Midjourney inkluderte flere tekstlige elementer. Eksempelvis prøvde vi oss på den samme teksten «devil drinking coffee in a café surrounded by war» (djevel drikker kaffe på en kafé omringet av krig), med svært ulikt utfall hos de to ulike modellene.

Dall-E 2 henfaller også enklere til animasjoner, mens Midjourney i større grad valgte detaljert realisme i sine bilder. Hvilket ofte hadde en dramatisk effekt i bildene.

Midjourney «Winnie the Pooh having a party with Donald Trump» Dall-E 2 «Winnie the Pooh having a party with Donald Trump»

Begge plattformer har strenge retningslinjer for hva som er lov og ikke lov, men det er likevel ulikt hva de respektivt vektlegger. For eksempel får du beskjed om at ord som «naken» ikke er tillatt hos Midjourney, mens det hos Dall-E 2 ikke er tillatt å lage bilder av kjente personer. Akkurat dét er derimot helt uproblematisk hos Midjourney.

Nå vet vi hvorfor Munch skriker

Dall-E 2 har derimot noen funksjoner som gjør at den skiller seg godt ut fra Midjourney. Den gjør deg blant annet i stand til å fylle ut allerede eksisterende bilder.

Ved å laste opp et bilde, og velge funksjonen «Add generation frame», så får du anledning til å skrive inn stikkord for hva som finnes utenfor rammen. I et av verdens mest kjente kunstverk «Skrik» av Edvard Munch, har vi derfor endelig funnet ut hvorfor karakteren på broen skriker. Det er nemlig en romveseninvasjon like ved.

Dall-E 2 skal også kunne skape nye bilder basert på eksisterende verk fra ulike kunstnere. Det er derimot varierende hell med hvor dyktig den er på å faktisk etterligne stilen til de respektive kunstnerne.

Vi forsøkte å skape nye verk basert på stilen til henholdsvis Edvard Munch, Yayoi Kusama, Gustave Courbet og Marina Abramovic. Samtlige fikk beskrivelsen «A painting by [kunstnerens navn] of aliens invading earth». Resultatet ser du under.

Midjourney A painting by Edvard Munch of aliens invading earth» Midjourney A painting by Yayoi Kusama of aliens invading earth» Midjourney A painting by Marina Abramovic of aliens invading earth»

Hvordan kommer man i gang?

Begge disse to plattformene har sine respektive kvaliteter, men der Dall-E 2 er intuitiv og brukervennlig, krever Midjourney en litt utfyllende «hvordan gjør jeg dette»-liste.

Derfor, med Dall-E 2 kreves innloggingstilgang. Denne må du rett og slett bare vente på. Alt etter det er relativt enkelt. Du får anledning til å lage opptil 50 ulike bilder før «testperioden» din avsluttes og du må kjøpe et abonnement. Dette gjelder også for Midjourney, men her får du kun tilgang på 25 mulige bilder.

Både Dall-E 2 og Midjourney baserer seg på tekstlige beskrivelser som genererer bilder. Dette er som nevnt intuitivt for Dall-E 2, men for Midjourney må du gjennom en liten prosess. Den ser slik ut:

Når du er kommet til Midjourneys nettside velger du «Join Beta». Herfra trenger du å logge inn på din Discord-konto (eventuelt lage deg en)

Vel inne søker du opp en eller annen «newbie»-konto (det finnes hundrevis, prøv for eksempel newbies-25) i søkefeltet øverst til høyre

Skriv inn «/imagine» og dernest teksten du ønsker at den skal generere et bilde basert på

Når du har kommet inn skriver du i meldingsfeltet «/imagine» etterfulgt av billedteksten du ønsker å generere et bilde av

Du vil kunne følge med på hvordan bildet blir til underveis, og når det er ferdig får du opp fire ulike bildealternativer, sammen med en rekke tall og bokstaver.

Trykk på V1–4 for å lage nye variasjoner basert på det utvalgte bildet, eventuelt velg å lage fire helt nye varianter

Trykk på U1–4 for å velge det eller de bildene du ønsker å forstørre. Du vil få anledning til å gjøre noen justeringer på disse, samt gjøre det enda mer detaljert til slutt.

Lykke til!

Under følger et lite knippe av «kunstverkene» til Tek-redaksjonen og våre kollegaer som satt nærme nok til å ville prøve selv.

En liten samling AI-generert kunst fra den utvidede Tek-redaksjonen

Midjourney Midjourney Midjourney