Spelen met AI-systeem DALL-E

Al geruime tijd zag ik de synthetische afbeeldingen van DALL-E voorbijkomen en ik las er veel over. Het was alleen toegankelijk voor genodigden, maar nu mag iedereen ermee spelen. En het is toch anders als je er zelf mee speelt.

De naam DALL-E

DALL-E is de naam die de firma OpenAI gegeven heeft aan hun AI-systeem. De naam DALL-E is een portmanteau van de namen van Pixar-personage WALL-E en de Spaanse surrealistische kunstenaar Salvador Dalí. Een goed gekozen naam voor de vaak surrealistische afbeeldingen die de computer maakt.

DALL-E: Wall-e en Dalí

Wat is DALL-E?

Voor de gebruiker is het software waarmee je met een tekstuele aanwijzing of bestaande afbeelding een verzoek indient voor een nieuwe afbeelding. Die wordt dan niet gezocht maar gemaakt. Een nieuwe, synthetische afbeelding.

Het maken van die afbeeldingen was niet de grote doorbraak, maar het feit dat je door het geven van een tekstuele opdracht een afbeelding krijgt. De motor hierachter is GPT-3, een zogenaamd Large Language Model. Een model voor de verwerking van dagelijks taalgebruik gebaseerd op heel grote sets van informatie.

Dus eerst zal de opgegeven tekst in natuurlijke taal door GPT-3 geïnterpreteerd worden en in stukjes betekenis worden opgebroken. Daarna maakt het systeem met die woorden een nieuwe afbeelding op uit snippers die het van het internet geschraapt heeft. Eigenlijk zijn de afbeeldingen dus eens soort van collages.

Aan de slag

De achterliggende techniek is moeilijk in detail te begrijpen, maar je kunt er wel een intuïtief gevoel bij hebben. Vooral als je er zelf mee aan de slag gaat leer je veel.

Om te beginnen ga je naar de website van OpenAI en maak je eerst een account aan:

https://openai.com/dall-e-2/

En eigenlijk kun je dan meteen aan de slag. Door een Engelstalige tekst in te geven of een eigen foto. Een voorbeeld van een tekst:

A childs drawing of a happy dog singing the blues

Dat leverde me deze vier grappige kindertekeningen op. De hond heeft zelfs soms een blauwe tong:

Niet slecht voor een eerste poging. Je krijgt steeds vier varianten te zien en door won afbeelding te kiezen kun je verdere variaties opvragen. Links het origineel en dan de vier plaatjes van de tweede ronde.

Het programma voorziet je ruimschoots van tips. Vraag om 3D renders, of voeg je favoriete schilder of stijl toe. Bijvoorbeeld Japans houtsnijkunst ukiyo-e.

Speeltijd voorbij

Maar niet meteen game over. Je krijgt maandelijks enkele gratis credits, maar als nodig kun je ook bijkopen. Ze kosten op moment van schrijven $15 per 115 credits.

Ik moet eerlijk zeggen dat ik uren kan spelen en dat sommige afbeeldingen zo mijn dromen in gaan. Zo eng en realistisch. Het is absoluut fascinerend en het is een soort van spel met taal ook. Wat kan ik beschrijven op een manier dat er iets uitkomt wat ik wilde of wat me verrast. Sommige opdrachten geven bijzondere resultaten en andere zijn dan weer matig.

Wat me opviel, is dat alle resultaten vierkant zijn en dat is niet altijd wat ik nodig heb. Maar eigenlijk zijn veel afbeeldingen prima bruikbaar. Er zijn natuurlijk wel vragen over copyright. Ook zijn er ethische vragen over bijvoorbeeld deepfakes. Sommige afbeeldingen zijn bedrieglijk echt zoals de havik op het stuur van een fiets.

Ontvang de nieuwste artikelen!

Aan spam doe ik niet 🙂

Over de auteur

Scroll naar boven