Konstgjord intelligens har blivit allt mer avancerad och tekniken används på fler områden. Det senaste är en AI-bildgenerator som kan skapa egna bilder utifrån text som matats in. AI-n gör alltså egna tolkningar av det den läser.

Microsofts AI-bildgenerator

Konstgjord eller artificiell intelligens är ett område som utvecklas intensivt och inriktningarna ändras hela tiden utifrån att forskarna får nya idéer. Man har redan tidigare gjort försök att få AI att skapa egna bilder, men det har varit utifrån givna förutsättningar och med hjälp av redan skapade bilder. Den stora utmaningen är att få AI-bildgeneratorn att väga samman flera aspekter och fånga dessa i en unik bild.

En nål i en höstack

Microsofts AI bot kan redan idag hitta bra resultat när det gäller att söka igenom många webbsidor samtidigt – i sökandet på en specifik bild. Det är dock generellt mycket svårare att be en dator att producera en bild utifrån en beskrivning – än att be den hitta en liknande på internet. Därför är det en stor prestation när Microsofts forskare nu har lyckats ta fram ett system som kan skapa egna bilder utifrån text som matas in i datasystemet.

Microsofts AI-bildgenerator (Attentional Generative Adversarial Network – AttnGAN) innebär en tredubblad förbättring jämfört med tidigare varianter. Google har visserligen lärt sitt AI att klottra figurer med sitt SketchRNN-program, men att be datorn göra något mer komplicerat kräver helt andra förutsättningar. Och att inkorporera mer automatik höjer svårighetsgraden ytterligare.

Artificiell intelligens i kombination med bilder erbjuder stora möjligheter. Ansiktsigenkänning är ett av de mer kända områdena, men i framtiden kommer vi förmodligen att omge oss av en värld av skräddarsydda bilder. På samma sätt som smarta hem är programmerade att tillgodose våra krav och önskemål kommer bilder i hemmet att kunna ändras utifrån smak och humör.

Effektiv AI-bildgenerator

Microsofts huvudforskare Xiaodong Han uttalade sig nyligen i ett pressmeddelande om det nya Artificiell intelligens-programmet: ”Om du går till Bing och du söker efter en fågel får du en fågelbild. Men här skapas bilderna av datorn, pixel efter pixel, från början. ” AI-n kan välja och rangordna ord och skapa en bild utifrån texten ”denna fågel är till största delen svart och har en vit mage.

När AI-systemet är fullt utvecklat kan det förbättra och förenkla fotografers bildredigeringsarbete och fungera som hjälpmedel vid animation och filmframställning. Dessutom kan systemet skissa på egen hand och kan fungera som assistent åt tekniska illustratörer, arkitekter och konstruktörer. Idag används redan röststyrd diktering och i framtiden kommer texten att kunna komplettera med skisser och beskrivande bilder – skapade av en AI.