För ett drygt år sedan skrev jag i detta blad en spalt med rubriken ”ChatGPT är inte magi, och struntprat är enkelt att automatisera”.

Jag tog avsats i program jag skrev som skolelev under tidigt 1980-tal, och experimenterade glatt i hur man skapar något som vid en flyktig betraktelse ser ut som riktig text men i själva verket är ren gallimatias.

Min analogi till Chat GPT var att den med liknande men mer omfattande analys kan skapa något som vid en flyktig betraktelse ser ut att vara rätt tänkt men i själva verket kan innehålla dumheter (som benämns ”hallucinationer”).

Det var en lekfull men teoretisk betraktelse. Tiden har runnit under broarna, och nu vill jag ta avsats i konkreta erfarenheter samlade under det gångna året. Min tes är att AI håller på att normaliseras och småningom både kan och bör behandlas som konventionell IT.

De praktiska lärdomar jag har att falla tillbaka på rör dels Projekt Fredrika (där jag engagerar mig pro bono), dels Maria DB Foundation (där jag förvärvsarbetar).

Inom Projekt Fredrika har vi redan länge jobbat med Svenska Litteratursällskapet. Ett arbetspaket för ett drygt år sedan gällde Maria Vainio-Kurtakkos förträffliga bok ”Ett gott parti”, om Albert Edelfelts äktenskap med Ellan de la Chapelle .

Med gammaldags hederlig Python-programmering lyckades vi systematiskt föra in Edelfelt på världskartan och typ se till att Louis Pasteur illustreras av Edelfelts porträtt i Wikipedia-artiklar på x antal språk.

I år tog vi ny sats, med AI. Målet var att täcka hål inom själva textmassan. Gen AI är en oändligt påläst och ivrig men oerfaren medhjälpare, som kan bidra med mycket om man ger rätta uppgifter.

”Kan du föreslå förbättringsförslag till några Wikipedia-artiklar utgående från boken ’Ett gott parti’, vars textmassa jag laddat upp åt dig?” är en alldeles för krävande uppgift. Men vi kan dela upp helheten, där enskilda uppgifter blir tillräckligt enkla för att delegera till den ivriga medhjälparen.

Tänk på AI som familjens tvååring. Kan du föra blöjan till roskisen i köket och hämta en mugg te åt pappa? För svårt.

Tvååringen för antingen blöjan eller hämtar teet, eller ingendera. Inte bådadera. Men delar man uppgiften rätt – prompt chaining – kan den bemästras av tvååringen.

Uppdelningen av uppgifter i hanterbara AI-munsbitar kallas för chunkification, och är tillika svårt och enkelt. Svårt för att det kräver en viss hantverkskunskap inom AI, enkelt för att allmänt god IT-erfarenhet räcker långt.

Tag Maria DB Foundations senaste kontakt med Wikimedia Research. De experimenterar med speciella vektordatabaser vid sidan av deras universaldatabas Maria DB Server, och de har fastnat för vektorer med femtio dimensioner.

Då varje dimension symboliseras av bara ett enda tal som lagras i något fåtal byte, står det klart för var och en med IT-erfarenhet att man inte kan komprimera en hel, lång Wikipedia-artikel i en enda vektor. Man behöver en vektor per stycke, eller kanske per mening.

Då först finns det förutsättningar för att med ”närmaste granne”-sökning automatiskt hitta besläktade artiklar till en given Wikipedia-artikel.

Slutsatsen? Vi är nu på god väg till att kunna hantera AI-projekt som vanliga IT-projekt. Mervärdet i AI ligger delvis i det uppenbara – att skapa utkast till texter, som en oerfaren och överivrig assistent.

Delvis sitter intelligensen i möjligheten att via vektorisering känna igen komplicerade mönster som gör det möjligt att jämföra ostrukturerade texter och få ett mått på hur nära varandra de ligger.

Gör man ”chunkification”-uppdelningen rätt och spar AI-mellanresultaten så de kan revideras och kontrolleras av mänsklig expertis, ja då öppnar sig en ny värld av IT-tillämpningar.

Medhjälparen AI kan hjälpa till. AI normaliseras på samma vis som all annan IT först verkat omöjligt svår, sedan lett till stora felinvesteringar för att till sist begripas av allt fler och skapa klart mervärde för användarna.

