När man läser de förutsägelser som på 50-, 60- och 70-talen gjordes om möjligheterna att utveckla tänkande datamaskiner – förutsägelser framställda såväl av vetenskapliga experter som av vetenskapsjournalister – slås man av två saker. Den ena är underskattningen av hur snabbt den tekniska utvecklingen av processorernas hastighet och datorminnenas lagringskapacitet skulle komma att gå under de närmaste årtiondena. Den andra är överskattningen av hur snart det skulle vara möjligt att konstruera datorer som i en viktig och substantiell mening tänker lika bra som, eller kanske till och med bättre än, någon människa. Tillsammans indikerar dessa båda missbedömningar hur problematiska de föreställningar om tänkande och intelligens var som då styrde det forskningsområde som kom att kallas ”artificiell intelligens” (AI).
Än i dag kan man hitta många exempel på sådana problematiska föreställningar. Ett spektakulärt exempel är den stora uppmärksamhet som Garri Kasparovs förlust i schack mot superdatorn Deep Blue
tilldrog sig för några år sedan. Händelsen tenderades att beskrivas som ett stort och avgörande steg på vägen mot konstgjort tänkande. Sällan påpekades det att om man för den artificiella intelligensens pionjärer talat om att det skulle dröja ända fram till slutet på seklet innan man lyckats få en dator att klara av en så relativt begränsad uppgift som att slå världsmästaren i schack, hade de blivit besvikna.
Matematikern Alan Turing hade till exempel betydligt större förhoppningar. I den välkända artikel från 1950 där han beskriver det test (”Turings test”) som han menar borde utgöra det avgörande kriteriet på att en maskin är intelligent, förutskickar han att det kring sekelskiftet kommer att finnas datorer som uppfyller detta intelligenskriterium. Denna förutsägelse har visat sig helt felaktig. I dag finns ingen dator som ens tillnärmelsevis klarar Turings test.
Turings test går i korthet ut på att en maskin ska betraktas som intelligent om dess verbala beteende inte kan skiljas från en människas verbala beteende. Vi ska alltså kunna konversera med datorn (till exempel via en bildskärm) utan att kunna avgöra om dess repliker produceras av en maskin eller av en människa. Idén att programmera en dator så att den klarar av att konversera på ett mänskligt sätt har dock visat sig problematisk. Medan schack är en välavgränsad och strikt reglerad aktivitet, är vårt språkbruk sammanvävt med vårt övriga liv på ett sätt som gör det fundamentalt oklart vad det över huvud taget skulle innebära att fånga detta språkbruk i ett datorprogram. Detta gäller redan de mest vardagliga utsagor. Här är ett enkelt exempel (lånat från den amerikanske filosofen John Haugeland):
Jag lade paraplyet i badkaret, eftersom det fortfarande var vått.
Ur rent skolgrammatisk synvinkel är denna sats dubbeltydig: pronomenet ”det” kan formellt syfta tillbaka på såväl ”paraplyet” som ”badkaret”. Men i praktiken vållar oss denna dubbeltydighet inga problem alls. Vi förstår omedelbart att det är paraplyet som sägs vara vått, kanske utan att vi ens lägger märke till den grammatiska dubbeltydigheten.
Hur kommer det sig? Jo, vi kan se poängen med att lägga ett vått paraply i ett badkar: man vill ju inte att det ska bli vattenpölar på hallparketten, man vill inte blöta ned kläderna som hänger bredvid kroken där paraplyet normalt brukar hänga etcetera. Däremot kan vi inte se någon omedelbar poäng med att lägga ett torrt paraply i ett vått badkar. Med andra ord: vår omedelbara förståelse av den enkla utsagan manifesterar en för oss självklar förtrogenhet med ett vardagligt livssammanhang, där ting som paraplyer, badkar, kläder och hallparketter har sina olika funktioner och är relaterade till våra mänskliga avsikter och behov. Denna sorts förtrogenhet saknar datorn. Och därför blir utsagan så ytterligt problematisk att hantera för den som vill programmera en maskin så att den klarar Turings test.
Naturligtvis kan man programmera in en speciell rutin för just denna enskilda sats, där man specificerar för datorn att ”det” syftar tillbaka på paraplyet och inte på badkaret. Men problemet är att det finns ett obegränsat antal utsagor för vilka problem av liknande art uppstår. Tänk till exempel på hur innebörden av färgord kan variera mellan olika situationer. Satsen ”Tekannan är svart” kan i vissa sammanhang ge en sann beskrivning av en rödlackerad tekanna som blivit svart av sot (nämligen i sammanhang då poängen med utsagan är att påpeka denna sotighet), medan samma sats i andra sammanhang ger en falsk beskrivning av samma sotiga tekanna (nämligen i sammanhang då poängen är att identifiera den färg tekannan har under sotet). Och så vidare och så vidare.
Språkets och tänkandets förankring i mänskliga användningskontexter hade redan uppmärksammats av några av 1900-talets viktigaste filosofer: Ludwig Wittgenstein, Martin Heidegger, Maurice Merleau-Ponty, John L Austin. Det intressanta med återupptäckten av denna insikt inom datorforskningen var att den fick en så konkret innebörd och vållade så reella problem inom ett helt forskningsfält.
Under 70-talet blev svårigheterna med att programmera en dator så att den klarar Turings test alltmer uppenbara. Försöken att behandla språk och tänkande som välavgränsade och strikt reglerade företeelser – grovt talat: som analoga med schack, bara betydligt mer komplicerade – gav upphov till visserligen imponerande men ändå ytterst kringskurna och stiliserade simuleringar av intelligenta beteenden.
För att komma vidare försökte man förse datorerna med så kallade ”ramar” som var menade att representera olika mänskliga situationer i relation till vilka datorn skulle kunna anpassa sitt beteende. Idén var att komplettera reglerna för symbolmanipulation med en uppsättning sunda förnuftskunskaper och normer som rymmer information om typsituationer och mer övergripande livssammanhang, kunskaper och normer menade att utgöra eller ersätta det slags praktiska förtrogenhet med omvärlden som varje kompetent mänsklig språkanvändare har. Problemet var bara att dessa ramar inte gick att begränsa på något vettigt sätt.
Den mängd normer och sunt förnuft som verkade krävas för att skapa mindre stiliserade reaktionsmönster visade sig snabbt svämma över alla bräddar, även för relativt enkla problemlösningsuppgifter. Den kände AI-kritikern Hubert Dreyfus har till exempel visat hur en sådan vardaglig företeelse som ett restaurangbesök manifesterar en förtrogenhet som inte kan begränsas på det sätt en programmerbar ram kräver.
80- och 90-talens entusiasm för så kallade ”konnektionistiska” modeller hade delvis att göra med de svårigheter som det äldre synsättet hamnade i. Konnektionismen anlägger ett annorlunda perspektiv, där man ifrågasätter själva idén att tankeprocesser i grund och botten ska förstås som manipulerandet av symbolstrukturer. I stället för symboler tänker man sig de grundläggande elementen som analoga med hjärnans neuroner: enkla element som via in- och utsignaler står i förbindelse med varandra. Vad som gör konnektionistiska system så kraftfulla är samverkan mellan sådana enkla element i enorma nätverk, där
kommunikationsprocesserna mellan elementen sker parallellt. På grund av att styrkan hos de in- och utsignaler som vidarebefordras mellan elementen kan variera beroende på elementens aktiveringsgrad, går det att konstruera system med vad man kallar ”inlärningsförmåga”. En datamaskin programmerad på detta sätt kan till exempel kalibreras till att reagera på ett visst sätt på en bestämd mänsklig röst, eller till att ”känna igen” visuella mönster.
Den tekniska utvecklingen av sådana system har varit imponerande och betydelsefull. Men man kan ändå på goda grunder ifrågasätta om konnektionismen ger nyckeln till framställningen av tänkande maskiner. Problemet är inte bara att konnektionismens styrka är begränsad till sådant som mönsterigenkänning och klassificering, medan den har visat sig mindre framgångsrik på områden som det äldre synsättet höll för centrala: symbolhantering, traditionell problemlösning, språkligt artikulerade resonemang. En mer principiell svårighet har att göra med det reduktionistiska draget i konnektionismen, påminnande om de reduktionistiska tendenser man finner inom spekulativa tillämpningar av neurologiska forskningsresultat. Liksom det är oklart vad det betyder att säga att det är en persons hjärna (snarare än personen själv) som ”tänker”, ”känner igen” eller ”lär sig” saker, är det oklart vad det egentligen skulle innebära att ett konnektionistiskt nätverk kan tänka och känna igen olika företeelser.
Problemet har att göra med att konnektionismen, i sin reaktion mot det äldre paradigmets idé om tänkande som strikt reglerad symbolmanipulation, tenderar att tona ned eller helt bortse från den grundläggande betydelsen av tankeprocessers språklig-symboliska aspekter, för att i stället sträva efter återföra sådana processer till en icke-språklig (neurologisk eller kvasi-neurologisk) nivå. Konnektionismen erbjuder alltså inte någon egentlig lösning på frågan hur idén om artificiell intelligens ska gå att förena med insikten om språkets och tänkandets förankring i mänskliga livssammanhang. I stället inför den ett neurologiskt inspirerat paradigm som tycks öppna nya vägar för forskningen utan att kräva lösningar på de problem som det äldre synsättet hamnade i. Men det betyder ju inte att dessa gamla problem försvinner. Felet med det äldre synsättet var inte att man betonade tänkandets språklig-symboliska karaktär. Problemet var snarare att man hade en alltför begränsad och fyrkantig uppfattning om vad denna språklig-symboliska karaktär egentligen innebär.
Under de senaste åren har så kallad ”situerad robotik” blivit en av de mest populära inriktningarna inom forskningen kring artificiell intelligens. Det radikala i denna ansats sägs ibland bestå i att man, till skillnad från såväl det klassiska som det konnektionistiska synsättet, överger idén om tänkande som något renodlat ”inre”. Grovt talat tänker man sig intelligens som något som lokaliseras, inte i ett separat system av symboliska eller konnektionistiska strukturer, utan också i en varelses eller maskins yttre samspel
med omgivningen. Det är alltså följdriktigt att företrädare för detta synsätt lägger ned mycket arbete på att bygga robotar i stället för att enbart teoretiskt fundera ut program. Att framställa en intelligent maskin är nämligen, enligt detta synsätt, en fråga om att verkligen konstruera en maskin som på ett mycket konkret plan förmår hantera den omvärld vari den befinner sig. En del företrädare för denna inriktning anser att den utgör ett sätt att lösa de problem som det klassiska AI-paradigmet gick bet på. Den praktiska förtrogenhet med omvärlden som en klassiskt programmerad dator saknar, och som tidigare forskare förgäves försökte kompensera genom inprogrammerade ”ramar”, vill man nu bygga in direkt i en robots yttre funktionssätt. På så sätt, menar man, blir denna förtrogenhet genuint praktisk i samma mening som för mänskliga agenter.
Kommer då den situerade robotiken att leda till framställningen av intelligenta maskiner? Eller är artificiell intelligens omöjlig? Kanske begår man ett misstag redan genom att yttra sig ”för” eller ”emot” här. I sin insiktsfulla bok, ”Genom huvudet” (Bokförlaget Korpen, 2002), påpekar Johan Asplund att den intensiva debatten kring AI har fått oss att glömma bort hur oklar själva idén om intelligenta maskiner egentligen är. ”Den intensiva korselden verkar ha lett till att känslan för det underliga i föreställningen om intelligenta datorer har förflyktigats”, skriver Asplund. ”Uttryck för perplexitet är i dag ovanliga.” Det ligger, tror jag, mycket i det påpekandet. AI-forskningen lider i en mening av att vara alltför sofistikerad, såväl tekniskt som teoretiskt. Den litet barnsliga undran som Asplund talar om får liksom inte plats. Det verkar mycket roligare och mer imponerande att konstruera komplicerade nätverk eller bygga robotar med hög teknisk prestanda. Kanske är det, för att travestera Wittgenstein, med AI-forskningen som med potatisar. I ljuset växer skotten långsamt, men i mörkret blir de snabbt flera decimeter långa.







