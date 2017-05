Jane Austens tre vanligaste ord ”hövlighet”, ­”obetänksamhet” och ”inbillning” ger en omedelbar känsla av hennes ­unika röst. Statistisk språkanalys kan kartlägga ett författarskap – men kan den också ge ledning i konsten att skriva?

Hjalmar Söderbergs ”Den allvarsamma leken” som ordfrekvensmoln.

Vad kan siffror och statistik egentligen säga om litteratur? Inom litteratursociologin har den kvantitativa metoden använts för att exempelvis undersöka bokmarknaden. Men i allmänhet betraktats den med en viss misstro av litteraturvetare som alltför schematisk för att kunna tillämpas på litteraturens komplexitet.

Det blir heller inte bättre av att statistiska analyser, så kallad bibliometri, numera används vid universiteten för att mäta produktivitet i forskningen och som underlag för fördelningen av medel. Statistik kopplas till byråkratiskt maktspråk och tvång, och bibliometrin har kritiserats för att på ett förenklat sätt koppla samman kvantitet med kvalitet.

Men den amerikanske författaren och journalisten Ben Blatt har roat sig med att göra systematiska, och samtidigt rätt osystematiska, kvantitativa studier av litteratur. Han har byggt upp litterära databaser på jakt efter författares unika ”fingeravtryck” och olika slag av upprepningar, för att pröva relevansen i olika vedertagna råd i konsten att skriva. Blatt pekar själv på att frågeställningarna ofta med nödvändighet blir primitiva – och i viss mån även svaren – men insisterar samtidigt på möjligheten av att på detta sätt identifiera mönster, som han presenterar i boken ”Nabokov’s favourite word is mauve. What numbers reveal about the classics, bestsellers and our own writing” (Simon & Schuster).

Ben Blatt har framför allt låtit sig inspireras av det detektivarbete som ledde fram till att statistikerna Frederick Mosteller och David Wallace kunde lösa tvisten om vem som var författaren till en serie anonyma artiklar i de för amerikansk historia så betydelsefulla ”Federalist papers” (1787–88). Både James Madison och Alexander Hamilton gjorde nämligen anspråk på författarskapet. Men Mosteller och Wallace kunde konstatera att Madison var författaren genom att identifiera och räkna förekomsten av vissa vanliga ord i Madisons och Hamiltons signerade texter och jämföra dem med de anonyma.

Är det möjligt att på detta sätt identifiera olika författares litterära fingeravtryck, som dessutom är bestående över tid, frågar sig Blatt? På grundval av sökningar gjorda i en databas bestående av 600 böcker av 50 författare konstaterar han att rätt författare tillskrivs rätt text i 99,4 procent av fallen. Samma träffsäkerhet finner Blatt även då han försöker med texter som har medförfattare eller som skriver i samma genre, liksom med fanfiction – alltså berättelser av amatörer som utgår från ett annat verks litterära universum, som till exempel J K Rowlings böcker om Harry Potter.

När författaren Ray Bradbury 1995 fick frågan om vilket som var hans favoritord, svarade han ”kanel” (cinnamon) och hänvisade till minnet av kryddorna i sin farmors skafferi: de fantasieggande etiketterna och dofterna. Nu är det inte säkert att författare alltid är medvetna om vilka ord de favoriserar, eller om de faktiskt använder dem så ofta som de tror. Men Blatt kan slå fast att Bradbury verkligen använder ordet ”kanel” ovanligt ofta, och att han därtill skriver om andra kryddor mer frekvent än många andra författare, däribland Jane Austen, Agatha Christie, William Faulkner, Ernest Hemingway, Vladimir Nabokov, John Steinbeck och Edith Wharton.

De tre vanligast förekommande orden i Jane Austens författarskap är ”hövlighet” (civlity), ”inbillning” (fancying) och ”obetänksamhet” (imprudence), vilket ger ett slags omedelbar kontakt med hennes unika stil och röst. Att Nabokov använder ”malvafärgad” (mauve) 44 gånger oftare än vad som är standard i texter på engelska, och därtill andra färgord fyra gånger oftare än vanligt, är likaledes stilistiskt intressant. Förkärleken för färger kan kopplas till den synestesi som Nabokov menade sig leva med och utgår från i sitt skrivande: förmågan att ”höra i färger” och att associera bokstäver med olika färger.

”Nabokov’s favourite word is mauve” handlar alltså delvis om författandet som hantverk, och låter sig i viss mån läsas som råd i konsten att skriva. Ben Blatt prövar även relevansen för några sådana råd med hjälp av sina databaser. Ett vanligt sådant är att undvika utropstecken. De antas vittna om bristande skicklighet och Blatt kan också visa att fanfiction-författare använder utropstecken fyra gånger så ofta som mer etablerade författare.

Ett annat råd är att undvika adverb, alltså ord som bland annat kan användas för att beteckna tillkommande omständigheter (tid, rum) eller som bestämning till verb (mycket, ofta), adjektiv (ganska) eller satser – då ofta i form av sannolikhet (nog, inte). Även om undantag finns, konstaterar Blatt att böcker som är högt värderade innehåller färre adverb, också inom ramen för ett och samma framgångsrika författarskap.

Vad är då det bästa sättet att inleda en berättelse på? De bästa eller mest minnesvärda öppningsfraserna tenderar att vara korta, menar Ben Blatt och pekar på den första meningen i Herman Melvilles ”Moby Dick” (1851): ”Kalla mig Ismael.” Gemensamt för de bästa öppningsfraserna är att de innehåller sådant som i någon mening är originellt eller ovanligt. Men varje författare gör bäst i att undvika klichén ”Det var en mörk och stormig kväll...” eller att över huvud taget börja med beskrivningar av vädret. Icke förty inleder den bästsäljande författaren Danielle Steele 42 av 92 romaner med en beskrivning av vädret, liksom George Orwell i den suggestiva inledningen till romanen ”1984” (1949): ”Det var en kall och klar dag i april och klockorna slog tretton.”

När det gäller avslutningar fördjupar sig Blatt mest i sättet av avsluta kapitel med så kallade ”cliffhangers”, något som brukar karaktärisera böcker som får epitetet ”bladvändare”. I exempelvis Suzanne Collins trilogi ”Hungerspelen” (2008–10) och i den typiska thrillern avslutas mer än hälften av kapitlen med ett stycke bestående av en enda mening.

I ett annat sammanhang prövar emellertid Ben Blatt en formel som utvecklades under 1970-talet inom den amerikanska armén för att mäta en texts svårighetsgrad (”Flesch-Kincaid readability tests”). I ekvationen ingår bland annat antalet stavelser och ord, och meningarnas längd. När testet har använts på politiska tal i USA har det – föga överraskande – indikerat en stadig nedgång i förhållande till den språkliga komplexiteten. Blatt noterar att även bästsäljande böcker under de senaste 40–50 åren har blivit allt mindre språkligt sofistikerade. En förklaring till detta är att de populärlitterära titlarna på New York Times bästsäljarlista har blivit fler och bättre placerade, samtidigt som bästsäljarna har blivit enklare. Antalet ord per mening i bästsäljare på 60-talet var 17 – att jämföra med 12 ord per mening år 2000. Samtidigt tenderar ordvalen att bli enklare.

Sett till ”litterära” böcker, exempelvis vinnare av prestigefulla pris som Pulizerpriset, är utvecklingen inte lika brant nedåtgående. Men enkelt behöver inte vara detsamma som dåligt, påpekar Blatt, och det är logiskt att populärlitteratur som når en bred publik är mindre komplex.

Kan man med en kvantitativ analys finna svar på om män och kvinnor skriver på olika sätt? En studie från 2003 som utgår från ”British National Corpus”, en databas med 100 miljoner talade och skrivna ord från det sena 1900-talet, visar att det är de små orden som är skiljer mest. Kvinnor använde nämligen pronomen som ”jag” och ”deras” och demonstrativa pronomen som ”den” och ”detta” i större utsträckning. Med utgångspunkt från dessa iakttagelser skapades en algoritm som kunde förutsäga en författares kön med 80 procents säkerhet.

Blatt konstaterar att kvinnliga författare skriver nästan lika mycket om män som om kvinnor, i de böcker som rankades som klassiker, medan klassisk litteratur av manliga författare mest handlar om män. Därtill har många titlar i den klassiska litteraturen ett enkönat manligt fokus. Det är bara Jane Austen i urvalet kvinnliga författare som aldrig skrev någon bok där ”han” dominerar över ”hon”. Det kan spegla förhållandet att en bok författad av en kvinna om kvinnor har svårare att uppnå klassikerstatus. Blatt finner dock att trenden är densamma i vår samtida litteratur: kvinnor skriver sällan mer om kvinnor, medan män skriver mest om män.

Bland 50 samtida manliga författare på New York Times bästsäljarlista dominerar ”han” över ”hon” i 45 av böckerna. Men bland motsvarande 50 bästsäljande titlar av kvinnliga författare är ”hon” mer vanligt förekommande bara i 17 av böckerna. Blatt bygger därefter upp en databas med enbart ”litterära” författare och kommer fram till att männen använder ”han” mer i 42 av de 50 böckerna, medan de kvinnliga ”litterära” författarna använde ”hon” mer i bara 23 av 50 böcker.

Både manliga och kvinnliga författare får de kvinnliga karaktärerna att skrika oftare. De fem vanligaste verben som så gott som enbart förekommer i samband med kvinnliga romangestalter är ”darrar”, ”gråter”, ”mumlar”, ”skriker” och ”gifter sig”, medan de manliga oftare än kvinnor ”muttrar”, ”flinar”, ”ropar”, ”småskrattar” och ”dödar”. Manliga författare gör ingen könsskillnad när det handlar om att beskriva en karaktär som rädd, medan kvinnliga författare oftare beskriver kvinnor som rädda. Kvinnliga författare använder ordet ”snyfta” om både kvinnor och män, men manliga författare använder det inte om män. Blatt noterar ett visst inslag av önsketänkande i att både män och kvinnor beskriver det motsatta könet som kyssande, medan det oftare är karaktärer av samma kön som författaren som hatar.

Resultatet visar på en deprimerande konsistens och polarisering i den litterära gestaltningen av män och kvinnor, samtidigt som Ben Blatt finner det svårt att dra några egentliga slutsatser utöver ett allmänt behov av att ”utöka den litterära föreställningsförmågan”. Kanske har dessa stereotyper också att göra med användningen av klichéer – som Blatt också försöker sig på att ringa in och räkna trots att det visar sig svårt eller hart när omöjligt. I bland annat detta sammanhang blir den kvantitativa metodens begränsningar uppenbara. Frågorna och svaren blir med nödvändighet enkla: som man ropar i skogen får man svar. Samtidigt är en del av resultaten intressanta och man måste konstatera att det inte är någon rök utan eld.