Du har ingen artikler på din læseliste

Hvis du ser en artikel, du gerne vil læse lidt senere, kan du klikke på dette ikon

Så bliver artiklen føjet til din læseliste, som du altid kan finde her, så du kan læse videre hvor du vil og når du vil.

Læs nu
Du har ingen artikler på din læseliste
Artiklen er føjet til din læseliste Du har ulæste artikler på din læseliste

Næste:
Næste:
Bøger
Læs artiklen senere Gemt (klik for at fjerne) Læst

Åndshistorien i tal er både effektiv underholdning og interessant oplysning

To amerikanske forskere laver kulturhistorie på data fra Googles bibliotek.

Bøger
Læs artiklen senere Gemt (klik for at fjerne) Læst

Aldrig er vores åndshistorie blevet målt sådan før.

De kalder det en revolution. De to amerikanske Harvard-studerende Erez Aiden og Jean-Baptiste Michel begyndte for syv år siden at interessere sig for, om man kunne fortælle kulturhistorien på en anden måde. Deres projekt var at gøre kulturelle forandringer op i tal.

De ville bruge det, der kaldes ’big data’, til at måle lange kulturelle udviklinger konkret. De ville undersøge, hvorfor visse ord forandrer sig over tid, mens andre ord forbliver de samme. De ville finde ud af, hvordan berømmelse udvikler sig, hvordan censur virker i praksis, og hvordan vi har ændret syn på verden. Og de fandt svarene et nyt sted:

»Den største forskel på nutidens historiske kilder og fortidens historiske kilder er, at vore dages store mængder information findes digitalt«, skriver Aiden og Michel, som har samlet deres undersøgelser i bogen ’Uncharted: Big Data as a Lens on Human Culture’, der udkom i USA lige efter jul.

LÆS OGSÅ

Normalt bliver kulturhistorien skrevet af humanister, som ikke bruger hårde tal og algoritmer, men undersøger verden gennem fortolkning af tekster.

Aiden og Michel valgte en anden metode. De indledte et samarbejde med Google, som var i færd med at digitalisere alle bøger i verden. Google har nu digitaliseret 30 millioner titler eller en fjerdedel af verdens bøger.

Det er verdens største bibliotek, som således foreligger digitalt: Søgninger, som tidligere ville tage flere fulde livsværk at gennemføre, kan nu klares på sekunder. Det ville for 20 år siden være utænkeligt, at man kunne sammenligne forekomsten af ordene ’menneske’ og ’natur’ i de sidste 200 års bøger.

Konsekvenserne af denne revolution vil forandre den måde, vi ser os selv på

Men Aiden og Michel har sammen med Google lavet søgefunktionen ’Ngram viewer’, som gør det muligt at søge i biblioteket på udvalgte ord, der efterfølgende vises i en graf.

Nu kan du se, at ordet ’natur’ optrådte hyppigere end ’menneske’ indtil Første Verdenskrig, men derefter overstiger interessen for mennesket tilsyneladende interessen for naturen. Du kan også se, at de to temaer følges ad gennem historien: Jo mere man skriver om mennesket, jo mere skriver man efter alt at dømme om naturen.

Du kan registrere forekomsterne af de to ord, men du får ikke nogen fortolkning. Det gælder generelt for ’big data’, at du ikke får forklaringer og årsager, men forekomster. Du får ikke at vide, hvorfor noget sker, men du kan registrere, at noget finder sted. Det kaldes en overgang fra ’kausalitet’ til ’korrelation’:

»Denne revolution i datamængden handler grundlæggende om, hvordan mennesker skaber og bevarer historiske vidnesbyrd om, hvad de foretager sig«, skriver de to forfattere:

»Konsekvenserne af denne revolution vil forandre den måde, vi ser os selv på. Det vil gøre det muligt at skabe et perspektiv, som gør, at vores samfund mere effektivt kan undersøge sig selv«.

Selv betegner de deres forskning som »culturonomics«.

Magisk kodeord
Aiden og Michel lancerer deres opdagelser som en del af en større revolution. De henviser til ’big data’ som et magisk kodeord, men de undersøger ikke andre data end dem i det store Google-bibliotek.

Man læser trods alt ikke ’Uncharted’ som en sensationel ny erkendelse af verden, men de præsenterer sammenlignende undersøgelser, som er både underholdende og oplysende at gå på opdagelse i.

De tester for eksempel, hvordan nogle uregelmæssige verber bliver regelmæssige over tid, mens andre forbliver uregelmæssige.

På dansk siger vi eksempelvis ikke længere ’opdrog’ om at opdrage i datid. Vi siger ofte bare ’opdragede’. Men vi kunne ikke drømme om at gå fra ’sagde’ til ’sigede’, når vi skal udtale ’at sige’ i datid. Det viser sig ifølge de to forfattere, at de mest brugte verber ændrer sig langt langsommere end dem, som vi bruger mindst.

Aiden og Michel får hjælp af to sprogforskere fra Harvard til at udarbejde en liste på 177 verber, som var uregelmæssige omkring år 800. 1.000 år senere var omtrent halvdelen af verberne blevet regelmæssige.

De konstaterer en tendens i udviklingen: De 12 mest brugte verber var stadig uregelmæssige på moderne engelsk, mens 11 af de 12 mindst brugte var blevet regelmæssige.

Der er mange tilsvarende interessante studier: De to opdager også, at det engelske sprog vokser med 8.400 ord om året. I modsætning til den almindelige pessimisme, som hævder, at de fine nuancer forsvinder, og ingen kan længere latin og græsk, iagttager Aiden og Michel, hvordan vi får flere og flere ord til at finde forskelle i verden. Vores verden vokser med vores sprog.

Annonce

Artiklen fortsætter efter annoncen

Annonce

Bøger kan også fungere som portrætter af, hvordan vores civilisation har forandret sig over relativt lange perioder - længere end et enkelt menneskes liv og længere endda end hele nationers liv

Aiden og Michel viser også, hvordan censuren i totalitære regimer virker på litteraturen. Navne på de kunstnere og forfattere, som nazisterne ikke brød sig om, forsvinder faktisk fra bøgerne, mens nazisternes er ved magten. Men dukker så op efter nazisternes nederlag og Hitlers død.

Portræt af civilisationen

Præmissen for Aiden og Michels studier er, at bogen er en slags spejl på samfundet. Som de skriver:

»Bøger kan også fungere som portrætter af, hvordan vores civilisation har forandret sig over relativt lange perioder – længere end et enkelt menneskes liv og længere endda end hele nationers liv«.

Det er rigtigt, men det er også en præmis, de selv problematiserer: Det er klart, at der i bøger er en overrepræsentation af forskere, som citeres i andre forskeres værker, og en tilsvarende underrepræsentation af for eksempel rockstjerner, der i langt højere grad citeres på musik-tv og i radioen.

Bøger er ganske enkelt ikke et repræsentativt portræt af hele civilisationen.

Et andet problem er, at de to forfattere ikke tager højde for den forskellige udbredelse af forskellige bøger. Der er i praksis stor forskel på, om Karl Marx bliver nævnt i 51 universitære antologier, som kommer i et oplag på 500, eller om han bliver beskrevet i bøger, som bliver solgt i 100.000 eksemplarer.

LÆS OGSÅ

Alle bøger bliver lige i Aiden og Michels univers, men enhver ved, at enkelte bøger har langt større udbredelse end de fleste andre. Det diskvalificerer ikke undersøgelsen, men det begrænser portrættet af hele civilisationen.

Det sidste problem, som de to heller ikke selv berører, er, at en bog i dag ikke er det samme som en bog for 200 år siden. Bogen som medium har forandret sig og er under stadig forandring.

Artiklen fortsætter efter annoncen

Annonce

Der er sikkert historier, som i 2000 blev fortalt på tv eller i radioen, men som i 1814 ville blive skrevet i en bog. Derfor er det også usikkert, hvad man egentlig måler, når man sammenligner forekomsten af ordet ’natur’ i bøger fra 1814 med forekomsten i bøger i 2000.

Man skal således huske på, at graferne i bogen gengiver én og kun én ting: frekvensen af ord i Googles digitaliserede bibliotek.

Man kan fortolke på frekvenserne, og man kan trække store perspektiver ud fra dem. Man kan slet ikke lade være, for det inspirerer tænkning at se kulturhistorien systematiseret i grafer.

Men alt det er fortolkninger, som man selv lægger oven på data, der er lige så vidunderligt åbne, som de kan være nedslående tomme.

Læs mere:

Annonce

For abonnenter

Annonce

Podcasts

Forsiden