Foto: CONNIE ZHOU/AP Photo/Google/AP

Big data vil vende op og ned på din verden

Vi står lige nu ved begyndelsen til en revolution, der vil forandre den måde, vi lever, arbejder og tænker på. Eksperter taler om en ny big data-tidsalder, hvor du i tilfælde af sygdom bør overveje, om du får bedst hjælp af en læge eller en statistiker.

Vi begynder med at skrue tiden tilbage. Året er 2009, og verden er ved at blive grebet af panik, da eksperter identificerer en ny type influenzavirus, der under navnet H1N1 spreder sig med stor hast. Myndighederne står uden en effektiv vaccine, så de mest frygtsomme advarer om, at vi kan nærme os en gentagelse af den spanske syge, der i 1918 ramte en halv milliard mennesker og dræbte 50 millioner. Så verden over bliver sundhedsmyndigheder sat i øget beredskab.

I USA beder sundhedsmyndighederne i Centers for Disease Control and Prevention (CDC) landets læger om at indberette nye influenzatilfælde. For at kunne forebygge en egentlig – og i værste fald livstruende – pandemi er det af afgørende betydning at kende influenzaens udvikling og mønster.

Indsatsen er imidlertid begrænset effektiv, fordi man hele tiden er lidt bagud i forhold til influenzaens udbredelse. Dels fordi folk ofte først kontakter deres læge nogle dage efter, at de rent faktisk er blevet syge. Dels fordi indberetningerne først skulle registreres centralt, hvilket kun skete en gang om ugen.

Dermed stod man altså med en sundhedsmyndighed, der kunne være mere end en uge bagud med sine registreringer af nye sygdomstilfælde på et tidspunkt, hvor netop tiden kunne være en kritisk faktor.

Andre var mere effektive.

Et par uger før H1N1 trak store overskrifter, publicerede en gruppe it-ingeniører fra internetgiganten Google en artikel i det videnskabelige tidsskrift Nature. Dér forklarede de, at de nu var i stand til at forudse den næste vinterinfluenza i USA. Og ikke bare hvordan den spredte sig nationalt, men også dens spredning helt ned på enkelte regioner og delstater.

Basis var de over 3 milliarder daglige søgninger, som brugerne hver dag foretager via Google, der – hvad mange måske ikke tænker over – lagrer alle søgninger. Så it-ingeniørerne sad med en overflod af data om folks historiske søgninger på nettet. Derved kunne de identificere de 50 millioner mest anvendte søgeord blandt amerikanske internetbrugere, som de derefter holdt op mod de amerikanske sundhedsmyndigheders oplysninger om influenzaspredningen i årene 2003-2008.

På den måde kunne de så se, hvad folk især søgte efter i områder, som allerede var smittet eller lå tæt på områder med smitte. Det kunne være ord som ’hoste’, ’feber’ eller kombinationer som ’medicin mod hoste og feber’.

»Andre havde prøvet at gøre det samme«, fortæller Oxfordprofessor Viktor Mayer-Schönberger: »Men ingen andre havde haft så mange data, matematisk kraft eller statistisk knowhow som Google«.

Viktor Mayer-Schönberger er en af verdens fremmeste eksperter i udforskningen af det, der i dag kendes som big data, og som Googles lager af søgeord og andre informationer er et eksempel på. Begrebet hentyder til de enorme mængder af data, der er fulgt i kølvandet på en stadig mere digitaliseret verden, og som på vigtige punkter står i kontrast til tidligere tiders afhængighed af nøje udtænkte stikprøver, der af økonomiske grunde skulle være så små som muligt, og som derfor også skulle være så præcise som muligt.

Sådan er det ikke med big data. Her er stikprøverne enorme – nogle gange kan man ganske enkelt finde data for alle dem, man ønsker at undersøge. Og derfor behøver man heller ikke at være så påpasselig med præcisionen. Hvad materialet savner i dybde mere end kompenseres af dets enorme bredde.

På den måde er der tale om en revolution, der har mange lag og helt enorme perspektiver for den tid, vi lever i. Og i den sammenhæng er Viktor Mayer-Schönberger som sagt en af verdens førende specialister. Han har tidligere udgivet den banebrydende bog ’Slet: Evnen til at glemme i den digitale tidsalder’. Og tidligere i år udgav han så endnu en bog, ’Big data – en revolution der vil forandre den måde, vi lever vores liv, arbejder og tænker på’, sammen med den ansete it-skribent Kenneth Cukier.

Den er en dybt fascinerende sammenfatning af – og refleksion over – en række praktiske eksempler på, hvordan den digitale tidsalder gradvis er ved at forandre den tid, vi lever i. Influenzaeksemplet er netop hentet fra den bog og er blot et af adskillige eksempler på de forandringer, der følger af en tid, hvor vi ikke bare vælter os i syndfloder af digitale data, men også er i stand til både at lagre og bearbejde dem i hidtil ukendt omfang.

Stakkels Aristoteles

I influenza-eksemplet havde googlefolkene ikke bare identificeret 50 millioner søgeord og søgekombinationer. De havde testet 450 millioner forskellige formler og algoritmer og var derigennem nået frem til en kombination af 45 søgeord, som havde høj forklaringskraft – ’korrelation’ – i forhold til spredningen af influenza.

»Google kunne ligesom de amerikanske sundhedsmyndigheder CDC fortælle, hvor influenzaen havde bredt sig til. Men til forskel fra CDC kunne de stort set fortælle det, mens det foregik og ikke en eller to uger efter«, påpeger Mayer-Schönberger.

På den måde har eksemplet to vigtige pointer, der rækker langt ud over dette konkrete eksempel.

Den ene er, at den statistiske tilgang i dette tilfælde var mere effektiv end den lægefaglige. For selv om de amerikanske sundhedsmyndigheder i 2009 byggede deres materiale på et solidt fagligt grundlag, var Googles dataspecialister – skønt de ikke havde det fjerneste lægefaglige kendskab – lige så gode til at kortlægge spredningen af virus. Og datafolkene var tilmed hurtigere på et tidspunkt, hvor tid som nævnt er en vigtig faktor.

Det antyder en ny magtbalance mellem faglighed og lægfolk og peger – mener folk som Viktor Mayer-Schönberger og Kenneth Cukier – mod en tidsalder, hvor den faglige ekspert mister sit monopol på viden om sammenhænge, og hvor det at se sammenhænge i nogle tilfælde er godt nok, og hvor handling derfor ikke behøver at afvente, at man også forstår årsagerne til en given sammenhæng.

»Lige siden Aristoteles har vi kæmpet for at forstå årsagerne til alting. Men det er ved at ændre sig. I big data-tidsalderen kan vi bearbejde helt ufattelige mængder af information og data, der giver os uvurderlig indsigt i, hvordan ting hænger sammen – men ikke hvorfor de hænger sammen, som de gør«, mener Viktor Mayer-Schönberger. Dermed angiver han den første store forandring af vor samtid: at stadig flere beslutninger vil blive baseret på basis af viden om statistisk korrelation – den måde ting statistisk hænger sammen på – frem for på basis af viden om kausalitet og viden om årsagssammenhænge.

»Det er ikke sådan, at vi helt vil udskifte kausalitet og årsagssammenhænge med statistisk korrelation. Men årsagssammenhængen mister sit monopol i den måde, vi forstår verden på«, siger Oxford-professoren.

Den anden pointe er, at man i influenza-tilfældet også aner en ændring i magtbalancen mellem på den ene side staten og de statslige sundhedsmyndigheder, og den private internetgigant Google på den anden side. Staten har ikke længere monopol på at indsamle omfattende data om os alle sammen. I dag ligger store private datavirksomheder inde med lige så meget information – mindst.

I influenza-tilfældet føltes det måske ikke så afgørende. Men hvor stater i vores del af verden er underlagt demokratisk kontrol og er sat i verden for at tage hensyn til hele samfundet, så er foretagender som Google, Facebook og mange, mange andre sat i verden for at tjene penge.

I det spil har de digitale data, vi alle sammen udveksler på nettet hver evig eneste dag, udviklet sig til en lukrativ råvare, som dataspecialister enten kan bruge i sig selv eller i helt nye kombinationer, som vi måske aldrig nogen sinde har drømt om, da vi udleverede dem.

»Vi er lige nu vidner til begyndelsen på en revolution«, siger Viktor Mayer-Schönberger: »Big data, den informationseksplosion, digitaliseringen har afstedkommet, er ved at forandre vores verden«.

På linje med Gutenberg

Udviklingen er kommet bag på langt de fleste, for den har fundet sted i et hæsblæsende tempo over kun et par årtier.

Hvor en politstuderende på Københavns Universitet for bare 25 år siden sad og baksede med primitive hulkort og computere, der kun med besvær kunne gemme opgaver på 100 A4-sider, foretager vi i dag milliarder af søgninger på Google, Yahoo og andre søgemaskiner. Og bliver irriterede, hvis det tager meget mere end et par sekunder. Vi kommunikerer på sociale medier som Twitter, Facebook, Instagram, LinkedIn og Google. Vi udveksler oplysninger om os selv, om vores relationer til andre og andres meninger, om vores smag, om vores vaner samt om køb i butikker og supermarkeder, hvor vi handler med vores betalingskort.

Alene Facebook, der kom til verden for mindre end ti år siden, uploader i dag 10 millioner nye foto. I timen, vel at mærke ...

Næsten 3 milliarder gange om dagen trykker en af de nu 1,2 milliarder aktive facebookbrugere på ’like’-knappen eller skriver en kommentar, hvorved selskabet får adgang til et ocean af viden om sine brugeres præferencer og adfærd.

Samtidig uploader de 800 millioner månedlige brugere af Googles YouTube-service hvert sekund, hvad der svarer til en hel times video.

Nytilkommeren Twitter, der er vokset med 200 procent om året, registrerede allerede sidste år 400 millioner daglige ’tweets’ – beskeder på maksimalt 140 anslag – om alskens emner og følelser.

Det er altså enorme informationsmængder, vi taler om. Og udviklingen er eksplosiv. Samtidig er det i dag muligt at både lagre og statistisk og matematisk behandle datamængder i et omfang, vi ikke har kendt til før.

Her i 2013 anslås hele verdens samlede lager af information at udgøre 1.200 exabytes (en exabyte er et 1-tal efterfulgt af 18 nuller), og heraf er kun 2 procent ikkedigital. Så stor en datamængde ville svare til, at man kunne stable dem i fem søjler, der hver især ville nå herfra og til Månen, hvis man samlede informationerne på cd-rommer.

Ifølge Viktor Mayer-Schönberger er der tale om en historisk forandring på linje med Gutenbergs opfindelse af trykpressen for over 550 år siden.

»Gutenbergrevolutionen gav os også helt nye muligheder for at lagre og sprede information via bøger, aviser og andre tryksager«, siger han og får så alligevel gjort big data-revolutionen til noget, der kan blive endnu større:

»Mellem 1987 og 2007, altså over kun 20 år, oplevede vi en hundreddobling af den informationsmængde, vi opbevarer rundt om i verden. Hvis vi sammenligner med Gutenbergrevolutionen fra 1450 til 1500, så skete der i den periode en fordobling i antallet af bøger i forhold til, hvad man havde før Gutenberg. Så dengang skete der altså en fordobling af informationsmængden over 50 år, mens vi nu ser en 100-dobling over bare 20 år«.

Præcis derfor er alle disse informationer også en guldgrube for alverdens efterretningstjenester, der dermed får enestående redskaber til at kortlægge og spore risici. Men det er kun én side af sagen, og måske ikke engang den vigtigste. Det vender vi tilbage til.

Først kan det være på sin plads at understrege, at de enorme mængder både rummer risici og en lang række fordele og nye muligheder. Sidstnævnte var influenza-eksemplet ovenfor en illustration af.

I andre tilfælde kan man identificere mønstre, man ikke anede eksisterede. Det er firmaet Xoom, der har specialiseret sig i internationale pengeoverførsler, et eksempel på.

Sumo-svindel

På basis af dets omfattende data og analyser af historiske betalingsmønstre undrede Xoom sig i 2011 over et unormalt stort antal transaktioner med det populære kreditkort Discover Card i den amerikanske delstat New Jersey. Hver for sig så transaktionerne meget tilforladelige ud, og havde man gennemført en gammeldags stikprøve, havde man muligvis heller ikke anet uråd. Men på baggrund af sin big data-analyse kunne Xoom pludselig se et afvigende mønster. Og så reagerede man – med det resultat at en kriminel gruppe blev afsløret.

Et andet eksempel: Sammen med en kollega fra University of Chicago satte økonomen Steven Levitt sig for at lede efter tegn på matchfixing i den japanske nationalsport, sumobrydning. De analyserede 64.000 kampe hen over de seneste 11 år og fandt en iøjnefaldende sammenhæng: at der i høj grad var tegn på matchfixing, men ikke – i hvert fald ikke i denne undersøgelse – i forhold til de mesterskabsopgør, hvor man måske ville forvente det, men andre steder.

Det er nemlig sådan, at man i den japanske sumoturnering skal have vundet flertallet af sine 15-turnerings kampe for at kunne fastholde sin rangering og indkomst. Det leder undertiden til forskellige interesser: Den bryder, som går til sin sidste kamp med en 7-7-score, har en hel del større interesse i at vinde end den, der har en 8-6-score eller bedre. Og dataanalysen afslørede, at det ofte også afspejler sig i resultatet: Den bryder, der mest behøver sejren, vil – skønt han ellers har klaret sig væsentlig dårligere – med stor sandsynlighed også få den.

Et tredje eksempel: Da Apples legendariske topchef Steve Jobs fik konstateret cancer, fik han hele sin dna-profil kortlagt. Den slags vil normalt ske langt mere målrettet ud fra bestemte antagelser om, hvilken del af en patients dna det er relevant at undersøge, men Steve Jobs havde et sekscifret dollarbeløb til at få en total kortlægning.

På den måde kunne hans læger se, hvordan han reagerede på sin medicin, og hele tiden tilpasse den, hvis de enten kunne se, at en bestemt medicin ikke længere virkede, eller at canceren havde muteret.

»Enten bliver jeg den første, der på denne måde nedkæmper en cancer, eller også bliver jeg en af de sidste, som dør af den«, sagde Steve Jobs.

Han tabte som bekendt kampen for livet, men ifølge bogen ’Big Data’ sikrede metoden ham adskillige års ekstra liv.

Sundheds- og undervisningssektorerne er i det hele taget områder, der ifølge Viktor Mayer-Schönberger kan høste enorme fordele af big data-analyser. For ved at trække på sin stadig større viden om den statistiske sammenhæng mellem alle mulige aspekter af vores kroppe og alskens stoffer kan man optimere og trimme medicin til det enkelte menneske.

»Når jeg i dag tager en aspirin mod hovedpine, gør jeg jo noget virkelig dumt, for jeg tager en dosis, der er tilrettet gennemsnitsmennesket. Men den dosis vil uvægerlig være enten for lille eller for stor til min krop og enzymsammensætning«, siger han:

»Jeg får ikke den rette dosis, for jeg ved ikke, hvordan den skal beregnes. Derfor over- og underdoserer vi hele tiden, og lægerne ved ikke altid, hvorfor ting virker forskelligt. Det kan big data ændre på. Jeg er overbevist om, at vi inden for de næste 5-10 år vil opleve ikke alene øget levetid, men også øget livskvalitet«.

Statistiker hjælper børn

Han nævner et eksempel fra et hospital i Ontario, hvor det ikke var en læge, men en computerekspert med en fortid i bank- og detailhandelsbranchen, dr. Carolyn McGregor, der i 2009 stod for vigtige forbedringer i behandlingen af for tidligt fødte børn.

Hvor hospitalets læger hver time gik rundt for møjsommeligt at notere tal for børnenes åndedræt og iltprocent på en blok, så de på den måde fik et bedre grundlag at vurdere deres behandling på, forbandt Carolyn McGregor ganske enkelt sin computer med alle de apparater, der løbende stod og målte børnenes tal. På den måde stod hun ikke bare med en lille samling timenotater, men med et komplet sæt af data, som hun derefter dykkede ned i for – sammen med andre observationer – at afdække mere præcise statistiske mønstre i sammenhængen mellem lægernes behandling og børnenes tilstand. På den måde kunne hun langt mere effektivt bidrage til en forbedring af behandlingen.

Undervisningssektoren kan også få stor glæde af big data-analyser, fordi man – ikke mindst via den voksende skov af online-undervisning – kan skabe sig ny indsigt i, hvilken form for undervisning og undervisningsmidler der virker.

»Undervisningssektoren er i høj grad en reminiscens fra masseproduktionstidsalderen, hvor man tror, at en bestemt undervisningsform passer til alle. Hvis vi vidste mere om, hvordan elever i grundskolen, gymnasiet og på universiteterne lærte, så kunne vi tilskære undervisningen den enkeltes behov og dermed nytænke hele vores uddannelsessektor«, siger Viktor Mayer-Schönberger.

Det her er ... sexet

Big data gør os kort sagt i stand til at træffe bedre beslutninger, hvad enten det nu drejer sig om sundhed, undervisning eller butiksindehaveren, der optimerer både vareindkøb og markedsføring ved at kombinere data for internethandel med kundeprofiler og dermed kan skaffe sig yderst præcis viden om, hvem der køber hvad – og hvornår. Derfor vil det ifølge eksperterne ændre alle aspekter af vores liv. Googles cheføkonom Hal Varian har ganske enkelt kaldt jobbet som statistiker for vor tids mest sexede.

Annoncører og analytikere har for længst indset værdien af data, der i stor stil kan anvendes flere gange og til mange forskellige formål. Det er bl.a. det, Facebook lever højt på. Facebook indsamler og videresælger bunkevis af informationer om sine brugere, hvilket store virksomheder kan bruge til at sikre en langt billigere og langt mere effektiv annoncering. Og hvor meget de er værd, fik man et praj om, da selskabet gik på børsen for halvandet år siden.

Ifølge regnskabet for 2011 havde Facebook aktiver for 6,3 milliarder dollar i form af computere, kontorudstyr og andre traditionelle aktiver. Men ved børsnoteringen opnåede selskabet ikke desto mindre en markedsværdi på 104 milliarder dollar, fordi investorerne tillagde dets lager af information en langt højere værdi end den, som den klassiske bogføring af aktiver angav.

Set med Viktor Mayer-Schönbergers øjne udstiller eksemplet, at det ikke længere holder kun at vurdere et selskabs værdi på grundlag af pengebeholdning og fysiske aktiver. Man er nødt til at have værdien af data med.

I tilfældet Facebook kan man sige, at forskellen mellem bogført værdi og børsværdi afspejler en opfattelse af, at hver enkelt facebookbruger repræsenterer en værdi på 100 dollar. Eller at værdien af hver evig eneste af de 2,1 billion stykker ’salgbart indhold’ i form af bl.a. ’likes’, som Facebook havde indsamlet fra 2009 til 2011, var omkring 5 cent værd.

Derfor er Facebook heller ikke gratis at bruge. Man betaler bare ikke med penge, men med informationer om sig selv og andre, som derefter sælges videre. Dermed mister brugerne også noget af sig selv: De kontrollerer ikke længere deres egne data. Den kontrol er delvis overtaget af store private dataselskaber som Facebook og Google.

»Der var engang, da vi havde en ret klar opfattelse af, hvad det ville sige at være privat, og hvilke informationer om én selv – altså data – man ønskede at holde for sig selv. Det kunne være ens fødselsdag, adresse, løn, religiøse overbevisning, seksuelle orientering osv. Det afgørende var, at du selv afgjorde, om du ville have den ene eller den anden oplysning frem eller ej. Sådan er det ikke i dag, hvis du bruger internettet«, siger dataspecialisten Nigel Inkster fra den britiske tænketank International Strategic Studies:

»I dag er det i stor stil muligt at udlede alle den slags informationer om dig – og alle andre«, siger Inkster, der efter 31 år år i den britiske efterretningstjeneste ved alt om, hvad nettets overflod af data kan bruges til: »Man behøver faktisk ikke engang at kende hverken dit navn eller din fødselsdag. Man kan deducere sig frem til, hvem du er, ved at sammenkøre alle disse data, der ligger derude«.

Nigel Inkster deltog for nylig som en af de fremmeste eksperter i det årlige møde i World Economic Forum i Abu Dhabi, hvor big data netop var et af de helt store emner. Og ifølge den tidligere efterretningsmand er der et presserende behov for at debattere, hvem der egentlig ejer vores data, og hvilke vilkår der egentlig gælder i forhold til kontrol, muligheder for videresalg og rettelser.

»Pointen er jo, at hvis du besøger hjemmesider, som du ikke ønsker, at andre skal vide noget om, så er der altid én, et eller andet sted i verden, der ved det«, siger han og tilføjer en isnende pointe: »Der er altid én, der har noget på dig, og som vil kunne bruge det imod dig. Men du har ingen idé om, hvem den person er«.

Ifølge den amerikanske ekspert i cybersikkerhed Bruce Schneier, der er tilknyttet det amerikanske eliteuniversitet Harvard og desuden er medlem af World Economic Forums Council on the Future of the Internet, er det vores mulighed for at være private, der står på spil.

»Jeg sagde engang, at min kone ved mere om mig, end jeg selv gør. Men det er faktisk forkert. For Google ved langt mere. Google ved også mere om, hvad jeg tænker, end jeg selv gør. Google ved præcis, hvad jeg er optaget af. Hvad jeg læser. Hvad jeg undersøger. Google ved præcis hvornår jeg begyndte, præcis hvornår jeg sluttede. Præcis hvor interesseret jeg var. Hvem jeg delte tanker med«, siger han: »På intet tidspunkt i hele vor arts historie er der tidligere registreret så intime detaljer om, hvem vi er«.

Det store spørgsmål er derfor, om det er enden for privatlivets fred – og hvad der i givet fald er på spil.

»Privatliv er ikke noget, man skal skjule. Det er retten til at kunne være sig selv. Hvis man altid er overvåget, er man altid offentlig. Så vil du aldrig kunne være dig selv – aldrig kunne tænke selv de mest radikale tanker, uden at andre ved det, selv om du opgiver dem igen«, siger Bruce Schneier.

Med den amerikanske whistleblower Edward Snowdens læk af hemmelige dokumenter fik verden for alvor øjnene op for omfanget af alt det, der gemmes på digitale lagre. For Nigel Inkster har Snowden-lækagen imidlertid skadet det, som han opfatter som en langt mere presserende debat: debatten om, hvornår vi kan være private. Og hvordan vi kontrollerer behandlingen af vores data.

»Vi lever i dag i en big data-verden, men til forskel fra tidligere er de teknologier, der kan håndtere den slags, nu stort set i hænderne på private virksomheder«, siger Nigel Inkster.

Retten til at blive glemt

Helt centralt i den debat er også vores ret til at blive glemt: For hvordan kan man i sådan en verden sikre sig imod, at fortiden ikke for altid er nutid? Hvordan kan man sikre sig, at vi ikke for resten af livet bliver indhentet af informationer om alle mulige fejl- og vildskud, som vi har begået for mange år siden.

»I den big data-verden vi lever i i dag, ved vi alt, og alt bliver gemt for evigt. At glemme bliver teknisk set unaturligt«, siger Bruce Schneier.

Det giver en fundamentalt anderledes verden. For vores samfund er bygget op omkring det, at vi glemmer. Vi glemmer skænderier, vores barndom, uretfærdigheder imod os, og vi husker ting med vores partnere som meget sjovere, end de var. Vi tilgiver, og vi glemmer. Vi så at sige genfortolker fortiden, vi skaber en ny virkelighed i vores egne hoveder. Det har vidtrækkende perspektiver.

Det ene er det helt overordnede: at historieskrivningen, som vi kender den, er død, og at den ’rigtige’ historie først begynder nu.

»Hidtil har vi skrevet historie på basis af mangelfuldt materiale, som gav plads til fortolkning, og som forskellige generationer derfor ofte ville tolke forskelligt«, siger Bruce Schneier:

»Når historikerne f.eks. har skrevet om Anden Verdenskrig, har de haft adgang til kun nogle dokumenter, nogle billedoptagelser og forskellige vidnesbyrd, og det var så det. Sådan vil det ikke længere være. Præhistorien er død; dette er historiens begyndelse. Når vi om ti år studerer krige, vil alle have været udstyret med et videokamera. Alt vil være registreret og overvåget. Så efter 100 år vil man kunne rekonstruere alt, præcis som det var. Hvor vi før kun havde en del af materialet og derfor et stort rum for fortolkning, har vi i dag adgang til alt«.

Det andet perspektiv handler om det helt nære: om os selv.

»Forestil dig, at du har været oppe at skændes med en god ven for fem år siden. Du tilgav ham, men finder så en dag en sur e-mail fra dengang, som du ellers for længst har glemt. En af den slags e-mail, der egentlig bare dukker op, fordi du måske lige skulle finde din vens e-mail-adresse. Og så ... på en tiendedel sekund har du en masse mail fra adskillige år tilbage, hvor du bliver mindet om det skænderi, du egentlig slet ikke ville mindes om«, siger Viktor Mayer-Schønberger:

»Du begynder at læse og kan ikke lade være med at huske det hele igen, så du skifter syn på din ven. Også selv om din hjerne for længst har slettet det, fordi det ikke længere var vigtigt«.

Han sammenligner det med folk, der har ekstrem hukommelse som amerikaneren Jill Price, der kan huske detaljer fra hver evig eneste dag i 25 år. Det har hun selv beskrevet som et kors, der gør det svært for hende at træffe beslutninger. Hun kommer nemlig altid i tanke om fejl, hun tidligere har begået.

Big data har endnu et perspektiv: Med sine store datamængder øger den præcisionen af prognoser og fremskrivninger i sådan en grad, at fremtiden vil blive stadig mere forudsigelig.

»Når fremtiden bliver mere forudsigelig, vil den også i højere grad blive forudsagt«, siger Oxfordprofessoren og rammer endnu en pointe ind: »Vi risikerer at ende med en fortid, der er blevet til nutid, og en fremtid, der ikke længere er åben«.

Skræmmevisionen er udmalet i filmen ’Minority Report’, hvor en mand dømmes for en forbrydelse, han endnu ikke har begået, men som han med stor statistisk sandsynlighed vil begå. Derfor fængsles han forebyggende.

Ud på glidebanen

Viktor Mayer-Schønberger mener, at vi allerede har taget et skridt ud på glidebanen. Som et eksempel nævner han den amerikanske efterretningstjenestes NSA’s Prism-program, der indsamler data fra alt og alle uden på forhånd at have en idé om, hvorvidt den enkelte har foretaget sig noget mistænkeligt eller ej.

Et andet eksempel er de amerikanske no-fly-lister, der sidste år indeholdt 21.000 navne på folk, der ikke tillades at flyve med almindelige passagerfly. Folk på listen ved som regel ikke, at de står der, før de skal flyve, og det er stort set umuligt at finde ud af, hvorfor man står der. Men de har udvist en adfærd, der rent statistisk – men uden rettergang – gør dem til ’risikoelementer’.

Et tredje eksempel er de 15 amerikanske stater, der på basis af 50 eller 100 forskellige faktorer beregner sig frem til, om fængselsfanger kan blive prøveløsladt. Dermed sparer man en række udgifter til de myndigheder, der normalt foretager den slags afgørelser.

Et fjerde eksempel handler om predictive policing, hvor amerikanske politifolk på basis af algoritmer og historiske data om tidligere forbrydelser, tidspunkter, adresser og sociale forhold regner sig frem til områder, hvor det er særlig nyttigt at patruljere for bl.a. at afværge biltyverier og indbrud.

»I hele nationen står politiet med det problem, at man skal gøre mere med færre midler. Budgetter og mandskab bliver beskåret, mens ledelsen kæmper for at imødekomme offentlighedens ønske om sikkerhed«, hed det tidligere i år i en pressemeddelelse fra FBI, der fra et testområde i Santa Cruz i Californien meldte om gode resultater: Hen over de første seks måneder var alene antallet af indbrud faldet med 19 procent. Teknikken er nu også på vej til Storbritannien.

Viktor Mayer-Schønberger anerkender, at den slags kan øge effektiviteten, men er bekymret over det, som han ser som en række isolerede tilfælde, der tilsammen markerer en glidebane, der stort set er trådt i kraft uden offentlig debat:

»På effektivitetens alter slagter vi nogle fundamentale liberale værdier, såsom retten til at træffe frie beslutninger og selv vælge, hvad vi vil og ikke vil. Og at folk behandles ens af staten«, siger han: »Big data kræver en ny diskussion af, hvordan vi træffer beslutninger, afgør skæbner og retfærdighed. Den viden, som engang betød forståelse af fortiden, vil i fremtiden betyde evnen til at forudse fremtiden«.

Publiceret 3. januar 2014

Redaktionen anbefaler:

Læs mere:

Læs mere

Annonce

For abonnenter

Annonce

Forsiden

Annonce