Læs nu

Du har ingen artikler på din læseliste

Hvis du ser en artikel, du gerne vil læse lidt senere, kan du klikke på dette ikon
Så bliver artiklen føjet til din læseliste, som du altid kan finde her, så du kan læse videre hvor du vil og når du vil.

Næste:
Næste:
Artiklen er føjet til din læseliste Du har ulæste artikler på din læseliste

Illustration: Sandra Bertelsen

Sådan gjorde vi for at genskabe den danske navnearv siden 1900

For første gang nogensinde er historien over danske fornavne over 118 år kortlagt.

Her er forklaringen på, hvordan vi har gjort.

Denne artikel er en gennemgang af den metode, Politiken har brugt til at skabe det nye datasæt ’Danske babynavne fra 1900 til i dag’. Er du landet her direkte fra Google eller lignende, kan du med fordel starte her for at få forhistorien.

------------

I Danmark har vi via Danmarks Statistik (DST) offentligt tilgængeligt navnedata tilbage til 1985.

Det var her, DST i sin tid satte grænsen for, hvor langt man ville gå tilbage med det såkaldte Navnebarometer, som viser navnestatistik på nyfødte i Danmark.

På Politiken spekulerede vi over, hvordan vi kunne komme endnu længere tilbage – måske helt tilbage til århundredeskiftet – og den tanke viste sig mulig, da vi tog fat i Forskerservice på Statens Serum Institut, som er nogle af de få herhjemme, der har adgang til at foretage dataudtræk fra cpr-registeret.

Babynavne fra 1900 til i dag

Indtil i dag har det via Danmarks Statistik kun været muligt at se navnes udbredelse og udvikling tilbage til 1985, men ved at tage udgangspunkt i cpr-registerets oprettelse i 1968 har Politiken fået skabt et datasæt, der går tilbage til 1900.

Datasættet rummer ikke navne på personer, der er døde i perioden 1900-1968, men da der ikke formodes at være nogen sammenhæng mellem navnevalg og dødelighed, bør den enorme datamængde stadig give et retvisende billede af danske babynavnes udvikling siden 1900.

Politiken har bygget flere digitale indgange til datasættet, som du kan finde på denne overbliksside.

Cpr-registeret blev oprettet i 1968. Her fik alle danskere altså for første gang et cpr-nummer, der som bekendt består af en dato, et årstal og fire yderligere cifre. Man har altså med cpr-nummeret mulighed for at knytte et navn til et fødselsår, og det kan man så gøre baglæns i tid helt tilbage til 1900.

Tag for eksempel min farmor, Gerda Jørgensen, der blev født 12. april 1916 og dermed i 1968 fik et cpr-nummer, der hed 12041916-xxxx.

Forskerservice kunne altså her sætte et kryds under navnet ’Gerda’ i 1916, og sådan fortsatte de med alle cpr-numrene, indtil de stod med et fuldt datasæt, hvor alle danskere var fordelt på fornavne ud over årene 1900 til 1968.

Man dør bredt fordelt på navne

Den fremgangsmåde har dog én åbenlys mangel: Man mister dem, der både er født og døde i perioden fra 1900 til 1968, da de af gode grunde ikke fik et cpr-nummer i 1968.

Den mangel bør ifølge navneforsker og lektor ved Institut for Navneforskning ved Københavns Universitet Michael Lerche Nielsen dog ikke betyde noget for tallene i procent i forhold til hinanden, som er det, man kigger efter, når det handler om navnestatistik og -popularitet.

»Der bør ikke være nogen sammenhæng mellem navnevalg og dødelighed. Folk må formodes at være døde bredt fordelt på navne, og her er vi jo oppe i nogle datamængder, der statistisk set burde give et retvisende billede, selv om vi har mistet nogle navnebærere undervejs«, siger Michael Lerche Nielsen.

Med andre ord, navnelisten for fødselsårgang 1900 vil kun indeholde de personer, der levede 68 år senere. Navnelisten for folk, der er født i 1940, vil kun gælde for dem, der levede 28 år senere osv.

Derfor skal de faktiske tal fra før 1968 altså tages med et vist forbehold, mens man roligt kan stole på de relative tal. Altså tallene i forhold til hinanden i procent, hvilket under alle omstændigheder altid er det, man kigger efter, når man skal sammenligne, fordi der bliver født et stærkt varierende antal babyer hvert år.

7.489.357 navngivninger

På grafen herunder kan du se ovenstående visualiseret - altså, hvordan antallet af individer i vores datasæt fra CPR er støt faldende fra 1968 til 1900 i forhold til Danmarks Statistiks officielle fødselstal.

Dog ikke med en markant forskel før cirka 1940. Her begynder data at afvige fra hinanden.

Som det fremgår af grafen, er der efter 1968 også en lille uoverensstemmelse mellem Danmarks Statistiks fødselstal og Politikens navnedata – især frem til midten af 1980’erne. Det bunder i, at vores data er baseret på cpr-registeret også efter 1968, hvorfor nye statsborgere indgår, selv om disse ikke nødvendigvis er født i Danmark.

En del af disse navne har vi dog sorteret fra igen i det datasæt, som er gjort søgbart med grafer fra 1900 til 2018.

I datasættet fra Forskerservice samt det senest tilføjede år 2018 var der i alt registreret 89.241 forskellige drenge- og pigenavne efter den første sortering, hvor rækker med navne som ’udøbt’, ’unavngiven’, ’0’, ’død’ osv. er sorteret fra.

89.241 er dog stadig en del, men her er vi også ude i alle navne, nogen nogensinde har heddet på 119 år lige fra ’Aarambh’ til ’Riku-Heikki’ til ’Zarathhaanth’ for at tage et par eksempler.

Så for at snævre det ind til noget, der er statistisk spiseligt og giver mening at se udviklingsgrafer for, har vi sat en grænse ved, at mindst 5 personer skal have fået navnet i mindst ét af de 119 analyserede år.

Det snævrede feltet ned til 2.102 pigenavne og 1.742 drengenavne. 3.844 navne i alt.

Det lyder måske som en voldsom beskæring, men det svarer faktisk til 7.489.357 eller 96,5 procent af samtlige, registrerede navngivninger i løbet de 119 år.

I de to grafikker herunder kan du se fordelingen af de 89.241 navne fordelt på henholdsvis antal navne og antal navngivninger.

Den sorte blok repræsenterer de navne, vi har med i vores grafværktøj, hvor vi altså har sorteret de navne fra, der ikke er brugt mindst 5 gange i samme år.

Eksempelvis de 55.313 navne, der kun er brugt én gang på 119 år.

I skal dog ikke snydes fra at kunne gå på opdagelse i de sidste 3,5 procent af navnene også, så det komplette datasæt kan tilgås i denne artikel, hvor du også kan se alle de konstellationer, et navn har indgået i, samt hvor mange der har fået navnet siden 1900.

Vi har her derudover delt pige- og drengenavnene op i hver sin plakat, som du kan zoome ind og ud i, hvilket kan være en meget god måde at søge navneinspiration på. Du kan sågar få lov til at downloade begge plakater til din egen computer eller væg, om du vil.

Detaljerne

Det er kun første fornavn, der tæller med i vores udtræk fra cpr-registeret, og navnene er ikke inddelt efter ordlyd. Det vil sige, at eksempelvis ’Lonnie’ tæller i én gruppe og ’Lonny’ tæller i en anden gruppe, selv om det med en vis ret er samme navn. Det samme gælder for navne med bindestreg. ’Marie-Louise’ vil tælle i én navnegruppe, mens ’Marie Louise’ (uden bindestreg) vil tælle i navnegruppen ’Marie’.

Har man taget navneforandring, er det stadig fødenavnet, der tæller. Bortset fra posterne før 1968. Her vil det være det navn, der blev registreret hos cpr i 1968, der gælder.

Udtrækket er baseret på personer bosat i en dansk kommune. Personer bosat i Grønland er ikke inkluderet. Af privatlivshensyn har det ikke været muligt at knytte geografi til navnedata gennem CPR.

Eftersom forældre har 6 måneder til at navngive deres barn og indberette det til cpr, er det først omkring midt juli hvert år, at Danmarks Statistik laver opgørelsen for foregående år. 2018-data er senest opdateret i alle seriens værktøjer og opslagsværk 20. juli 2019.

I artiklen over de mest populære navne gennem det seneste århundrede, er der en divergens i forhold til Danmarks Statistiks data. DST lægger nemlig navne med samme ordlyd sammen i deres opgørelse, så eksempelvis ’Mathilde’ og ’Matilde’ eller ’Noa’ og ’Noah’ bliver lagt sammen. Det gør vi ikke i vores fremstilling. Her er det de reelle navne og stavemåder, der er opgjort.

Vi har ikke rettet for fejlregistreringer, da dette i sidste ende ofte vil være en subjektiv vurdering. Mens der f.eks. næppe var en dreng, der blev kaldt ’Marie-Louise’ i 1942 (som der er registreret), kan vi ikke vurdere, om navne, der umiddelbart ser lidt pudsige ud, i virkeligheden er et navn, der oprinder fra Kina eller lignende. Datasættet rummer derfor alle navne, der ikke helt tydeligt er fejl såsom ’0’, ’død’, ’udøbt’ osv.

Find alle artikler og interaktive værktøjer i ’Babyavne fra 1900 til i dag’-serien her.

Læs mere

Annonce

For abonnenter

Annonce

Podcasts

Forsiden