Annonce
Annonce

Mest læste

Jobannoncer

Se ugens job-annoncer i tillægget Viden
Medier 4. jul. 2010 KL. 17.43

Der er lang vej til det digitale Babelstårn

Drømmen om den perfekte oversættelsesmaskine er endnu ikke realiseret.

send

Send artikel

Til:

(E-mail, adskil flere med komma)

Fra (E-mail): Besked:
banner
banner
print

For at forstå hinanden er det nødvendigt at kunne det samme sprog.

For godt nok sagde nationalfiluren Robert Storm Petersen lakonisk, at det franske sprog er let nok: »hest hedder cheval, og sådan er det hele vejen«;

men der ligger mere bag at kunne et sprog end blot at vide, at kartofler eksempelvis hedder potatoes og så fremdeles. For et er ordene, de enkelte betegnelser for såvel ting som begreber.

Babelstårnet
Noget andet er idiomerne, talemåderne, de sproglige niveauer samt jokere som sarkasme, ironi og humor. Og det er på grund af disse, at det er så pokkers vanskeligt at lave en oversættelsesmaskine, der kan producere andet end det vitterlige vrøvl, som avislæsere kan sende ind til bagsideredaktionerne for at få eksemplerne sat i offentlig sproglig gabestok til almen dannet latter.

En gang forstod alle mennesker på hele jorden angiveligt hinanden. I Det Gamle Testamente – 1. Mosebog kapitel 11 – står der: »Hele jorden havde samme sprog og samme tungemål«.

Og fordi de kunne snakke sammen uden forståelsesproblemer, blev menneskene enige om at opføre en by, som i midten havde et tårn, der kunne nå op til himmelen. Hvilket imidlertid forekom Gud at være en rigtig skidt idé.

Nordiske forståelsesproblemer
»Når de begynder at handle sådan, vil intet at det, de planlægger, være umuligt for dem. Lad os stige derned og forvirre deres sprog, så de ikke forstår hinanden. Så spredte Herren dem derfra ud over hele jorden, så de måtte holde op med at bygge byen«.

Siden har der været bøvl, kiv og i det hele taget problemer med at forstå, hvad de andre sagde. Og det har været forbeholdt mennesker med enten rejseerfaring eller uddannelse at kommunikere med folk af et andet tungemål end deres eget.

Selv danskere og nordmænd, hvis sprog ellers for en stor dels vedkommende leksikalsk er meget lig hinanden, lider under forståelsesproblemer og må ofte ty til det neutrale engelsk, hvis de skal tale alvorligt med hverandre.

Datamatsprog
Når repræsentanter fra alle verdens nationer mødes i FN for at sikre freden og menneskerettighederne, er det nødvendigt med en sand hærskare af simultantolke, for at alle kan tale uhindret sammen.

I mindre målestok er det tilfældet i EU-parlamentet. Der bliver virkelig tolket igennem. Både simultant, når der diskuteres og holdes taler. Og i skriftlig form, når korrespondance og forslag til diverse legislative tiltag skal rundt i alle hjørner.

Hvilket selvsagt er helvedes mandskabskrævende og bøvlet som bare pokker. Derfor ville det være dejligt med en eller anden type i begrebslig forstand maskinel intelligens, der uden menneskelig mellemkomst kunne gøre japansk forståeligt for flamlændere og wolof fatbart for fynboer.

Lisa Gerrard er en Australien afsynge og komponist hvem skaffe international navnkundighed

Maskinoversættelse

Da informationsteknologien i sin urform meldte sin ankomst og blandt andet gjorde det muligt for sprogforskere at etablere disciplinen computerlingvistik, der med maskinernes hjælp kunne behandle store datamængder og dermed også systematisere og sammenligne ord fra forskellige sprog, lå det lige for at anvende de nye ’datamater’, som man ærbødigt kaldte skidtet, til at oversætte.

Fra russisk til engelsk
En helt central begivenhed i udviklingen af den moderne sprogteknologi er det såkaldte Georgetown-eksperiment, der blev udført i 1954 i et samarbejde mellem det berømte universitet i Washington D.C., Georgetown University og virksomheden IBM, som to år tidligere havde lanceret den banebrydende IBM 701, firmaets første kommercielle computer til brug for videnskabeligt arbejde, som også blev anvendt.

Projektet, hvor 60 russiske sætninger skulle oversættes til engelsk af computere, havde først og fremmest til formål at overbevise den amerikanske regering om, at det var en god idé at kanalisere militære og civile forskningsmidler i den retning, hvilket valget af kildesprog set i relation til den globale sikkerhedspolitiske situation også giver et fingerpeg i retning af.

Det var jo i den kolde krigs heyday, hvor fjenden per definition hed Ivan Ivanovitsj, og senator Joseph McCarthy jagtede kommunister med inkvisitorisk ildhu.

Grundlagsproblemer
Forsøget faldt så heldigt ud, at man efterfølgende meldte ud, at nu ville der gå en håndfuld år, og så havde man fod på det der maskinoversættelse.

Helt så snapt og gnidningsfrit kom det imidlertid ikke til at gå; faktisk er der stadig betydelige problemer forbundet med maskinoversættelse.

LÆS OGSÅMaskinoversættelser er ofte brugbare

Det blev man også opmærksom på, da pioneren John R. Pierce – som var med til at skabe den første transistor og sideløbende med sit videnskabelige arbejde har plejet et interessant science fiction-forfatterskab under pseudonymet J.J. Coupling – stod i spidsen for en komite, som i 1966 kunne konkludere, at man måske skulle interessere sig mere for den sproglige end for den maskinelle side af sagen i forbindelse med maskinoversættelsesprojektet.

Det var kort sagt nødvendigt med en mere tilbundsgående undersøgelse af computerlingvistikkens såkaldte grundlagsproblemer end at udvikle mere avanceret isenkram.

Ret til at læse EU-dokumenter
Virksomheden Systran, der blev grundlagt af den blandt andet ungarsk-amerikanske lingvist Peter Toma i 1968, var med til at udføre dette arbejde for såvel den amerikanske regering som Europakommissionen (og dens teknologi er i sin nuværende form drivkraften i Yahoos oversættelsesservice Babel Fish).

Den europæiske aflægger, som blev etableret i slutningen af 1970’erne og eksisterede til 1994, kom til at hedde Eurotra. Dette projekts helt grundlæggende præmis var, at alle borgere i EU skulle kunne udøve deres ret til at læse alle dokumenter fra fællesskabet.

Og pointen var således at skabe en teknologisk platform, der kunne oversætte mellem EU-sprogene, som på det tidspunkt var ni, herunder hovedsprogene engelsk, tysk og fransk.

Maskinel intelligens
Det er en overordentlig stor opgave, idet mulighedsfeltet for en leksikalsk enheds betydning udvides ganske betydeligt, når der er flere målsprog involveret. Kartoffel er således både ’potato’, ’pomme de terre’, ’Kartoffel’ samt ’patata’ og ’aardappel’ og når dertil så kommer diverse sammensætninger med anvendelse af glosen i overført betydning, begynder det at tårne sig op for den maskinelle intelligens.

Eutrotra løb samtidig ind i et af maskinoversættelsens helt grundlæggende problemer, nemlig maskiners manglende evne til at skelne mellem sproglige niveauer. Den klassiske vittighed om maskinoversættelse er følgende:

Der er stadig et stykke vej at gå, førend FN og EU kan fyre translatørern

»The beef was mediocre but the liquer was fine«, hvilket er en oversættelse af det bibelske »kødet er skrøbeligt, men ånden er redebon«. Og når lingvister stadig kan fornøje sig over den, skyldes det, at der er et stort element af sandhed i den. Selv om nyere web-oversættere giver resultatet: »the meat is fragile but the mind is ready«.

Do you wanna bouncy bouncy?
Men denne erkendelse blev også udgangspunkt for en fornyet tilgang til maskinoversættelsen. For hvor den helt traditionelle metode var at lade computeren – selvfølgelig med skyldig hensyntagen til både syntaks og ordenes betydning – tage teksten et ord ad gangen, hvilket oftest gav mildest talt pudsige resultater, gik man over til også at inddrage faktorer som sætningers sandsynlighed.

Og noget sådant gør det muligt at eliminere sætningsforekomster, hvis eneste eksistensberettigelse ville være i en nyere version af den berømte Monty Python-sketch om den ungarske parlør, der er konstrueret således, at alt får en seksuel bibetydning på målsproget – såvel ungarsk som engelsk.

»Do you wanna come back to my place and bouncy bouncy«, er den sætning, parløren foreslår, hvis man vil købe en pakke smøger.

Dåsedansk
Maskinoversættelsesteknologien har gjort bemærkelsesværdige fremskridt i løbet af de seneste ti år.

Et eksempel hentet fra Wikipedias opslag ’dåsedansk’ illustrerer dette. Den engelske sætning »Lisa Gerrard (born April 12, 1961) is an Australian singer and composer who gained international renown as part of the music group Dead Can Dance with Irish former partner Brendan Perry«, bliver i første ombæring til:

»Lisa Gerrard (født April 12, 1961) er en Australien afsynge og komponist hvem skaffe international navnkundighed nemlig noget af den musik sammenstille Livløs Kunne Bal hos Republik i Ireland forhenværende parthaver Brendan Perry«.

En forbedret teknologi, GramTrans, forvandler indholdet til: »Lisa Gerrard (født kylle 12, 1961) er en australsk sanger og komponist som opnåede internationalt ry som en del af musikgruppen Dead Can Dance med Irsk forhenværende partner Brendan Perry«.

Ingen grund til at fyre translatørerne
Mens Google Translate giver følgende resultat: »Lisa Gerrard (født 12. april 1961) er en australsk sanger og komponist, som vandt international berømmelse som en del af den musik gruppen Dead Can Dance med irsk tidligere partner Brendan Perry«.

LÆS OGSÅDansk wonderkid skaber sproglig revolution

Betydelig fremgang, men der er stadig et stykke vej at gå, førend FN og EU kan fyre translatørerne. For selv om det lykkes at skabe en oversættelsesmaskine, der producerer lydefri oversættelse på skrift, mangler man efterfølgende at skabe talegenkendelsessoftware, der kan matche.

Først når det er en realitet, er vi tilbage, hvor vi var, da Gud slog os med sprogene for at forhindre et ambitiøst byggeri. Først da vil vi kunne tale sammen for alvor, på tværs af grænser, racer og hudfarver.

Og skulle vi nå dertil, står endnu en opgave tilbage: at oversætte mellem køn og klasse.

Annonce
Annoncer
Internationalt
27. maj. KL. 15.02
sorg. Flagene er gået på halv i den finske by Hyvinge efter skudepisoden i går, hvor en 18-årig mand dræbte to og sårede syv med et gevær, han havde taget i sine forældres våbenskab. - Foto: JUSSI NUKARI/AP

18-årig finne fik ideen kort før drabene

En 18-årig finsk mand erkender, at han skød og dræbt to og sårede syv.

Kultur
27. maj. KL. 14.45

Sofie Gråbøl: Jeg får koldsved og er bange for at falde i min kjole

Både danske 'Forbrydelsen' og 'Borgen' er nomineret til en prestigefyldt britisk pris i aften.

Debat
27. maj. KL. 13.44
Massemorder. Anders Behring Breivik. - Foto: Hakon Mosvold Larsen/AP

Stod Gud bag Breiviks massemord?

Kirkens folk har et forklaringsproblem, når en massakre som i Norge kan finde sted.

Annoncer
Annoncer

Seneste TV

01:03

27. maj. KL. 11.30 TV Soluna: Jeg kommer aldrig til at glemme det

Det sker
bøf. Burgerne hos Vesterbros originale burgerrestaurant er blandt de bedste i byen. - Foto: Peter Hove Olesen
26. maj. KL. 10.31

Gammel homosauna serverer byens bedste burgere

ibyen anbefaler

restaurant & cafe