-
16.-27. maj 2012: Filmfestival i Cannes - følg med her
-
Live: Christiania-værtshus tager kampen op mod Tivoli
-
TV FRA MUSIKMEKKA: Verdens største festival ligger i Austin
-
PLUS: Højbed, mobilt 60x60 cm
Pluspris 535 kr.
The laughing boy af Leif Sylvester
Skulpturen ’Laughing Boy’ kan ikke hedde meget andet, end den gør. For ikke bare storgriner den nye figur i stentøj, som kunstneren Leif Sylvester har lavet, klik her for at se mere...
Pluspris 999 kr.
Alm. pris 1249 kr
|
|
|
|
||||
|
Pluspris 1285 kr.
Alm. pris 1600 kr
|
|
Pluspris 295 kr.
Alm. pris 370 kr
|
|
Pluspris 1285 kr.
Alm. pris 1600 kr
|
|
Pluspris 500 kr.
Alm. pris 600 kr
|





Dansk forskning vil fjerne Googles oversætter-fejl
Oversat. Google Translate er et frasebaseret oversættelsessystem. Det betyder, at systemet ser meget store mængder af oversat tekst. Tegning: Mette Dreyer
Google Translate bliver bedre med nyt maskinoversættelsessystem.
Seneste Nyt
Seneste TV
TV Barsels-bootcamp: Brug din baby til at træne benene
TV Soluna: Jeg kommer aldrig til at glemme det
TV Lock 'n' load: Detroits kvinder bevæbner sig
TV Lyskunstnere foldede Sidneys operahus sammen
TV Kim Skotte: Cannes har haft mere til hovedet end til hjertet
TV Se de bedste og vildeste bud på en ny Rådhusplads
TV Ny vinkel: Se stuntmanden styrte mod jorden uden faldskærm
TV Bagsiden gav frit lejde til at returnere statens ejendom
Mest læste
I går
Seneste uge
I dag
I går
Seneste uge
Jobannoncer
Send artikel
(E-mail, adskil flere med komma)
Fra (E-mail): Besked:Hvis man beder Google om at oversætte det danske udtryk ’slå til nu’ til engelsk, får man at vide, at det hedder ’strike now’.
Men bytter man om på de to sidste ord i sætningen, så der står ’slå nu til’, skifter systemet mening og fortæller, at det på engelsk hedder ’turn now to’.
Googles oversættelsesprogram kan nemlig godt oversætte faste ordbilleder eller talemåder, men hvis man bytter om på ordene eller lægger et ’nu’ ind i mellem ’slå’ og ’til’, bliver systemet forvirret.
Uoversættelige mønstre
Tekster, der bliver oversat i Google Translate, er derfor ofte fulde af ord og vendinger, der overhovedet ikke giver mening, og som indimellem gør oversættelsen ufrivilligt komisk.
LÆS OGSÅ Danske elever skambruger Google Translate
Google Oversættelse
Google blev grundlagt i 1998. Hovedproduktet er verdens mest anvendte søgemaskine.
Blandt de mange andre funktioner er maskinoversættelsessystemet Google Translate, der har eksisteret siden 2006. Det kan oversætte til i alt 57 sprog.
I juni 2009 lancerede Google et Translator Toolkit, som er et redigeringsværktøj, der hjælper til hurtigt at oversætte og publicere tekster.
Det nye oversættelsessystem kan i løbet af kort tid besøges på nlp.stanford.edu/phrasal
Research: Politikens Bibliotek
Men ny dansk forskning betyder, at Stanford University i Californien i sidste uge kunne præsentere et nyt maskinoversættelsessystem, der har løst et af hovedproblemerne. Systemet betegnes i forskningsverdenen som en lille sproglig revolution.
Det er den 28-årige danske forsker Anders Søgaard, der har stået i spidsen for den forskning, der for nylig har dokumenteret og identificeret de mest fundamentale oversættelsesmønstre, som de nuværende systemer ikke kan klare.
Og på den baggrund har det været muligt for Stanford University at udvikle oversættelsessystemet Phrasal, som godt kan håndtere, at ordbillederne bliver brudt op.
»Vi har fundet ud af, at op mod to tredjedele af oversatte sætninger indeholder mønstre, der ikke kan oversættes af de systemer, der findes i dag. Det er selvfølgelig et kæmpestort problem. Mange af de fejl, man støder på i Google Translate, og som folk gør sig morsomme over, handler om de her diskontinuerte fraser – altså afbrudte enheder, som forvirrer systemet. Den type fejl vil man kunne fange i det nye system. Og oversættelseskvaliteten vil blive meget bedre for eksempelvis dansk, tysk og spansk – altså sprog, der har mange afbrudte enheder«, siger Anders Søgaard, der er adjunkt i sprogteknologi på Københavns Universitet.
Han forventer, at Google vil implementere systemet inden årets udgang, og at mange af de virksomheder, der benytter sig af maskinoversættelse, vil skifte til Phrasal, så snart de har ressourcer til det.
Simpel oversættelsesmodel
Google Translate er et såkaldt frasebaseret oversættelsessystem. Det betyder, at systemet ser meget store mængder af oversat tekst.
Og ved at registrere, hvilke danske udtryk der konsekvent optræder sammen med et tilsvarende engelsk udtryk, udleder systemet, at de to fraser nok er oversættelser af hinanden. Eksempelvis optræder det danske udtryk ’at slå til lyd for’ ofte sammen med det engelske ’advocate’.
Og så gætter systemet på, at de to udtryk har samme betydning.
»Systemet oversætter simpelt hen ved at kigge på alle mulige oversættelser af en sætning og finde den, der er mest sandsynlig. Det vil sige, at der ikke er nogen form for analyse, syntaks eller semantik i sådan et system. Historisk er det inspireret af arbejdet med at afkode kodeskrift under Anden Verdenskrig. Det er en meget simpel oversættelsesmodel, som fungerer rigtig godt, hvis to sprog ligner hinanden meget«, siger Anders Søgaard.
Landvending i forskningen
Systemet har altså ingen problemer med en vending som ’slå til lyd for’. Men hvis man skiller det ad og beder den oversætte sætningen ’Poul slår nu til lyd for’, hvor ’nu’ bryder sammenhængen, så kan systemet ikke længere betragte det som en enhed, men bliver nødt til at dele det op.
»Og det er lige præcis det nye ved Phrasal, at det kan arbejde med enheder, som er brudt op«, siger Anders Søgaard.
Københavns Universitet lancerer resultaterne af hans forskning som »en it-revolution«. Selv er Anders Søgaard en anelse mere beskeden.
»Der sker meget få revolutioner inden for forskningen. Men der er i hvert fald tale om en rigtig stor landvinding, når der nu findes et system, som tager højde for de brudte enheder. Og det bliver taget meget seriøst i forskningsverdenen«.
Men der vil stadig opstå fejl i maskinoversættelserne, for det andet hovedproblem er ikke løst endnu. Nemlig at mange oversættelsessystemer ikke har nok data til at lave brugbare oversættelser.
»Det mest berømte eksempel er forsvarets Google-oversættelse af ’Jægerbogen’ fra dansk til arabisk. Det blev opdaget meget hurtigt, fordi den arabiske tekst stadig var fuld af danske ord, som maskinen ikke havde oversat, fordi den ikke kendte dem. Og et maskinoversættelsesprogram kan ikke gætte sig til oversættelsen af et ord, det aldrig har set før«, siger Anders Søgaard.
LÆS OGSÅSøren Gade skal afhøres om arabisk oversættelse
Ligesom en hacker
Det problem er ikke løst med det nye system. For den manglende datamængde er et problem, man ifølge Anders Søgaard altid har.
»Løsningen er at give systemet rigtig, rigtig meget data. Eller hvis man som virksomhed eksempelvis gerne vil oversætte brugsvejledningen til en boremaskine, så kan man træne systemet med tekster af lige præcis den type, så man får et vokabularium, som systemet kan benytte sig af«.
Men uanset hvor mange problemer, man får elimineret, vil maskinoversættelsessystemerne altid gå anderledes til en tekst, end et menneske vil. Som Anders Søgaard siger:
»Mennesker vil forsøge at skabe en mening i en sætning og så ud fra den mening genskabe den på et andet sprog. Men de frasebaserede oversættelsessystemer går til oversættelsen som et dekrypteringsproblem – fuldstændig som hvis en hacker skulle gætte et password, eller hvis en fremmed magt skulle opsnappe en militær kode. Men i mange tilfælde kan man faktisk lave rigtig gode maskinoversættelser, og der er mange virksomheder, der benytter sig af dem«.
Se også
Ekstra Bladet lukker. Vil koncentrere sig om Nationen!
18-årig finne fik ideen kort før drabene
En 18-årig finsk mand erkender, at han skød og dræbt to og sårede syv.
Johanne Schmidt-Nielsen: I chok over regeringen
Ung bilist fængslet: Kørte mindst 142 km/t i dødsulykke
Farten i ulykken ved Tommerup var oppe på 142 km/t, da 19-årig kørte galt og var årsag til passagers død.
Sofie Gråbøl: Jeg får koldsved og er bange for at falde i min kjole
Både danske 'Forbrydelsen' og 'Borgen' er nomineret til en prestigefyldt britisk pris i aften.
Så meget kan Caras pengegave vokse
Konfirmander kan få op mod 15 gange så meget i rente på deres konfirmationspenge ved at vælge det bedste tilbud.
Barsels-bootcamp: Brug din baby til at træne benene
Stod Gud bag Breiviks massemord?
Kirkens folk har et forklaringsproblem, når en massakre som i Norge kan finde sted.
DR-chef om grandprix-flop: Det var jo danskernes yndlingssang
Zornig: »Jeg blander mig og laver rod«
Seneste nyt
Mest læste i dag
Kultur Seneste nyt
Sport Seneste nyt
IBYEN Seneste nyt
Tjek Seneste nyt
Tophistorier Kultur
Seneste Medier
Seneste TV
27. maj. KL. 11.30 TV Soluna: Jeg kommer aldrig til at glemme det
26. maj. KL. 23.54 TV Lyskunstnere foldede Sidneys operahus sammen
26. maj. KL. 08.33 TV Se de bedste og vildeste bud på en ny Rådhusplads
24. maj. KL. 21.37 TV Se balladen i Baku
24. maj. KL. 20.22 TV Kim Skotte: Cannes mangler et punch i år
maj
maj
maj
maj
Gammel homosauna serverer byens bedste burgere
ibyen anbefaler
restaurant & cafe
Så meget kan Caras pengegave vokse
Gedekølle med citron og persille