Goodbye, ordbog! Google forbedrer Google Translate

Google siger, at de ved hjælp af kunstig intelligens nu kan lave oversættelser, der konkurrerer med menneskelige tolke.

Ordbogen får større konkurrence fra Google Translate end nogensinde, skriver Google i nyt blogindlæg. (© ColourBox)

Da Google Translate blev lanceret i 2006 var det et kvantespring i digital oversættelse – pludselig havde alle adgang til en gratis ordbog på nettet.

Som årene er gået, er glansen dog gået lidt af tjenesten, og nu er Google Translate nærmest blevet synonym for ”kunstig oversættelse”. Men det ændrer sig måske meget snart. Google har nemlig udviklet en ny metode til oversættelse, der ifølge firmaet giver uhørt gode resultater.

Deep Learning

Det nye Google Neural Machine Translation bruger såkaldt “Deep Learning.” Hvor den tidligere udgave af Google Translate brugte et såkaldt Phrase-Based Translation System, der oversætter ord for ord, sætning for sætning, kan det nye system ”nedbryde” både sætninger og enkelte ord på en langt mere effektiv måde.

Ved at bruge maskinlæring, har man trænet systemet til selv at lære den bedste metode til at oversætte og endda bryde sætninger og ord op, så de ikke længere er ord eller sætninger i traditionel forstand, men sammenhængen mellem enhederne alligevel er der.

Quoc Le, der er forsker hos Google, siger til MIT Technology Review, at det er svært for forskerne selv at forstå, hvad systemet gør:

- Det er kan være lidt skræmmende, men vi har afprøvet det masser af steder - og det virker bare.

På billedet kan man se, hvordan den traditionelle metode (PBMT), markeret med blåt, fungerer i sammenligning med den nye (GNMT), markeret med grønt, og menneskelige oversættelser, markeret med gult. (Foto: Google © Skærmbillede fra Google)

Sjældne ord er svære at lære

Da maskinen lærer ud fra sætninger, den bliver fodret med, er maskinen bedre til at forstå ord og sætninger, som den ofte møder. Hvis den fx aldrig har mødt ordet onomatopoietikon, kan den ikke selv regne ud, hvad ordet betyder – eller afkode det.

Ved at genkende sammenhængen og blive introduceret til ordet i nok sammenhænge, kan systemet oversætte det i sammenhængen. Derfor har Google brugt mange ressourcer på at komme ud i alle afkroge af sproget.

Et godt resultat

For at skabe et overblik over systemets evne til at oversætte, præsenterede man systemets oversættelser og menneskelige tolkes oversættelser for et tosproget panel.

Man bad panelet om at bedømme, hvor flydende oversættelsen var og give karakteren fra 0-6. Når systemet skulle oversætte fra engelsk til spansk fik systemet karakteren 5,43, hvilket ikke er langt fra de 5,55, som de menneskelige tolke fik.

Systemet kan ikke holde samme høje niveau på tværs af alle sprog, men viser en markant forbedring fra det tidligere Phrase-Based Translation System – og resultater der ligger meget tæt op ad menneskelige oversættelser.

Aktiv allerede nu

For de fleste af de 103 sprog, som Google Translate kan oversætte, er det lige nu business as usual, men for oversættelser fra kinesisk til engelsk, der ellers er notorisk svært, er den nye metode allerede aktiv.

Google regner med at rulle funktionen ud på flere sprogkombinationer i løbet af året.

Facebook
Twitter