Googles kunstige intelligens mundaflæser bedre end mennesker

Kunstig intelligens tager endnu en skalp fra os mennesker. Computeren slår en professionel mundaflæser med længder.

Avanceret 'machine learning' og såkaldte 'neurale netværk' gør i stigende grad computere i stand til at udkonkurrere mennesker. (© Scanpix)

Du kan lige så godt vænne dig til det.

I de kommende år bliver computere bedre end mennesker til en række discipliner - fx at køre bil.

Men allerede nu må vi se os slået af computeren, når det gælder evnen til at mundaflæse.

Det fremgår af et forsøg, det Google-ejede firma DeepMind, som udvikler kunstig intelligens, har lavet i samarbejde med forskere fra Oxford University.

Markant bedre end mennesket

Inden Googles computer var klar til kamp, måtte den dog først gennemgå et intensivt træningsprogram, som bestod i at se tæt på 5.000 timers TV fra BBC, med folk der sidder og taler.

Med den nye læring i bagagen var den kloge computer klar til en direkte duel mod mennesket. Modstanderen var en professionel mundaflæser med 10 års erfaring, og som blandt andet er blevet brugt som ekspert i en række retssager. Og computeren vandt stort.

Ifølge rapporten, som DeepMind og forskerne fra Oxford University har publiceret, kunne computeren mundaflæse 46,9 procent af ordene korrekt, mens den professionelle mundaflæser klarede 23,8 procent.

Mundaflæseren af kød og blod fik endda lov til at bruge 10 gange så lang tid, som videoerne varede, og mulighed for at spole frem og tilbage efter behov.

Teknologien har flere anvendelsesmuligheder

Forskerne forestiller sig, at den nye teknologi fx kan bruges til, at man i fremtiden lettere kan diktere til sin telefon, hvis der er meget støj omkring en.

Den computerskabte mundaflæsning vil ifølge rapporten også kunne bruges til at transskribere eller gen-synkronisere stumfilm eller til at afkode, hvad der bliver sagt, hvis flere personer taler samtidig.

DeepMind og forskerne fra Oxford University har samtidig demonstreret, at mundaflæsning kan være med til at forbedre automatiseret talegenkendelse ved at kombinere de to discipliner. Fx hvis lyden på en videooptagelse er meget dårlig eller svær at høre på grund af udenomsstøj, så kan kombinationen med mundaflæsning hjælpe til, at man opnår et bedre resultat.

DeepMind står også bag den kunstige intelligens AlphaGo, der tidligere på året udraderede verdensmesteren i det oldgamle og særdeles komplicerede brætspil Go. AlphaGo vandt fire ud af fem kampe.

Kunstig intelligens ligger også til grund for den seneste udvikling af Google Translate, der ifølge et forskningsresultat fra september, nu nærmer sig niveauet hos en gennemsnitlig menneskelig tolk. I første omgang gælder det dog kun oversættelse mellem kinesisk og engelsk, men flere sprog skulle snart være på vej.