Slik klarer mobilen å skjønne hva du sier

Slik ser datamaskinen at amerikanere sier «tomato». (Bilde: Google)

Slik funker stemmegjenkjenning

Google forklarer det enorme arbeidet som ligger bak Google Now.

Stemmegjenkjenning har hatt en enorm utvikling siden de første forsøkene på 80-tallet, fram til dagens mobiltjenester som Google Now og Apples Siri.

Likevel har vi fortsatt ikke kommet til det punktet Hollywood-filmer har vært i årevis, hvor roboter og datamaskiner skjønner hvert eneste ord du sier, helt umiddelbart og helt uproblematisk. Drømmen begynner imidlertid å nærme seg, skal vi tro Google. 

Skjønner lyder, ikke ord

Det amerikanske selskapet har nå sluppet en liten kortfilm om utviklingen av stemmegjenkjenning. Det er veldig interessant å se hvordan tilnærmingen til forståelse av stemmer og lyder har endret seg i løpet av årene.

Nå prøver for eksempel ikke datamaskinene å skjønne hvilket ord du prøver å uttale, men heller hvilke lyder du lager. Fra å prøve å skjønne at du sa «tomat», prøver den nå å fange opp lyder, slik som «th», «ohm» og «at», som til slutt former ordet «tomat». 

Du kan se den syv minutter lange videoen under, og forhåpentligvis lære en ting eller to: 

 

Alle Siri-lydene er laget av én person: 
Dette er Siri i det virkelige liv »

(Kilde: Androidandme)

Norges beste mobilabonnement

Juni 2017

Kåret av Tek-redaksjonen

Jeg bruker lite data:

Ice Mobil 1 GB


Jeg bruker middels mye data:

Telio Go 5 GB


Jeg bruker mye data:

Komplett Maxiflex 12 GB


Jeg er superbruker:

Komplett Megaflex 30 GB


Finn billigste abonnement i vår mobilkalkulator

Forsiden akkurat nå

Til toppen