Nå har Googles taleassistent fått norsk, mannlig stemme
(Foto: Niklas Plikk, Tek.no)

Nå har Googles taleassistent fått norsk, mannlig stemme

Men å faktisk kalle det en mannlig stemme får vi ikke lov til.

Annonsør­innhold
Les hele saken »

Googles taleassistent ble lansert i Norge for omtrent et år siden, og har siden den gang funnet veien inn i tusenvis av norske hjem. Mange vil kjenne igjen den kvinnelige stemmen som forteller oss at det kommer til å regne i dag, eller at timeren er satt til nøyaktig fjorten minutter. Eller at hun ikke forstår hva vi prøver å si, naturligvis. 

I dag får du imidlertid en ny stemme du kan prate med. Google ruller nemlig ut en ny norsk stemme, denne gangen utført av en mann. Det er i hvert fall vår antagelse, selv om Google selv ikke vil kalle det en mannlig stemme. I appen står det nemlig ikke oppført som kvinne- og mannsstemme, men heller forskjellige farger for å gi dem en form for identitet. 

– Vi ville gjøre assistenten vår så inkluderende og respektfull som mulig, så vi ville ikke sette navn på valgene. I begynnelsen hadde vi merker som «Stemme 1» og «Stemme 2», men nå har vi bare farger. Vi vil at brukere skal velge stemme basert på hva de liker best og den som passer dem best, forklarer Brant Ward, som jobber i Googles Tekst-til-tale-team i California, til Tek.no. 

Bedre egnet for høyt stemmeleie

Han forteller også at det er en teknisk forklaring på hvorfor de valgte å begynne med en kvinnelig stemme: 

Brant Ward har jobbet med tekst-til-talesystemer i nærmere 20 år, og var med på å utvikle det nevrale nettverket WaveNet.

– Da vi utviklet den første assistentstemmen i USA, ønsket vi å finne den beste stemmen som representerte Googles verdier og ånd. Vi så på haugevis av skuespillere – uansett kjønn – men på den tiden presterte tekst-til-tale-systemer bedre med stemmene med høyere tone, forklarer Ward. 

Et teknologisk gjennombrudd i 2016 gjorde imidlertid at det er langt lettere for dem å gi taleassistenten nye stemmer, både mannlige og kvinnelige: 

– Helt i starten var vi nødt til å spille inn massevis av lyd, og selv med alle disse innspillingene, krevde våre eldre stemmemodeller at vi skulle sy sammen fonemer på en måte som hørtes kunstig ut. 

Men så ble systemet WaveNet utviklet av Google-eide Deep Mind. WaveNet er et nevralt nettverk som genererer rå lydbølgeformer som er i stand til å produsere bedre og mer realistisk klingende tale.

– Nå kan vi lage stemmer på en brøkdel av tiden det pleide å ta, sier Ward. 

Først i Norden med enda en stemme

Ward poengterer at det fortsatt er tidkrevende å implementere nye assistent-stemmer, noe som kanskje kan være forklaringen på at det tok et år før vi fikk enda en norsk stemme. Vi skal imidlertid ikke klage altfor høyt, for vi er faktisk det første landet i Norden som får en ytterligere stemme å velge mellom. I USA kan de imidlertid velge mellom ti stemmer, og flere varianter, med forskjellig toneleie og dialekter, er lovet. 

Når vi forsøker å spørre om det kommer flere norske stemmer snart, eller om vi vil få en assistent som snakker noe annet en «Oslo-dialekt», får vi bare forklart at de ønsker at deres taleassistenter skal føles «ekte», og at de blir forstått. 

– Men det handler ikke bare om å høres naturlig ut, assistenten skal kunne få kontakt med mennesker i alle land der det er tilgjengelig. Vi tar en veldig gjennomtenkt tilnærming før vi lanserer i et nytt sted for å sikre at assistenten forstår skikker, kulturelle normer og referanser, slang, aksenter, landemerker, mennesker, virale videoer og mer! Vi lærer fortsatt, men assistenten vil fortsette å bli bedre og bedre etter hvert.

Ydmyk robot

Ryan Germick er sjefdesigner og kreativ direktør hos Google, og var med i det første teamet som jobbet med å utvikle taleassistentens «personlighet».

Den siste setningen fra Ward er nesten ord for ord det Googles taleassistent sier hvis den ikke forstår noe. Selv om vi ikke skal forsøke å forstå hvorfor Ward brukte nøyaktig denne formuleringen, kan Ryan Germick, sjef for Googles «personlighets-team», forklare hvorfor deres taleassistent bruker denne frasen: 

– Når taleassistenten ikke forstår noe vil vi at den skal fremstå som ydmyk. Det kan hende den kan tolke hvert eneste ord du sier, men å faktisk agere på de ordene er noe annet. Det er ikke alltid vi har teknologien til det, sier Gemick.

Han sier Googles taleassistent er laget med flere ledende prinsipper, som blant annet betyr at den skal vite når den skal være morsom, og når den bare skal gjøre jobben sin. 

– Ett av prinsippene vi følger er at vi vil at den alltid skal være til stede, men aldri i veien. Assistenten skal kunne hjelpe deg hvis du ber den om noe, men ellers skal den ikke være noe du trenger å tenke på. Det betyr for eksempel at hvis du ber den om å skru av lyset i stua så skal den ikke komme med en vits, den skal bare gjøre jobben. Vitsene kan komme på et annet tidspunkt, sier Gemick. 

Egen personlighet

Gemick sier de har prøvd å gi assistenten en egen personlighet, som skal være både leken, morsom og selvbevisst. Gemick jobbet tidligere med Googles «Doodles», altså alle de kreative variantene av Googles logo på Google.com, og tok med seg erfaringen derfra for å skape det vi i dag kjenner som Googles taleassistent. 

– Vi har prøvd å gjøre at de viktigste personlighetstrekkene er lik på tvers av alle landegrenser, selv om spesifikke vitser og referanser selvfølgelig ikke er like. Vi oppdaget blant annet at teite vitser, typiske «dad jokes», er noe ingen i Tyskland setter pris på, så der måtte vi justere en hel del, sier Gemick.

Men uansett hvor morsom eller omgjengelig Googles taleassistent kan virke, forsøker de aldri å gjøre den til et menneske:

– Vi prøver å fremme at selv om taleassistenten snakker som et menneske, skal vi aldri late som at den er et menneske. Vi bruker språk og tale for å gjøre teknologien mer tilgjengelig, men vi er aldri interessert i å forsøke å lure brukere til å tro at assistenten er en person. 

Den nye, norske stemmen til Google Assistant slippes altså onsdag. Du kan prøve den ut ved å gå inn på innstillinger i Google Home-appen og velge mellom de to fargene som nå er tilgjengelig. 

Norges beste mobilabonnement

Sommer 2019

Kåret av Tek-redaksjonen

Jeg bruker lite data:

Sponz 1 GB


Jeg bruker middels mye data:

GE Mobil Leve 6 GB


Jeg bruker mye data:

Chili 25 GB


Jeg er superbruker:

Chili Fri Data


Finn billigste abonnement i vår mobilkalkulator

Forsiden akkurat nå

Til toppen