Til hovedinnhold

«Clara» og «Hulda» vil hjelpe 100.000 nordmenn

Hør Norges første robotstemme med vestnorsk tonefall.

Bildet viser at tekstbolken som leses av den nye talesyntesestemmen fortløpende markeres i gult på skjermen, så brukeren kan følge med hvor i teksten de er.

– Jeg liker at jobben er meningsfull. Det er helt topp at jeg kan hjelpe mennesker...

Slik lyder den halvmekaniske stemmen fra «Hulda». Dette er Norsk lyd- og blindeskriftbiblioteks (NLB) nyeste «robotstemme», eller talesyntese, som skal gjøre det lettere for omtrent 100.000 nordmenn å lytte til tekster.

Talesyntese er en programvare som fortløpende tolker og leser opp tekst for blinde, svaksynte og personer med dysleksi eller andre lesevansker.

Nyheten betyr at nordmenn med slike funksjonsnedsettelser fremover vil få et bedre tilbud når de vil ta utdanning, tilegne seg ny kunnskap, følge med på nyheter eller fordype seg i litteratur.

Den nye talesyntesen lanseres med to stemmer som brukerne kan velge mellom.

«Hulda» blir landets første stemme til å lese opp tekst med nynorsk uttale og vestnorsk tonefall. Med seg på laget får hun «Clara», som leser tekst på bokmål.

Hør de nye stemmene lese opp tekst her:

Har brukt maskinlæring for å gi bedre flyt

I en pressemelding skriver NLB at de nye talesyntesene skal ha bedre kvalitet og være i stand til å lese opp tekst mer naturlig enn tidligere, blant annet med mer naturlig flyt.

Talesynteser som Hulda og Clara er utviklet ved at et menneske leser inn store mengder tekst. Segmenter av dette opptaket blir så satt sammen fortløpende i syntesen.

Maskinlæring brukes for å trene opp systemet, men så må utviklerne formulere regler for hvordan talesyntesen skal fungere. En rekke ting må spesifiseres, for eksempel hvordan forkortelser, tall og spesialtegn skal uttrykkes. Et eget «uttaleleksikon» spesifiserer uttalen av ordene.

– Vi er fornøyde med resultatet, men kommer til å fortsette å forbedre både uttale av enkeltord, forkortelser og spesialtegn. Talesyntesestemmer blir egentlig aldri helt ferdig utviklet, for språket endrer seg og nye ord kommer til hele tiden, skriver utvikleren av talesyntesen, CereProc.

– Noen kaller talesyntese en «irriterende robotstemme». Min erfaring er at de som har lesevansker fort blir vant til talesyntese. For dem er det viktigere om de får tilgang til teksten eller ikke, forteller Mari Myksvoll i NLB.

Særnorske hensyn

Benedicte Frostad i Norsk Språkråd, som tidligere har jobbet med utvikling av norske talesynteser for blant andre Google og Nuance (som står bak Siri, taleassistenten til Apple red.anm.), forteller at det er mange særnorske hensyn å ta i en utviklingsprosess:

– Den situasjonen vi har i Norge med to offisielle skriftspråk, samtidig som det ikke finnes noe standard talespråk er det ikke så mange andre land som har. Det kan være krevende med tanke på både talesyntese og talegjenkjenning. Det andre er at norsk er et tonespråk, der det noen ganger bare er tonen som gir betydningsmessig forskjell mellom to ord.

Betyr dagferske aviser og tekster

Særlig er talesyntese viktig for «ferskvare», som trykte aviser og tidsskrifter. Dette er tekster som man kan bruke automatisk talesyntese på. Da kan innholdet gjøres tilgjengelig av en datamaskin over natten, heller enn å vente på at en person skal sette seg ned å spille inn lydopptak av artiklene.

Den automatiske talesyntesen betyr også at fersk studielitteratur kan gjøres tilgjengelig for studenter raskt, og før det gjenstår noen uker av semesteret som har kunnet være tilfelle tidligere.

Innholdet fra Norsk lyd- og blindeskriftbibliotek speiler det som er tilgjengelig fysisk i norske biblioteker. Personer med nedsatt syn eller lesevansker kan låne talesyntetisert eller innlest innhold gratis via nettjenesten deres.

annonse