Norsk dagligtale er et mangfold av dialekter. Med to normerte norske skriftspråk - bokmål og nynorsk, har det vært utfordrende å utvikle talegjenkjenningsteknologi. Dette har også vært en utfordring for Stortinget, som nå har tatt i bruk automatisk transkribering av talene i stortingssalen.

Stortinget har tatt i bruk talegjenkjenningsteknologi ved skriving av stortingsreferatet. Fram til 2009 ble det gitt opplæring i stenografi for referentene. Fram til nå har stortingereferatet blitt skrevet ut fra grunnen av ved hjelp av lydfil og bruk av tastatur. I fjor ble det innført en løsning med talegjenkjenningsteknologi basert på kunstig intelligens.

– Arbeidet med omleggingen startet allerede i 2017, forteller Eli Fiskvik, avdelingssjef i kunnskaps- og dokumentasjonsavdelingen som også inkluderer referentseksjonen. – Vi tok kontakt med NAV, Språkbanken, Språkrådet og andre parlamenter, da spesielt Alltinget på Island og Folketinget i Danmark, som allerede da var i gang med ulike typer talegjenkjenningsteknologi. Vi laget en rapport om det vi fant og lyste ut en konkurranse for anskaffelse av en talegjenkjenningsløsning. Det danske firmaet Dictus fikk oppdraget, forteller hun.

Prosjektet er blitt gjennomført i to faser, hvor den første fasen ble avsluttet i april-mai 2021. Da ble automatisk transkribering til bokmål tatt i bruk. Den neste fasen ble avsluttet i april 2022. I denne fasen ble også nynorsk transkribering satt i drift, samtidig som det arbeides med kontinuerlig forbedring av løsningen. Talegjenkjenningsløsningen er et lærende system som forbedres gjennom bruk. Det er lagt ned mye arbeid for å «trene» løsningen til å bli stadig bedre. Alltinget på Island tok i bruk talegjenkjenningsteknologi allerede i 2019 etter et samarbeid mellom Alltinget og universitetet i Reykjavik for å fremme islandsk språkteknologi. 

Utfordringer med nynorsk

Det er viktig for Stortinget å ha nynorsk som mulig referatspråk. En utfordring med nynorsk er i midlertidig at det finnes lite tilgjengelig materiale som systemet kan «trenes» med. – Kun om lag 10 % av alle innleggene i Stortinget er på nynorsk, forteller Fiskvik. – En annen utfordring er at mange som ønsker å bli referert på nynorsk, bruker en god del bokmålsord i sin dagligtale. Hvordan skal løsningen håndtere dette? Dersom vi bare tillater normerte nynorskord i løsningen, vil talegjenkjenningen ikke gi et riktig bilde av det som blir sagt fra talerstolen, sier Fiskvik. Dette er dilemmaer vi arbeider for å løse.

Nynorsk var også en utfordring som Dictus, som har levert talegjenkjenningssystemet til Stortinget, ble mer klar over etter hvert.

– Som dansker var vi klar over at nordmenn ikke har ett nasjonalt formelt språk og har to skriftlige språk. I vår naivitet tenkte vi at hvis vi kan lage en norsk talegjenkjenner (bokmål), så kan vi sannsynligvis også lage to. Det vi ikke hadde innsett var at en stortingsrepresentant som snakker en bokmålsnær dialekt, kanskje ønsker å bli referert på nynorsk, noe som er en stor utfordring for tale-til-tekst. Hadde vi basert løsningen vår på teknologigigantenes svært lukkede talegjenkjennere, ville oppgaven vært umulig å løse. Men ved hjelp av Open Source Software og Språkbanken, har vi levert en veldig god løsning for automatisk å generere det første utkastet til det som sies fra podiet i Stortingssalen. En løsning som også blir bedre dag for dag med oppgradering av språkmodellene for både bokmål og nynorsk, sier Jens Otto Kjærum, administrerende direktør i Dictus.

I det videre arbeidet i Stortinget vil referentene bruke tale-til-tekst-løsningen på de innleggene som egner seg for det. Alt blir ikke overlatt til teknologien, forklarer Eli Fiskvik.

– Referentene finnes fremdeles i Stortinget, men nå får de en automatisk transkripsjon som utgangspunkt framfor å skrive alt selv. Vi har et veldig dyktig referentkorps her, og våre krav til kvalitet på referatene er de samme selv om vi nå bruker talegjenkjenningsteknologi. Stortinget jobber langsiktig med teknologi og vil kanskje ta automatisk transkribering i bruk også i andre sammenhenger, som for eksempel i høringer eller til teksting av videostrømminger.  

– Erfaringene vi fikk med oss fra Island, sier Fiskvik, er at det er svært viktig at tekstkorpuset i løsningen er relevant for det området det skal brukes på. Det vil si at løsningen må omfatte det vokabularet man arbeider med, og at løsningen må «trenes» til å kjenne igjen det vokabularet som brukes på Stortinget.

Talegjenkjenning hjelper også personer med nedsatt funksjonsevne

Talegjenkjenning er også et viktig verktøy for personer som har problemer med å bruke vanlig tastatur og mus. Denne gruppen kan bruke talegjenkjenning for å kunne styre datamaskinen og diktere tekst ved hjelp av tale. Det er nå kommet løsninger på markedet hvor denne funksjonaliteten er tilgjengelig også på nynorsk. En annen gruppe som kan ha behov for talegjenkjenning er personer med ulike former for muskelsykdommer, senebetennelse og andre lidelser i hender og armer. Dyslektikere med skrivevansker og synshemmede kan bruke talegjenkjenning for diktering til tekst.

Stortingsbygget med løve i forgrunnen

Moderne teknologi har inntatt den ærverdige, gamle bygningen (Foto: Istock)