Aslak Sira Myhre håper at universitet, offentlig sektor og private aktører vil ta i bruk NB Whisper.

Nasjonalbiblioteket deler kunstig intelligens 

– Skal skjønne norske dialekter og gjøre tale om til tekst. 

Publisert

Nasjonalbiblioteket har de siste årene jobbet med å lage språkkorpus som gjør at kunstige intelligenser, talemaskiner og omsetningsprogram kan skjønne norsk.

Nå har institusjonen brukt disse ressursene til å trene opp et program for automatisk konvertering av norsk tale til tekst. NB Whisper skal ha bedre forståelse av norsk tale og norske dialekter enn lignende program som har vært utviklet fram til nå. 

Det kommer fram i en pressemelding. 

– Dette er et viktig arbeid for å sikre at kunstige intelligenser, språkmodeller og redskap for alt fra helse til utdanning fungerer på norsk i framtida, sier nasjonalbibliotekar Aslak Sira Myhre i pressemeldingen. 

Programmet, som er en ny modell av maskinlæringsprogrammet Whisper, er nå fritt tilgjengelig i en betaversjon. 

– Vi deler alt vi gjør, og dermed ble ressursene vi lager, en plattform for utvikling av norsk språk i maskinene sin verden. Språkmodellen er langt fra feilfri, men han er bedre rusta til å forstå norsk tale og dialekter enn andre program som er tilgjengelige. Vi ønsker at så mange som mulig vil ta han i bruk, gi oss tilbakemeldinger og med det bidra til å gjøre han enda bedre. 

Aslak Sira Myhre håper at universitet, offentlig sektor og private aktører vil ta i bruk NB Whisper. Norske mediebedrifter kan nytte modellen til å forbedre transkripsjonsprogram de selv har utvikla. 

Nasjonalbiblioteket ønsker å bruke programmet for å gjøre samlinga enda mer tilgjengelig for publikum.

– Vi har et håp om å bruke denne modellen på våre egne arkiv. Om vi for eksempel kan transkribere radioarkivet, vil det bli søkbart, og dermed åpent på en helt annen måte for folk, sier Sira Myhre.

Nasjonalbibliotekets arbeid med språkteknologi

Nasjonalbiblioteket bidrar til å utvikle språkteknologi som det ville vært svært kostnadskrevende for de store teknologiselskapene å gjøre selv. Arbeidet med ressurser på norsk er et viktig språkpolitisk verktøy. Det sikrer at digitale tjenester og programvarer finnes på norsk - som har et stort mangfold av dialekter og i verdenssamenheng er et veldig lite språk. 

Nasjonalbiblioteket har òg trent en modell for å støtte nordsamisk språk, men har så langt for lite data til at modellen yter like godt som på bokmål og nynorsk. 

Powered by Labrador CMS