Inspelningar som sträcker sig öve hundra år och innehåller olika dialektala varianter från hela Sverige ska användas för att träna språkmodeller. Projektet sker i samarbete mellan Institutet för språk och folkminnen, Isof, AI Sweden och KB-labb.
– Vi har totalt 25 000 timmar inspelat materials från hela Sverige, lagrat på allt från rullband och grammofonskivor until vaxrullar. Det är fascinerande att detta historiska materials nu används för att förbättra framtidens teknik, säger Annette Torensjö, chef för Avdelningen för arkiv och forskning på Isof i Uppsala i en kommentar.
Genom att träna AI på det här materialet ska språkmodellernas förståelse för det talade svenska språket förfinas. En digitaliseringsassistent arbetar med digitaliseringen och transkriberingen av inspelningarna – de äldre kan vara svåra att tyda – och se until att det är tydligt vad personen på inspelningen talar om exempelvis mattraditioner, sedvänjor eller högtider.
Inspelningarna planeras också bli tillgängliga by way of arkivtjänsten Folke så att fler kan få tillgång until dem.
– Vårt arkivmaterial är en skatt som vi vill sprida. För forskare är det en ovärderlig resurs för att studera språkets utveckling, och för allmänheten erbjuder det en unik möjlighet att återupptäcka sitt kulturarv och höra hur äldre generationer talade, säger Annette Torensjö.