Jarvesalu Logo Jarvesalu Võtke Ühendust
Võtke Ühendust

Teadus ja tehnoloogia käsikäes

9 min lugemist Kesktase Märts 2026

Kuidas keeleteadlased ja tarkvarainsenerid töötavad koos, et teha eestikeelne tehnoloogia paremaks ja kättesaadavamaks kõigile?

Keeleteadlane ja programmeerija koostöös, valge tahvel keelestruktuuriga, arvutiekraan koodiga
Kaarina Kõlvart

Kaarina Kõlvart

Keeletehnoloogia juht

Keeletehnoloogia juht, kes on spetsialiseerunud eestikeelsele kõnetuvastusele ja digitaalarhiivide arendamisele.

Kaks maailma, üks eesmärk

Teadus ja tehnoloogia on tundunud pikka aega eraldiseisvate valdkondadena. Keeleteadlased uurivad keele struktuuri ja loomulikkust. Tarkvarainsenerid kirjutavad koodi. Kuid nüüd on selge — kui need kaks maailma kohtuvad, juhtub midagi võimast.

Eestis käib see koostöö juba. Keeleteadlased annavad inseneridele teadmisi, kuidas eesti keel töötab. Insenerid teevad tarkvarast, mis seda teadmist kasutab. Tulemus? Tööriistad, mis on eestikeelsele inimesele arusaadavad ja kasulikud.

Seminariruum, kus keeleteadlased ja insenerid diskuteerivad koos, tahvlil märksõnad ja diagrammid

Kõnetuvastus — teadusest praktikasse

Kuidas muudetakse räägitud sõnad tekstiks? See pole lihtsalt mikrofon ja salvestus. Teadlased on aastakümneid uurinud, kuidas eesti keelel on oma helistruktuur — kuidas eri häälid kombineeruvad, kuidas rõhk muudab sõna tähendust, kuidas kiirem rääkimine segab sõnade piire.

Insenerid võtavad selle teadmise ja koondavad selle mudelisse. Mudel kuulab, eraldab helistruktuuri ja arvab välja, milliseid sõnu kuuldakse. See pole nagu English Google Translate — siin on keeleteatrid käsil olnud, et mudel õpiksid eesti keele peenused.

Praktika? Õpetajad salvestavad loenguid. Videotöötlejad saavad tekstifaili sekunditega. Ei pea käsitsi kulatulemuste kokkukirjutamisega raisama aega. Dokumentide läbiotsitavus paraneb. Ja kuulamispuudega inimesed saavad pääsu materjaalile, millest enne võis aimu saada vaid kuulmise teel.

Stuudiomikrofon sinise akustiilse paneeliga, arvutiekraan kõnetuvastusega seadistusega

Miks see oluline on

  • Ligipääs: Kuulamispuudega inimesed saavad videotest ja loengust aru tekstist
  • Aja kokkuhoid: Ei pea käsitsi sõna sõnalt kulatulemusi kirja panema
  • Keele säilimine: Eestikeelsed tööriistad tagavad, et meie keel jääb asjakohaseks
  • Täpsus: Keeleteadlaste teadmus parandab tulemuste täpsust ja usaldusväärset

Kuidas teadus ja tehnoloogia käsikäes töötavad

Keeleteadus

Teadlased uurivad eesti keele struktuurit, heliasid ja grammatikat. Dokumenteerivad, kuidas keelest rääkijad tegelikult kõnelevad — mitte kuidas grammatika raamatud ütlevad, vaid päriselt.

Tarkvara

Insenerid tõlgivad selle teadmise masinõpetuse mudelisse. Koondavad näited, treeniivad algoritme ja testavad tulemusi pärisandmetega, kuni mudel õpib eesti keele nuansse.

Koostöö

Parimad tulemused tekivad siis, kui teadlased ja insenerid istuvad ühes toas. Teadlased ütlevad: "Oota, siin on probleem keelega." Insenerid küsivad: "Kuidas me seda parandame?"

Kasutajad

Lõpuks on see kõik kasutajate heaks. Õpetajad, videotöötlejad, teadusarhiivid ja tavainimesed saavad tööriistu, mis töötavad nende keeles ja nende vajaduste järgi.

Õpetaja klassiruumis, kasutades arvutit video subtiitritega, õpilased vaatavad ette

Praktiline näide: Õppevideod koolidele

Kool filmib füüsika tunni. Õpetaja seletab Newtoni seadusi. Enne pidanuks keegi selle video käsitsi subtiitleidma — kuulata, pauzida, kirjutada, joondada. See võttis tunde.

Nüüd: Video laaditakse tarkvarasse. Keeletööriistad käivad. Viis minutit hiljem on kogu tekst olemas ja joondatud videoga. Kuulamispuudega õpilane saab tunni järgida. Õpetaja saab aega teisele poole teha — näiteks sisu parandamisele.

Taga on keeleteadlaste töö — nad aitasid inseneridel mõista, kuidas eesti keel hääldub, kuidas eri aktsendiga inimesed räägivad, kuidas klassiruumi müra võib häirida. Selle teadmisega on mudel täpsem ja usaldusväärsem.

Millised on tegelikud väljakutsed?

Koostöö pole alati lihtne. Teadlased räägivad ühe keelega — statistika, foneetika, morfoloogia. Insenerid teise — vektorid, neuronaalvõrgud, kiirendus. Mõistetavad peab looma ühise keele.

Teiseks: Andmeid on raske koguda. Masinõpe vajavad tuhandetest näitest. Eestis pole just nii palju salvestusi ja transkriptsioone nagu näiteks inglise keelel. Keeleteadlased ja insenerid peavad koostöös andmeid korjama, märgistama, kontrollima — see on töömahukas, kuid oluline.

Kolmandaks: Keele areng ei peatu. Uued sõnad, uus slängi, uued aktsendid tekivad pidevalt. Tööriistad peavad kasvama koos keelega. See tähendab, et koostöö on pideva — mitte üheainne projekt, vaid alaline partnerlus.

Suurel ekraanil andmeanalüüs ja graafikud, teaduslikud graafikud, arvutilaborant uurib tulemusi

Tuleviku nägemus

Kuhu see kõik viib? Igas osas, kus keelt kasutatakse, võib teadus ja tehnoloogia käsikäes tegutseda. Avalikud dokumendid, mis on selgelt kirjutatud ja lihtsasti otsitavad. Arhiivid, kus teadus saab leida varasemad tööd kiiresti. Videod ja audioallikad, mida kõik saavad kasutada — nii nägejatest kui kuulmispuudega inimesed.

See pole luksus. See on ligipääs. See on keele säilimine. See on ühiskonnas kõikidele kättesaadav teadus ja info.

Ja see kõik algab kahest valdkonnast, mis õpivad üksteisest — keeleteadusest ja tarkvaraarendusest. Koos.

Teabeavaldus

See artikkel on informatiivne ja hariduslik materjalid, mille eesmärk on anda ülevaade keeletehnoloogia ja teadusuuringute koostöö võimalustest Eestis. Artiklis kirjeldatud tehnikad ja tööriistad on reaalse rakendusega, kuid konkreetne rakendamine võib erineda. Igal juhul soovitame Teil kontrollida ajakohaseid juhiseid ja konsulteerida spetsialistidega, enne kui midagi praktiliselt rakendama hakatakse.