| Dokumendiregister | Kaitseministeerium |
| Viit | 5-9/26/5 |
| Registreeritud | 04.02.2026 |
| Sünkroonitud | 05.02.2026 |
| Liik | Sissetulev kiri |
| Funktsioon | - - |
| Sari | - - |
| Toimik | - - |
| Juurdepääsupiirang | Avalik |
| Juurdepääsupiirang | |
| Adressaat | Justiits- ja Digiministeerium |
| Saabumis/saatmisviis | Justiits- ja Digiministeerium |
| Vastutaja | |
| Originaal | Ava uues aknas |
EELNÕU 4/02/2026.a.
VABARIIGI VALITSUS
MÄÄRUS
Muud väärtuslike andmestike kategooriad, nende andmestike nimekirjad ning avaldamise ja taaskasutamise tingimused ja kord Määrus kehtestatakse avaliku teabe seaduse § 41 lõike 3 alusel. § 1. Väärtuslike andmestike kategooriate nimekiri Lisaks avaliku teabe seaduse § 41 lõikes 2 sätestatule lisatakse väärtuslike andmestike kategooriate nimekirja ka: 1) keeleandmestikud; 2) teabevaldaja või teabevaldaja rahastuse toel saadud või loodud uuringud, teadustööd ja analüüsid ning nende alusandmed. § 2. Keeleandmestike nimekiri Keeleandmestike nimekirja kuuluvad järgmised teabevaldaja valduses olevad, teabevaldaja loodud või teabevaldaja vahenditest rahastatud andmestikud osas, mille suhtes ei ole kehtestatud juurdepääsupiirangut või mille puhul on võimalik piiranguga osa eraldada: 1) nimeloendid; 2) terminibaasid; 3) tõlked koos lähtekeele tekstiga, tõlkemälud ja järeltoimetatud masintõlked; 4) kõneandmestikud. § 3. Keeleandmestiku avaldamise tingimused ja kord (1) Keeleandmestik peab olema tasuta kättesaadav rakendusliidese kaudu, masinloetavas vormingus ning asjakohasel juhul võimaldama hulgiallalaadimist. (2) Keeleandmestike nimekirja lisatud andmestike andmekirjeldused avaldatakse Eesti teabevärava kaudu. Keeleandmestikke võib säilitada ka teemapõhistes digihoidlates või mujal avalikult kättesaadavas andmetaristus, kui andmekirjeldus ja viide andmestikule on kättesaadavad Eesti teabevärava kaudu. § 5. Keeleandmestiku taaskasutamise tingimused Keeleandmestikul kui kõigile vabalt ja avalikult kasutamiseks antud masinloetavs vormingus andmestikul puuduvad kasutamist ning levitamist takistavad piirangud. Keeleandmestikku avalikustades lisab teabevaldaja andmestikule taaskasutamise tingimusi selgelt kindlaks määrava litsentsi. § 6. Uuringute, teadustööde ja analüüside ning nende alusandmete avaldamise kohustus (1) Teabevaldaja on kohustatud avalikustama tema poolt või teabevaldaja rahastuse toel saadud või loodud uuringud, teadustööd ja analüüsid. (2) Määruse tähenduses mõistetakse uuringu, teadustöö ja analüüsi all avalike ülesannete täitmise raames loodud või saadud süstemaatilist teadmusloomet, mille tulemused on vormistatud eraldi dokumendina.
2
(3) Lõikes 2 nimetatud uuringuid, teadustöid ja analüüse avalikustades tuleb avalikustada ka nende alusandmed, metoodika ja metaandmed avatud masinloetavas vormingus, kui seadusest ei tulene teisiti. (4) Kui alusandmete täielik avalikustamine ei ole võimalik isikuandmete kaitse, intellektuaalomandi õiguse, ärisaladuse või muu seadusest tuleneva piirangu tõttu, avalikustab teabevaldaja: 1) andmed koondatud kujul; 2) alusandmete metaandmed; 3) metoodika kirjelduse; 4) põhjenduse alusandmete täieliku või osalise avalikustamata jätmise kohta. (5) Uuringud, teadustööd, analüüsid ja nende alusandmete kirjeldused avaldatakse Eesti teabevärava kaudu. Kui uuringud, teadustööd, analüüsid kirjeldused asuvad muus avalikult kättesaadavas digihoidlas, suunatakse nendeni Eesti teabeväravas avaldatud elektroonilise viitega. (6) Uuringud, teadustööd, analüüsid avalikustatakse viivitamata, kuid hiljemalt 30 päeva pärast seda, kui teabevaldaja on kinnitanud uuringu, teadustöö või analüüsi lõpparuande. (7) Kui teabevaldaja avalikustab mitu uuringut, teadustööd, analüüsi ühtses avalikus digihoidlas, loetakse avalikustamiskohustus täidetuks ka juhul, kui Eesti teabeväravas on avaldatud üks koondandmekirjeldus ja elektrooniline viide digihoidlale, tingimusel et: 1) digihoidla võimaldab andmete kättesaadavust masinloetavas vormingus; 2) uuringud, teadustööd, analüüsid on asjakohasel juhul kättesaadavad hulgiallalaaditavana; 3) üksikute uuringute, teadustööde ja analüüside metaandmed on digihoidlas eristatavad. § 7. Määruse kohaldamine enne selle jõustumist tehtud uuringutele, teadustöödele ja analüüsidele ning nende alusandmetele Enne määruse jõustumist tehtud uuringud, teadustööd ja analüüsid koos nende alusandmete, metoodika ja metaandmetega tuleb kuue kuu jooksul määruse jõustumisest arvates avalikustada ulatuses, milles nende avalikustamine on mõistlik. Nimetatud uuringute, teadustööde ja analüüside ning nende alusandmete metaandmed tuleb avalikustada hiljemalt kuus kuud pärast määruse jõustumist. Kristen Michal peaminister Liisa-Ly Pakosta justiits- ja digiminister Keit Kasemets riigisekretär
Suur-Ameerika 1 / 10122 Tallinn / +372 620 8100 / [email protected]/ www.justdigi.ee Registrikood 70000898
Vabariigi
Ministeeriumid Vabariigi Valitsuse määruse „Muud väärtuslike andmestike kategooriad, nende andmestike nimekirjad ning avaldamise ja taaskasutamise tingimused ja kord“ eelnõu kooskõlastamine Saadame ministeeriumidele kooskõlastamiseks ja asjaomastele organisatsioonidele arvamuse avaldamiseks Vabariigi Valitsuse määruse „Muud väärtuslike andmestike kategooriad, nende andmestike nimekirjad ning avaldamise ja taaskasutamise tingimused ja kord“ eelnõu. Palume Teie kooskõlastust või arvamust 10 tööpäeva jooksul. Lugupidamisega (allkirjastatud digitaalselt) Liisa-Ly Pakosta justiits- ja digiminister Lisad: seletuskiri ja eelnõu /*Lisaadressaadid: Eesti Keele Instituut Maa- ja Ruumiamet Eesti Linnade ja Valdade Liit Eesti Kirjandusmuuseum Eesti Rahvamuuseum Eesti Rahvusraamatukogu Rahvusarhiiv Eesti Tõlkebüroode Liit Tartu Ülikool Tallinna Ülikool Tallinna Tehnikaülikool Eesti Maaülikool Andmekaitse Inspektsioon
Meie 04.02.2026 nr 8-1/890-1
1
Vabariigi Valitsuse määruse „Muud väärtuslike andmestike kategooriad, nende
andmestike nimekirjad ning avaldamise ja taaskasutamise tingimused ja kord“ eelnõu
seletuskiri
1. Sissejuhatus
Määrus kehtestatakse avaliku teabe seaduse § 41 lõike 3 alusel.
Vabariigi Valitsuse määruse „Muud väärtuslike andmestike kategooriad, nende andmestike
nimekirjad ning avaldamise ja taaskasutamise tingimused ja kord“ eelnõu (edaspidi eelnõu)
eesmärk on kehtestada väärtuslike andmestike nimekirjana keeleandmestikud ning avaliku
sektori uuringud, teadustööd ja analüüsid ning nende alusandmed ning nende avaldamise ja
taaskasutamise tingimused ja kord. Määrust on võimalik tulevikus vajaduse tekkimisel uute
andmestike kategooriatega täiendada.
Keeleandmestike nimekirja kehtestamine panustab eesti keele jätkusuutlikkuse tagamisse ja
toetab keeletehnoloogia arendamist. Seeläbi on võimalik muu hulgas parandada eesti keele
kvaliteeti suurtes keelemudelites. Väärtuslike keeleandmestike kättesaadavus loob eelduse, et
keeletehnoloogiat rakendavad teenused oleks kvaliteetsemad, kättesaadavad ja ligipääsetavad
ning piiriülene kaubandus lihtsam (näiteks masintõlke rakendamise abil) nii era- kui ka avalikus
sektoris.
Keeleandmestikud on struktureeritud või kirjeldatud keeleandmed, mis võimaldavad keelt
masinloetaval kujul töödelda, ning nende valdkondadeülene tähtsus seisneb selles, et neid
kasutatakse alusandmetena väga laias ringis avaliku ja erasektori digiteenustes, sõltumata
valdkonnast, sealhulgas tehisintellektil ja suurtel keelemudelitel põhinevates lahendustes.
Andmestiku puhul on tegemist ühtlasi avaliku teabega avaliku teabe seaduse mõistes (AvTS).
Ka avalik teave võib olla mis iganes viisil ja mis iganes teabekandjal olev teave (AvTS § 3).
Lisaks keeleandmestikele käsitleb määrus avaliku sektori (edaspidi ka teabevaldaja) või avaliku
sektori rahastuse toel tehtud uuringuid, teadustöid ja analüüse ning nende alusandmeid
väärtuslike andmestikena. Nimetatud uuringud ja analüüsid moodustavad olulise osa avaliku
sektori teadmusloomest ning nende avalikustamine võimaldab avaliku raha eest loodud
teadmiste läbipaistvat kasutamist, korduvkasutust ja kontrollitavust. Seeläbi toetab määrus
teadmuspõhist poliitikakujundamist, teadus- ja arendustegevust ning andmepõhiste teenuste
arengut.
Keeletehnoloogiliste lahenduste arendamisel ja kasutamisel on olulisel määral aluseks
avaandmed, mis tagavad võrdse ligipääsu andmetele ning loovad eeldused väikese ja keskmise
suurusega ettevõtjate osalemiseks digiteenuste arendamises. Avaandmete taaskasutamine aitab
vähendada avaliku sektori kulusid ning soodustab ettevõtluse ja innovatsiooni arengut. Suured
keelemudelid sõltuvad kvaliteetsetest, mitmekesistest ja usaldusväärsetest keeleandmetest.
Väikese kõnelejaskonnaga keelte, sealhulgas eesti keele puhul on avaliku sektori loodud ja
rahastatud keeleandmestikel keskne roll keele digitaalse kasutatavuse ja jätkusuutliku arengu
tagamisel.
Määrus parandab keeleandmestike ning avaliku sektori tehtud või tellitud uuringute,
teadustööde ja analüüside kättesaadavust, aidates seeläbi vähendada avalikus sektoris tehtavate
uuringute ja analüüside dubleerimist, suurendada nende taaskasutust ning tuua kaasa
kokkuhoidu avaliku sektori kuludes. Keeleandmestike parem kättesaadavus loob ettevõtjatele
ja teadusasutustele eelduse keeletehnoloogiat kasutavate uuenduslike teenuste ja toodete
arendamiseks ning teadustööks.
2
Määruse rakendamine ei suurenda inimeste, ettevõtjate ega vabaühenduste halduskoormust
ning avaliku sektori töökoormuse kasv on vähene.
Määruse eelnõu ja seletuskirja on koostanud Justiits- ja Digiministeeriumi digiriigi osakonna
AI ja andmete talituse juhataja Ott Velsberg (tel 5661 4194, e-post [email protected]) ja
õiguspoliitika osakonna andmekaitseõiguse talituse nõunik Helen Uustalu (tel 5334 5676, e-
post [email protected]). Eelnõu ja seletuskirja koostamisse kaasati Eesti Keele
Instituut. Eelnõu ja seletuskirja on keeleliselt toimetanud Justiits- ja Digiministeeriumi
õigusloome korralduse talituse toimetaja Inge Mehide (e-post [email protected]).
2. Eelnõu sisu ja võrdlev analüüs
Eelnõu koosneb kuuest paragrahvist.
Kuna määruse reguleerimisala kordaks määruse pealkirja, siis vastavalt hea õigusloome ja
normitehnika eeskirjale reguleerimisala sätet eraldi ette ei nähta. Määrus kehtestab
olemasolevate andmete ja dokumentide avalikustamise ning taaskasutamise tingimused
kooskõlas avaliku teabe seadusega.
Eelnõu §-ga 1 nähakse ette väärtuslike andmestike kategooriate nimekiri, millesse lisatakse
peale Euroopa Liidu tasandil kokkulepitu määruse kohaselt ka keeleandmestikud ning
teabevaldaja või avaliku sektori rahastuse toel saadud ja loodud uuringud, teadustööd ja
analüüsid koos nende alusandmetega.
Eelnõus lähtutakse avaandmete direktiivi1 uuest kontseptsioonist – väärtuslike andmestike
taaskasutamist seostatakse ühiskonnale, keskkonnale ja majandusele tekkivate oluliste
hüvedega, sest need sobivad lisaväärtusteenuste ja -rakenduste loomiseks –, arvestades
seejuures ka keeleandmete rolli suurte keelemudelite treenimisel ja hindamisel.
Eesti keel on rahvust ja kultuuri ühendav lüli ning selle püsimajäämine on oluline. Põhiseadus
teeb riigile ülesandeks kaitsta ka eesti keelt kui eesti kultuuri säilimise olulist eeldust.2 Keel on
elujõuline, kui suudab ühiskonnas toimuvate muudatustega kaasas käia ja kui seda saab
kasutada igal elualal3. Keeletehnoloogiate ja tehisintellektil põhinevate lahenduste kiire
arenguga kaasneb oht, et väikese kõnelejaskonnaga keeled jäävad digitehnoloogiate arengust
kõrvale, mis võib suurendada keelepõhist ebavõrdsust ning piirata ligipääsu majanduslikele,
hariduslikele ja ühiskondlikele võimalustele4.
Uuringute, teadustööde ja analüüside koos nende alusandmetega väärtuslike andmestike
kategooriana määratlemine on oluline, et tagada, et avaliku raha eest loodud teadmised oleksid
avalikkusele läbipaistvad, korduvkasutatavad ja kontrollitavad, kooskõlas avaliku teabe
seaduse ning avaandmete põhimõtetega.
Eelnõu § 2 sätestab selliste keeleandmestike nimekirja, mida käsitletakse väärtuslike
keeleandmestikena ning mis kuuluvad avaandmetena avaldamiseks. Väärtuslike keeleandmete
1 Euroopa Parlamendi ja nõukogu 20. juuni 2019. aasta direktiiv (EL) 2019/1024 avaandmete ja avaliku sektori valduses oleva teabe taaskasutamise kohta (ELT L 172, 26.6.2019, lk 56-83) 2 Eesti Vabariigi põhiseadus. Kommenteeritud väljaanne, preambul. https://pohiseadus.ee/sisu/3467 3 Eesti keele arengukava 2021–2035. Haridus- ja Teadusministeerium, 2021. https://www.hm.ee/sites/default/files/documents/2022- 09/htm_eesti_keele_arengukava_2020_a4_web.pdf 4 Vt nt diskussiooni väljaandes Stanford Report. How AI is leaving non-English speakers behind, 2025.
https://news.stanford.edu/stories/2025/05/digital-divide-ai-llms-exclusion-non-english-speakers-research
3
nimekirja kuuluvad avaliku sektori valduses olevad, avaliku sektori loodud või avaliku sektori
rahastatud juurdepääsupiiranguta, sh üks-, kaks- ja mitmekeelsed keeleandmestikud ning
kõneandmestikud. Euroopa Komisjon veab projekti European Language Data Space5, mille
eesmärk on luua usaldusväärne turg/platvorm keeleandmete ja keeleressursside vahetuseks
kooskõlas ELi andmestrateegiaga. See on väga selge poliitiline signaal, et keeleandmeid
käsitletakse majandusliku ja ühiskondliku väärtusega andmetena.
Keeleandmestike nimekirja kuuluvatena sätestatakse need keeleandmestikud, mille kasutamine
panustab eesti keele jätkusuutlikkuse tagamisse ja toetab keeletehnoloogia arendamist ning
parandab muu hulgas keeletehnoloogiliste rakenduste kvaliteeti. Võimalikult paljude
kvaliteetsete eestikeelsete tekstide kättesaadavus avaandmetena hõlbustab teadusuuringute
tegemist, aitab luua ja ajakohasena hoida keeleandmeid kasutavaid süsteeme, toetab
tänapäevaste sõnastike koostamist jm. Keeleandmestike nimekirja sätestamisel on lähtutud
andmete taaskasutajate vajadustest.
Määrus kohaldub keeleandmestike nendele osadele, mille suhtes ei ole kehtestatud
juurdepääsupiirangut või mille puhul on võimalik piiranguga osa eraldada. See tagab, et määrus
ei kohusta avalikustama andmeid, millele kehtivad isikuandmete kaitse, ärisaladuse või muud
seadusest tulenevad piirangud, ning on kooskõlas avaliku teabe seaduse üldpõhimõtetega.
Punktis 1 sätestatakse, et keeleandmestike nimekirjas on avaliku sektori valduses olevad,
avaliku sektori loodud ning avaliku sektori rahastatud juurdepääsupiiranguta nimeloendid,
näiteks kohanimede, kaubamärkide, organisatsioonide ja ettevõtete nimeloendid. Nimeloendeid
kasutatakse automaatsetes info eraldamise ülesannetes, mis võimaldavad paremaid
otsingusüsteeme, andmete anonümiseerimist jms. See ei kohusta avalikustama
juurdepääsupiiranguga teavet, kui seadus seda ei nõua (nt on teatud töötajate nimed
avalikustatud seaduse alusel, vt AvTSi § 28 lg 1 p 6). Seega määrus ei reguleeri neid
andmestikke, millele kehtivad juurdepääsupiirangud.
Punktis 2 sätestatakse, et keeleandmestike nimekirjas on avaliku sektori valduses olevad,
avaliku sektori loodud ning avaliku sektori rahastatud juurdepääsupiiranguta terminibaasid,
näiteks erialased sõnakogud, sõnastikud, ärisõnastikud, sõnaloendid, ontoloogiad. Eestikeelse
terminivara avaldamine ja levitamine toetab eestikeelset kõrgharidust ja teadust, aitab kaasa
eesti keele arendamisele ja kestlikkusele ning aitab hoida eesti keelt elujõulisena ka eri
valdkondades. Arusaadav ja ajakohane terminivara ning selle järjepidev ja ühtne kasutus on
vajalik valdkondade praktiliseks toimimiseks. Terminibaasid on olulise tähtsusega eestikeelsete
suurte keelemudelite kvaliteedi tagamisel, kuna need aitavad vähendada terminoloogilisi vigu
ning võimaldavad erialakeele järjepidevat ja korrektset kasutust tehisintellektil põhinevates
süsteemides.
Punktis 3 sätestatakse, et keeleandmestike nimekirjas on avaliku sektori, avaliku raha toel
loodud ning avalikus dokumendiregistris või avalikus veebis juurdepääsupiiranguta tõlked koos
lähtekeele tekstiga, tõlkemälud ja järeltoimetatud masintõlked. Näiteks pressiteadete, uudiste jt
ametlike tekstide kvaliteetsed tõlked ja järeltoimetatud masintõlked (vandetõlkide tõlgitud
ametlikud tekstid, Riigi Teataja tõlked). Tõlkemälud on asutuste enda loodud ja/või
teenusepakkuja loodud tõlkemälud. Kui neid on tõlkimisel kasutatud, siis kuuluvad ka
tõlkemälud keeleandmestike nimekirja. Tõlkematerjale kasutatakse masintõlkesüsteemide
treenimisel ning seeläbi saavutatakse täpsem masintõlke kvaliteet. Tõlketekstide andmestik on
igal juhul väärtuslik ka laiemalt, sh teaduses, terminitöös, keeletehnoloogiate arendamisel.
5 Common european language data space, 2005. https://language-data-space.ec.europa.eu/index_en
4
Punktis 4 sätestatakse, et keeleandmestike nimekirja kuuluvad avaliku sektori valduses olevad,
avaliku sektori loodud ning avaliku sektori rahastatud juurdepääsupiiranguta kõneandmestikud,
näiteks Riigikogu ja kohalike omavalitsuste istungite, pressikonverentside jms helifailid
võimalusel koos stenogrammide ning protokollidega. Helifaile, stenogramme ning nende põhjal
loodud protokolle kasutatakse automaatse eestikeelse kõnetuvastuse treenimisel. Nagu
esimeses punktis selgitatud, kehtivad ka siin seaduses toodud üldpõhimõtted. Nii ei tule teha
kättesaadavaks teavet, mis sisaldab juurdepääsupiiranguid (nt isikuandmed) ja mida seadus ei
kohusta avalikustama. Samuti ei tule teabevaldajal avalikustada teavet osaliselt, kui
juurdepääsupiiranguga teabe eemaldamine tähendaks ebamõistlikke pingutusi.
Eelnõu § 3 reguleerib keeleandmestike avaldamise tingimusi ja korda.
Lõikes 1 on nimetatud keeleandmestike avaldamiseks vajalikud tunnused, mis on kooskõlas
avaandmete direktiivi artikli 14 lõikega 1. Selle järgi peavad väärtuslikud andmestikud olema
tasuta kättesaadavad, masinloetavad, rakendusliideste kaudu esitatavad ja asjakohasel juhul
hulgiallalaaditavad. Need tingimused kohalduvad ka keeleandmestike avaldamisele.
Lõikes 2 reguleeritakse keeleandmestike avaldamise põhitingimused. Keeleandmestike
nimekirja lisatud andmekirjeldused avaldatakse Eesti teabevärava kaudu ja seal sätestatud
tingimuste järgi. See hõlbustab info kättesaadavust ning seeläbi toodete ja teenuste
innovatsiooni.
Teabevaldaja kohustub andmekirjelduse koostama vastavalt Eesti teabeväravas sätestatud
tingimustele. Keeleandmestike kirjelduse välja kohustuslikult täidetavad osad on vähemalt
keeleandmestiku terviklik nimetus, selgitus, valdkond, märksõna(d), teabevaldaja
kontaktandmed, litsents, viide keeleandmestikule ning spetsiifiline info keeleandmestiku kohta.
Eesti teabevärav toimib keskse ligipääsupunktina keeleandmestike ning käesolevas määruses
nimetatud uuringute, teadustööde ja analüüside ning nende alusandmete metaandmetele.
Andmed ise võivad paikneda ka teemapõhistes või rahvusvahelistes andmehoidlates, kuid Eesti
teabevärava kaudu tagatakse ühtne leitavus, võrreldavus ja taaskasutatavus.
Keeleandmestikke võib säilitada ka väljaspool Eesti teabeväravat, tingimusel et Eesti
teabeväravas on avaldatud andmestiku andmekirjeldus ning viide andmestikule ning et
andmestik vastab keeleandmestike avaldamise tingimustele.
Eelnõu § 4 reguleerib keeleandmestike taaskasutamise tingimusi.
Keeleandmestikud on kõigile vabalt ja avalikult kasutamiseks antud masinloetaval kujul
andmed, millel puuduvad kasutamist ning levitamist takistavad piirangud. Keeleandmestikud
antakse taaskasutamisse üldjuhul tingimusteta. Avaldatud andmetele tuleb lisada kasutuskorda
märkiv litsents, soovitatavalt CC-BY. Taaskasutamise tingimused avalikustab AvTSi § 321
lõikes 2 nimetatud asutus Eesti teabeväravas.
AvTSi § 31 lõike 9 kohaselt peavad Eesti teabeväravas avaldatud keeleandmestikud olema
piiranguteta vabakasutuses, sh peab olema lubatud ka nende ärilistel eesmärkidel kasutamine,
põhjendatud juhtudel võib lubada vähem avatud litsentse. Taaskasutamise tingimused peavad
olema kättesaadavad masinloetaval kujul ja avatud vormingus.
Eelnõu §-s 5 sätestatakse teabevaldaja või teabevaldaja rahastuse toel tehtud uuringute,
teadustööde ja analüüside ning nende alusandmete avalikustamise kohustus.
5
Käesoleva paragrahvi kohaldamisalasse kuuluvad avalike ülesannete täitmise raames koostatud
või tellitud süstemaatilised uuringud, teadustööd ja analüüsid, mille tulemused on vormistatud
eraldi dokumendina. Paragrahv ei laiene igapäevasele asutusesisesele töö raames tehtavale
analüüsile ega vahekokkuvõtetele, millel puudub iseseisev teadmuslik väärtus.
Kohustus hõlmab nii uuringu, teadustöö või analüüsi lõppdokumenti kui ka selle aluseks
olevaid andmeid, metoodikat ja metaandmeid. Kui alusandmete täielik avalikustamine ei ole
võimalik, nähakse ette osalise avalikustamise mehhanism metaandmete ja metoodika
avaldamise kaudu.
Alusandmete avalikustamise kohustus on eesmärgipärane ja proportsionaalne ega tähenda
isikuandmete, ärisaladuse või muude piirangutega andmete avalikustamist. Kui alusandmete
täielik avalikustamine ei ole võimalik, täidetakse avalikustamiskohustus metaandmete,
metoodika kirjelduse ja põhjendatud selgituse avaldamise kaudu, mis võimaldab uuringu või
analüüsi tulemuste kontrollitavust ja korduvkasutuse hindamist.
Uuringute, teadustööde ja analüüside avalikustamise kohustuse eesmärgipäraseks täitmiseks:
avaldab teabevaldaja uuringute, teadustööde ja analüüside koondkirjelduse Eesti
teabeväravas, kui uuringud, teadustööd ja analüüsid on avalikustatud ühtses avalikus
digihoidlas;
tagab teabevaldaja ühe koondviite digihoidlale, mis sisaldab avalikustatud uuringuid,
teadustöid, analüüse ja nende alusandmeid, tingimusel et digihoidlas on tagatud selge
struktuur, otsitavus ja andmete masinloetavus;
tagab teabevaldaja, et digihoidlas avaldatud alusandmed on asjakohasel juhul
kättesaadavad ka hulgiallalaaditavana või muul viisil, mis võimaldab andmete
automatiseeritud töötlemist;
lisab teabevaldaja alusandmete andmekirjelduse ja metoodika kirjelduse ka juhul, kui
alusandmeid ei ole võimalik täielikult avalikustada.
Kohustuse täitmine ei eelda uute infosüsteemide loomist ning toimub olemasolevate
andmehalduse ja avaandmete avaldamise lahenduste kaudu.
Eelnõu §-s 6 nähakse ette üleminekusäte enne määruse jõustumist loodud uuringutele,
teadustöödele ja analüüsidele. Üleminekusäte on vajalik, et vältida ebaproportsionaalset
töökoormust ning võimaldada teabevaldajatel hinnata avalikustamise teostatavust.
Metaandmete kuuekuuline tähtaeg tagab piisava aja olemasolevate materjalide kaardistamiseks
ja kirjeldamiseks ilma uute infosüsteemide loomise vajaduseta.
3. Eelnõu vastavus Euroopa Liidu õigusele
Eelnõu on kooskõlas Euroopa Liidu õigusaktidega. 20.06.2019 võeti vastu Euroopa Parlamendi
ja nõukogu direktiiv (EL) 2019/1024 avaandmete ja avaliku sektori valduses oleva teabe
taaskasutamise kohta (uuesti sõnastatud). Avaandmete direktiivist tuleneb nõue tagada
väärtuslike andmestike tasuta kättesaadavus. Määruse eelnõu on avaandmete direktiiviga
kooskõlas.
4. Määruse mõjud
Varem pole keeleandmestikke väärtuslike avaandmete kategooria nimekirjas kehtestatud.
Keeleandmestike nimekirja kehtestamine võimaldab väärtuslikke keeleandmeid kasutada eesti
keeletehnoloogia ning keele arendamisel ning parandada era- ja avaliku sektori teenuste
ligipääsetavust. Sisuliselt kehtib juba praegu üldpõhimõte by design by default, st et andmeid
6
tuleb taaskasutuseks võimaldada nii palju kui võimalik, sh avaandmetena. Seega on juba
avaandmete direktiivi vastuvõtmisest alates kehtinud põhimõte, millega innustati liikmesriike
propageerima andmete loomist kavandatud ja vaikimisi avatuse põhimõtte alusel.
Sihtrühmad:
1. Määruse otsene sihtrühm on väärtuslike andmestike valdajad, avaliku sektori asutused
ja avaliku sektori rahastusel tegutsevad organisatsioonid (teabevaldajad), kellele
määrusega pannakse kohustus tagada väärtuslike andmestike avaldamine ja
taaskasutamise võimaldamine. Määruse rakendamisest saavad kasu eelkõige ettevõtjad
ning teadus- ja arendusasutused, kes kasutavad väärtuslikke andmestikke teenuste ja
toodete arendamisel ning teadustöös. Samuti saavad teised avaliku sektori asutused
andmeid taaskasutada poliitikakujundamisel ja teenuste arendamisel.
2. Kõik, kellel on huvi väärtuslikke andmestikke kasutades teenuseid või tooteid luua.
Määruse kehtestamisega on oodata positiivset majanduslikku mõju, kuna kavandatud
rakendusakt soodustab keeleandmete ning avaliku sektori loodud ja rahastatud uuringute,
teadustööde ja analüüside laiemat taaskasutust ning loob eeldused uute teenuste ja toodete
arendamiseks, suurendades seeläbi nende abil loodavat majanduslikku kasu.
Mõju võib pidada oluliseks, kuna eelnõuga nähakse ette väärtuslike andmestike tasuta
kättesaadavaks tegemine, samuti võib eeldada, et suureneb nende andmestike taaskasutamine.
Määrus suurendab avaliku sektori teadmusloome läbipaistvust ning vähendab dubleerivat
uuringute ja analüüside tellimist. Avalikustatud alusandmete ja metaandmete parem
kättesaadavus loob eeldused teadus- ja arendustegevuse ning andmepõhiste teenuste kiiremaks
arenguks ilma avaliku sektori lisakuluta.
5. Määruse rakendamisega seotud tegevused, vajalikud kulud ja määruse rakendamise
eeldatavad tulud
Määruse rakendamisega lisakulusid ei kavandata. Määruse rakendamisega tekib avalikule
sektorile kohustus avaldada väärtuslike andmestike andmekirjeldusi Eesti teabeväravas,
seejuures on oluline, et viide andmestikule oleks kehtiv/ajakohane. Vajadusel võib nimetatud
andmestikke lisada ka Eesti teabeväravasse. Soovituslik on, et teabevaldaja määrab
keeleandmestike, uuringute, teadustööde, analüüside ning nende alusandmete avalikustamiseks
ameti- või töökohad, lähtudes teabekorralduse ja halduse määruses sätestatust6. Ka kehtivate
normide kohaselt peab teabevaldajatel olema ülevaade tema valduses olevast teabest, seega
kaasneb muudetustega ajutine töökoormus, et kaardistada, millised juba olemasolevad
uuringud, teadustööd ja analüüsid tuleb avalikustada.
Avalikus sektoris võiksid keelematerjalide andmete kirjelduste avalikustamise protsessi näited
olla järgmised:
Kui avaliku raha eest on loodud juurdepääsupiiranguta nimeloend, peab nimetatud
loendi teabevaldaja täitma Eesti teabeväravas kohustuslikud andmeväljad.
Kui avaliku raha eest on loodud juurdepääsupiiranguta terminibaas või erialane
sõnastik, peab teabevaldaja täitma Eesti teabeväravas terminibaasi kirjeldavad
kohutuslikud andmeväljad. Kui terminibaas on sisestatud näiteks sõnastikusüsteemi
6 Teabekorralduse ja halduse määrus, 2025. https://www.riigiteataja.ee/akt/129122024019
7
Ekilex, toimub andmevahetus Ekilexi7 ja Eesti teabevärava vahel automaatselt ning
teabevaldaja eraldi Eesti teabeväravas andmekirjet looma ei pea.
Kui isiku- jm konfidentsiaalsete andmeteta tõlge on Tõlkeväravas8 lisatud avalikku
tõlkemällu, toimub teabevahetus Eesti teabevärava ja Tõlkevärava vahel automaatselt.
6. Määruse jõustumine
Määrus jõustub üldises korras, kuna muudatused ei too kaasa vajadust tööprotsesse või
infosüsteeme kohandada.
7. Eelnõu kooskõlastamine ja huvirühmade kaasamine
Eelnõu saadetakse EISi kaudu kooskõlastamiseks kõigile ministeeriumidele ning arvamuse
avaldamiseks Andmekaitse Inspektsioonile, Eesti Keele Instituudile, Maa- ja Ruumiametile,
Eesti Linnade ja Valdade Liidule, Eesti Kirjandusmuuseumile, Eesti Rahva Muuseumile, Eesti
Rahvusraamatukogule, Rahvusarhiivile, Eesti Tõlkebüroode Liidule, Tartu Ülikoolile, Tallinna
Ülikoolile, Tallinna Tehnikaülikoolile, Eesti Maaülikoolile.
7 Eesti Keele Instituudi sõnastiku- ja terminibaasisüsteem Ekilex on loodud sõnastike ja terminibaaside koostamiseks ja ajakohastamiseks
leksikograafidele, terminoloogidele ning kõigile asjahuvilistele. https://ekilex.ee 8 Tõlkevärav on keskkond avaliku sektori tõlkeprojektide haldamiseks ja tõlkimiseks. https://tolkevarav.eki.ee
EISi teade Eelnõude infosüsteemis (EIS) on algatatud kooskõlastamine. Eelnõu toimik: JDM/26-0167 - Muud väärtuslike andmestike kategooriad, nende andmestike nimekirjad ning avaldamise ja taaskasutamise tingimused ja kord Kohustuslikud kooskõlastajad: Majandus- ja Kommunikatsiooniministeerium; Haridus- ja Teadusministeerium; Kultuuriministeerium; Kaitseministeerium; Siseministeerium; Regionaal- ja Põllumajandusministeerium; Rahandusministeerium; Eesti Linnade ja Valdade Liit; Sotsiaalministeerium; Kliimaministeerium; Välisministeerium Kooskõlastajad: Arvamuse andjad: Kooskõlastamise tähtaeg: 18.02.2026 23:59 Link eelnõu toimiku vaatele: https://eelnoud.valitsus.ee/main/mount/docList/2d031c83-6e44-4d19-92de-5ca9780b169b Link kooskõlastamise etapile: https://eelnoud.valitsus.ee/main/mount/docList/2d031c83-6e44-4d19-92de-5ca9780b169b?activity=1 Eelnõude infosüsteem (EIS) https://eelnoud.valitsus.ee/main