Andmekaitse Inspektsioon
Tatari 39
Tallinn 10134
Haridus- ja Teadusministeerium
TAOTLUS ISIKUANDMETE TÖÖTLEMISEKS TEADUSUURINGUS
Juhindudes isikuandmete kaitse seaduse (IKS) paragrahvis 6 sätestatust palun kooskõlastada
Uuringu pealkiri
TI-Hüppe tehisaru rakenduse mõju Eesti gümnaaasiumiõpilaste arengule
Kas poliitika kujundamise uuring (IKS § 6 lg 5) või
JAH
uuring hõlmab eriliigilisi isikuandmeid ja puudub valdkondlik eetikakomitee (IKS § 6 lg 4)
Palume eelmise kahe lahtri puhul valida üks vastavalt õiguslikule alusele, v.a olukorras, kui poliitika kujundamise uuringu puhul puudub valdkondlik eetikakomitee. Kui poliitika kujundamise uuringus töödeldakse eriliiki isikuandmeid, siis täita ka eetikakomitee otsuse lahter.
Kas isikuandmete töötleja on määranud andmekaitsespetsialisti (sh tema nimi ja kontaktandmed)?
Mirjam Reinthal, õigusnõunik-andmekaitsespetsialist
[email protected]
Kas on olemas eetikakomitee otsus?
Kooskõlastuse olemasolul lisada see taotlusele.
JAH, vt lisa 1
Kas osa uuringust toimub andmesubjekti nõusoleku alusel?
Kui jah, siis palume taotlusele lisada nõusoleku vorm või selle kavand ning küsimustik või selle kavand.
JAH, vt lisad 2 ja 3
1. Vastutava töötleja üldandmed
1.1. Vastutava töötleja nimi, registrikood, aadress ja kontaktandmed (sh kontaktisik)
analoogne registrikandega, kontaktisiku e-post, telefon
Haridus- ja Teadusministeerium
Reg.kood 70000740
Munga 18, 50088 Tartu
Riin Saadjärv, haridustehnoloogia valdkonna juht,
[email protected], tel
735 0194
1.2. Isikuandmete töötlemiskoha aadress (kui erineb registriandmetest)
maja, tänav, asula/linn, maakond, postiindeks
Vt volitatud töötleja
2. Volitatud töötleja üldandmed
2.1. Volitatud töötleja nimi, registrikood, aadress ja kontaktandmed (sh kontaktisik)
Aadress analoogne registrikandega, kontaktisiku e-post ja telefoninumber
Tartu Ülikool
Reg.kood 74001073
Ülikooli 18, 50090 Tartu
Jaan Aru, arvutusliku neuroteaduse ja tehisintellekti kaasprofessor,
[email protected], tel 503 7103
2.2. Isikuandmete töötlemiskoha aadress (kui erineb registriandmetest)
maja, tänav, asula/linn, maakond, postiindeks
TÜ arvutiteaduse instituut
Narva mnt 18, 51009 Tartu
3. Mis on teadusuuringu läbiviimise õiguslik alus?
Nimetage õigusakt, mis annab Teile õiguse teadusuuringut läbi viia. Ei piisa viitest IKS § 6-le. Poliitikakujundamise eesmärgil läbiviidava uuringu puhul tuua välja volitusnorm, millest nähtub, et asutus on selle valdkonna eest vastutav. Akadeemilise uuringu korral võib see olla näiteks Teadus- ja arendustegevuse korralduse seadus või teadus- või arendusprojekti avamise otsus, leping vms.
1) Vabariigi Valitsuse seadus
§ 58 lg 1: Haridus- ja
Teadusministeeriumi valitsemisalas on riigi haridus-, teadus-, arhiivi-, noorte- ja keelepoliitika kavandamine ning
sellega seonduvalt alus-, põhi-, üldkesk-, kutsekesk-, kõrg-, huvi- ning täiskasvanuhariduse, teadus- ja arendustegevuse, arhiivinduse, noorsootöö ja erinoorsootöö ja keele valdkondade korraldamine ning vastavate õigusaktide
eelnõude koostamine.
2) Eesti Vabariigi haridusseadus
§ 6 lg 2 p 9: Haridus- ja Teadusministeerium osaleb riikliku teaduspoliitika elluviimises ja tellib haridusalaseid uurimistöid.
3) Haridus- ja Teadusministeeriumi põhimäärus
§ 5 lg 3:
Ministeeriumi põhiülesanded: 3) poliitika mõju analüüsimine, uuringute korraldamine ja statistika koostamine;
4) isikuandmete kaitse seaduse § 6 lg 5.
4. Mis on isikuandmete töötlemise eesmärk?
Kirjeldage uuringu eesmärke ja püstitatud hüpoteese, mille saavutamiseks on vajalik isikuandmete töötlemine. Palume siin punktis selgitada kogu uuringut, mitte ainult taotluse esemeks olevat osa (näitaks ka nõusoleku alusel toimuvat uuringu osa). Kui osa uuringust toimub nõusoleku alusel, siis palume taotlusele lisada nõusoleku vorm või selle kavand ning küsimustik või selle kavand.
Eesti Vabariigi presidendi Alar Karise poolt algatatud TI-hüppe haridusprogrammi raames (edaspidi Programm) antakse 2026. aasta algul1 Programmiga liitunud gümnaasiumide 10.-11. klassi õpilastele OpenAI ChatGPT platvormi kaudu ligipääs tehisaru rakendusele.
Rakendus on välja töötatud kujul, mis toetaks hariduspsühholoogias ja õppimisteaduses sõnastatud õppimisega seotud baaspsühholoogiliste konstruktide arengut (edaspidi Konstruktid). Uuringu raames uuritakse osade Konstruktide arengut standardiseeritud instrumentidega longituudis (programmi alguses ja lõpus). Kuivõrd selline hindamine ei võimalda selgitada, kas muutus tekkis tehisaru rakendusest, Programmi raames tehtud teistest tegevustest või muudest teguritest, on vajalik uurida ka teisi muutujaid, sealhulgas analüüsida õpilase tehisaruga peetud vestlusi.
Hariduspsühholoogia ja õppimisteadused on tuvastanud suure hulga õpikontekstist sõltuvaid tõhusa õppimise komponente ja printsiipe, mille edukas haridustehnoloogias rakendamine on olnud aastakümnete pikkune väljakutse. Tõhusa õppimise aluseks on õppija pädevuste ja psühholoogiaga seotud konstruktid ja nende areng, näiteks kontseptuaalse arengu tase ja selle arendamine, emotsioonide regulatsiooni oskused, õpiuskumused, metakognitiivsete strateegiate teadmine ja kasutamine ja autonoomse motivatsiooni tase ja tõstmine. Kuigi nende konstruktide toetamist tehnoloogia abil on uuritud aastakümneid, ei suuda isegi kõige paremad suurtel keelemudelitel (edaspidi „LLM“) põhinevad tehisaru tuutorid neid tulemuslikult õppijas tuvastada ega arendada.
Kõige levinumad LLM-rakendused (nt ChatGPT) on loodud kasutajate soove rahuldama, aga õppimine nõuab inimaju enda pingutust. Tavakasutuse LLM-rakendused ei toeta õppimise protsessi, vaid hoopis võtavad üle tema kognitiivseid ja metakognitiivseid mõtlemisprotsesse, vähendavad vaimset pingutust, tekitavad metakognitiivset laiskust ja illusiooni õppimisest. Kuivõrd senine uurimistöö ei ole andnud lõplikku vastust, kuidas LLM-põhised rakendused õppimist mõjutavad, on jätkuvalt oluline teaduslikult suunata LLM-põhiste rakenduste arendamist ja uurida nende mõju õppimiseks oluliste baaspsühholoogilistele konstruktide arengule.
Tavapäraselt ongi tehisaru arendamisel uuritud peamiselt lihtsalt mõõdetavaid õpiväljundeid nagu testide punktisummad. Kuigi hariduspsühholoogiliste konstruktide arengut õppijas uuritakse tavapärast instrumentidega nagu küsimustikud ja testid, jääb nende kasulikkus tehisaru rakenduste arendamisel ja mõju hindamisel piiratuks, kuna üldpädevuste omandamine võtab pikalt aega. Seetõttu on hariduslike rakenduste arendamisel uuritud konstruktide käitumuslikke ekvivalente. Näiteks metakognitsiooni puhul on uuritud õpilaste enesekohaseid verbaalseid mõtlemisprotsesse ja autonoomse motivatsiooni puhul õppijate küsimusi tehisaruga peetud kirjalikes vestlustes. Siiski on ka nendes uuringutes hindamist läbi viidud käsitsi haridusekspertide poolt, mis ei ole sobilik kümnete tuhandete õppijatega toimuvate protsesside uurimiseks.
Õppimist toetavate LLMide arendamisel on automaatsel hindamisel peamine rõhk läinud just tehisaru enda käitumise, mitte õppijate arengu uurimisele. Kavandatav uurimistöö on maailmas unikaalne, kuna esmakordselt uuritakse riiklikul tasandil õppimist toetavat tehisaru rakenduse mõju, mille peamine edukriteerium on, kas see suudab arendada neid olulisi õppija psühholoogilisi konstrukte, mis on olulised tõhusaks õppimiseks.
Uuringu eesmärk on hinnata TI-hüppe raames õppijatele antava tehisaru rakenduse mõju õppija õppimisega seotud psühholoogiliste Konstruktide arengule. Uuring toetab TI-Hüppe haridusprogrammi teaduspõhist elluviimist ja järelduste tegemist, tuvastades tegurid, mis mõjutavad tehisarust kasu saamist. Sealhulgas antakse jooksvalt tagasisidet tehisaru arendajatele, millised mudeli versioonid arendavad õppijat ja millised tuleks kõrvale heita. Uuring toetab Eesti spetsiifilise õppimist toetava tehisintellekti rakenduse loomist. Uurimistöö näitab, millised sõltumatud muutujad mõjutavad psühholoogiliste muutujate positiivset arengut ja millised mitte.
5. Selgitage, miks on isikut tuvastamist võimaldavate andmete töötlemine vältimatult vajalik uuringu eesmärgi saavutamiseks.
Uuringu käigus seotakse andmekogude ning küsitluste andmed, mistõttu on vajalik andmeid töödelda isikustatult (uurijateni jõuavad need pseudonüümitult).
Uuringu ettevalmistamise ajal kaaluti ka võimalust viia kogu uuringu andmetöötlus läbi uuritava nõusoleku alusel. Sellest aga loobuti, kuna teadaolevalt on alati arvestatav hulk inimesi, kes ei vasta uuringus osalemise üleskutsele. Samas on aga uuringu eesmärgist tulenevalt vajalik uurida TI-rakenduse kasutamise mõju erinevat tüüpi õpilastele.
6. Selgitage ülekaaluka huvi olemasolu.
Uuring toetab koolide õppetöös tehisintellekti rakenduste teaduspõhist kasutamist ja järelduste tegemist rakenduse kasutamise mõju kohta õppimisele, tuvastades tegurid, mis mõjutavad tehisarust kasu saamist. Uuring toetab Eesti spetsiifilise õppimist toetava tehisintellekti rakenduse loomist. Uuringu tulemuste põhjal tehakse poliitilisi otsuseid uute haridusalaste õigusaktide, sh riiklike õppekavade või õppetöös kasutatavatele tehisintellekti rakendustele seatavate nõuete väljatöötamisel.
TI-Hüppe programmi raames TI kasutamise mõju on tarvis uurida, et tuvastada rakenduse kahju/kasu õpilaste arengule, toetada õppimist paremini toetava rakenduse arendamist ja poliitiliste otsuste tegemist. Ilma uuringuta ei ole võimalik tuvastada rakenduse mõju, suunata selle arengut ega teha vastavaid hariduspoliitilisi otsuseid.
7. Selgitage, kuidas tagate, et isikuandmete töötlemine ei kahjusta ülemääraselt andmesubjekti õigusi ega muuda tema kohustuste mahtu.
Vajadusel loetleda täiendavaid kaitsemeetmeid privaatsuse riive vähendamiseks.
Töödeldavate isikuandmete põhjal ei muudeta andmesubjekti kohustuste mahtu ega kahjustata muul viisil ülemäära andmesubjekti õigusi. Käesolevas taotluses kirjeldatud isiku nõusolekuta andmetöötlus ei pane õpilastele mingeid kohustusi. Samuti ei kahjusta uuring ülemääraselt andmesubjekti õigusi. Privaatsuse riive vähendamiseks analüüsivad uurijad andmeid pseudonüümitud kujul, andmeid säilitatakse isikustatud kujul kuni uuringu lõpuni ning andmeid hoitakse tõhusate turvameetmetega keskkonnas.
Osa uuringust toimub nõusoleku alusel (küsitlused), kuid see ei lisa andmesubjektile kohustusi, kuivõrd on vabatahtlik.
Põhikooli- ja gümnaasiumiseaduse § 20.12 kohaselt, mis annab koolidele õigusliku aluse töödelda õpilase isikuandmeid TI-rakenduse kasutamisel õppetöös, ei ole kooli esindajatel õigus ligi pääseda õpilaste vestluse sisuandmetele. See on seadusandja poolt ette nähtud kaitsemeede õpilase privaatsuse tagamiseks olukorras, kus kooli esindaja, nt õpetaja võiks pääseda ligi esiteks isikustatud ja pseudonüümimata andmetele ning teiseks sellise andmesubjekti andmetele, kelle õigustele võib tal olla teatav mõju. Teadustöös kasutamise eesmärgil vestluse sisuandmetele ligipääs on oluliselt väiksema mõjuga õpilase õigustele ega muuda mingilgi määral tema kohustuste mahtu.
Kuivõrd uuringus keskendutakse TI-rakenduse kasutamise mõjule õppetöös, siis edastatakse uurijatele õpilaste vestluste sisuandmed, mis on läbinud automaatse sisufiltreeringu – eemaldatud on ilmselgelt õppimisega mitteseotud andmed ja isikuandmed.
8. Kuidas toimub andmete edastamine isikuandmete allikalt teadusuuringu läbiviijani? Sealhulgas palume välja tuua milliseid töötlussüsteeme ja/või keskkondi (sh pilveteenus) isikuandmete (sh pseudonüümitud) töötlemiseks kasutatakse ning millises riigis asuvad töötlussüsteemide/pilveteenuse pakkuja serverid.
Isikuandmete valdajad edastavad andmed krüpteeritult SAPU-keskkonda, mida haldab Tartu Ülikooli arvutiteaduse instituut.
SAPU on isoleeritud keskkond, mille suhtlus välismaailmaga on turvatud läbi VPNi, tulemüüri ja IDS-i (sissetungi tuvastamise süsteem). SAPU sees toimub kontrollitud andmete liikumine vastavalt seadistatud reeglitele. Keskkonnale pääsevad ligi VPNi kaudu vaid eetikakomiteelt loa saanud autenditud isikud, kelle tegevused on logitud (vt täpsemalt www.sapu.cs.ut.ee). See tagab, et kogutud andmeid ei saa hakata ülikoolis kasutama ilma eetikakomitee nõusolekuta.
SAPUs andmed seotakse, pseudonüümitakse ning tehakse uurijatele kättesaadavaks.
Andmed anonüümitakse SAPUs 2030. aasta 31. detsembriks. Anonüümitud andmeid hoitakse SAPUs tähtajatult.
Isikuandmeid ei edastata kolmandatele isikutele ega välisriiki.
Täpsemalt on andmete liikumise protsess järgmine:
1. Uuringu läbiviijad pöörduvad koolide poole ettepanekuga anda teadusuuringus kasutamiseks kooli õpilaste TI-Hüppe rakenduse vestluste sisuandmed, isikukoodid, klassid, unikaalse klassi pseudonüümid ja kooli pseudonüümid.
2. Kui kool on nõus andmeid edastama, siis annab kool korralduse TI-Hüppe rakenduse teenusepakkujale (Sihtasutusele TI Hüpe), et andmed edastataks uuringu läbiviijale.
3. Sihtasutus edastab Haridus- ja Teadusministeeriumile õpilaste isikukoodid; TÜ-le SAPUsse vestluste sisuandmed isikukoodid, klassid, unikaalse klassi pseudonüümid ja kooli pseudonüümid.
4. Haridus- ja Teadusministeerium seob isikukoodiga EHISe andmed (nimetatud taotluse lisas 4) ja edastab SAPU-sse.
5. Küsitlusandmed, sh isikukood (mida kogutakse nõusoleku alusel) kogub TÜ arvutiteaduste instituut TÜ privaatses LimeSurvey keskkonnas ning saadab SAPU-sse.
6. SAPU-s seotakse HTMilt laekunud EHISe andmed, küsitlusandmed ja vestluste sisuandmed kokku, pseudonüümitakse ning tehakse pseudonüümitud kujul TÜ uurijatele kättesaadavaks.
9. Loetlege isikute kategooriad, kelle andmeid töödeldakse ning valimi suurus.
Inimeste rühmad, keda uurida kavatsetakse ning kui palju neid on.
Eesti gümnaasiumide 10. ja 11. klassi õpilased, kelle kool on Programmiga liitunud, kellele kool on loonud konto OpenAI ChatGPT TI-Hüppe keskkonda ning kes on valmis oma õpilaste vestluste sisuandmed uuringus kasutamiseks edastama.
01.09.2025. a seisuga osaleb projektis 130 Eesti gümnaasiumi (90% kõikidest gümnaasiumidest). 2024. aastal õppis gümnaasiumiastmes kokku 34 891 õpilast, mis on ennustatav maksimaalne õppijate arv. Reaalsuses on aga osalejate arv kolmandiku võrra väiksem ehk umbes 23 000.
9.1. Tooge välja periood, mille kohta isikuandmete päring tehakse.
Vestluste sisuandmeid kogutakse perioodiliselt 05.01.20263-30.06.2026.
Muud andmed kogutakse ühekordse väljavõttena.
9.2. Loetlege töödeldavate isikuandmete kooseis.
Tuua detailselt välja, milliseid isikuandmeid töödeldakse (nt ees- ja perenimi, isikukood, e-posti aadress jne) ning põhjendus, miks just neid andmeid on uuringu eesmärgi täitmiseks vaja. Vajadusel esitada taotluse lisana (nt tabelina).
Töödeldavate isikuandmete koosseis ning allikad (p 9.3) on esitatud tabelina taotluse lisas 4.
9.3. Loetlege isikuandmete allikad.
Nimetage konkreetsed isikuandmete allikad (nt registrid, küsitluslehed jne), kust isikuandmeid saadakse.
Vt lisa 4.
9.4. Kas andmeandjatega (andmekogu vastutava töötlejaga) on konsulteeritud ning nad on valmis väljastama uuringu eesmärgi saavutamiseks vajalikud andmed?
Koolide kui andmeandjatega konsulteeritakse siis, kui Andmekaitse Inspektsiooni kooskõlastus on olemas.
10. Kas kogutud andmed pseudonümiseeritakse või anonümiseeritakse? Mis etapis seda tehakse? Kes viib läbi pseudonümiseerimise või anonümiseerimise (vastutav töötleja, volitatud töötleja, andmeandja vms)?
Kui andmeid ei pseudonümiseerita, siis selgitada, miks seda ei tehta.
Vt punkt 8. Peale uuringu lõppu andmed anonüümitakse.
10.1. Loetlege pseudonümiseeritud andmete koosseis.
Uuriijatel on ligipääs ainult pseudonüümitud andmetele.
10.2. Kirjeldage pseudonümiseerimise protsessi ja vahendeid.
Kui kasutatakse koodivõtit, siis tuua välja, kes koodivõtit säilitab ja kui kaua säilitab.
Andmed pseudonüümitakse TÜ SAPUs peale erinevatest allikatest laekunud andmete sidumist, kasutades pseudonüümimise võtit. Pseudonüümimisega tegelevad TÜ arvutiteaduse instituudis eraldi töötajad ning uuringut läbiviivatel teadlastel pseudonüümimata andmetele ligipääsu ei ole.
Pseudonüümimise võtit hoitakse SAPUs kuni andmete anonüümimiseni 31.12.2030.
10.3. Tooge välja pseudonümiseeritud andmete säilitamise aeg ja põhjendus.
Kui andmeid ei pseudonümiseerita, siis tuua välja andmete kustutamise tähtaeg.
Vähemalt kvartali ja aasta täpsusega.
Kogutud andmeid säilitatakse kuni 31. detsembrini 2030. aastal, misjärel need anonüümitakse.
Andmeid säilitatakse selle aja jooksul, kuna andmete kogumise etapile (lõppeb 30.06.2026) järgnev teadustöö analüüsitegevus on aeganõudev.
11. Kas andmesubjekti teavitatakse isikuandmete töötlemisest?
Jah/ei
JAH
11.1. Kui vastasite ei, siis palun põhjendage
11.2. Kui vastasite jah, siis kirjeldage, kuidas teavitatakse.
Uuringu läbiviija saadab koolidele regulaarselt infokirjad, mille kool edastab õpilastele (Stuudiumi, e-Kooli või muu kooli poolt kasutatava infokeskkonna kaudu). Kui TI-rakendus seda tehniliselt võimaldab, siis lisatakse Rakendusse selle kasutamise ajal õpilastele kuvatav märge, et vestlusandmeid kasutatakse teadusuuringus.
Haridus- ja Teadusministeerium, Tartu Ülikool ning SA TI Hüpe avaldavad oma veebilehtedel uuringus osalevate koolide kohta info koos teabega õpilastele.
11.3. Kust on leitavad andmekaitsetingimused?
https://hm.ee/ministeerium-uudised-ja-kontakt/kontakt/isikuandmete-tootlemine#isikuandmete-tootlem--2
12. Kas isikuandmeid edastatakse kolmandatesse riikidesse
Jah/ei. Kui vastate küsimusele jah, siis täita ka järgnevad lahtrid.
EI
12.1. Loetlege riigid, kuhu isikuandmeid edastatakse.
-
12.2. Milliseid lisakaitsemeetmeid kasutatakse?
-
Kinnitan, et taotluses esitatud andmed vastavad tegelikkusele.
/allkirjastatud digitaalselt/
Triin Laasi-Õige
Kantsler
Taotluse lisad:
Lisa 1: Tervise Arengu Instituudi eetikakomitee hinnang
17.12.2025. a otsus
Lisa 2: Küsimustiku nõusolekuvormi kavand
Kavand lisatud
Lisa 3: Küsimustiku kavand
Kavand lisatud
Lisa 4: Andmekoosseisu tabel
Exceli fail lisatud