Taotlusvorm
Koostatud justiits- ja digiministri 18.05.2026 määruse nr 15 “Tulevikukindla andmemajanduse ökosüsteemi mudel ja taristulised lahendused andmete turvaliseks haldamiseks, käitlemiseks ja väärindamiseks” põhjal.
1. Taotleja andmed
Taotleja asutuse nimi
Eesti Geoloogiateenistus
Taotleja esindaja nimi
Sirli Sipp Kulli
Taotleja esindaja ametikoht
direktor
Esindaja telefoninumber
+372 5411 0333
Esindaja e-post
[email protected]
2. Partneri andmed (vajadusel)
Partnerasutuse nimi
Partneri esindaja nimi
Partneri esindaja ametikoht
Partneri esindaja telefoninumber
Partneri esindaja e-post
3. Projekti lühiülevaade
Projekti lühikirjeldus
Projekti eesmärk on Eesti Geoloogiafondi andmekogus hallatavate andmete põhjal hinnata, kas tehisaru abil on võimalik muuta geoloogiliste uuringute tulemused praegusest enam väärtust loovaks ning kättesaadavaks lähtuvalt reaalsest kasutusvajadusest.
Eesti Geoloogiafondis on ca 300 000 faili (7 TB) geoloogiste uuringutega seotud andmeid alates aastast 1923. Varasemad uuringutulemustega seotud failid on kõik digiteeritud kasutades OCR (optilise märgituvastuse) tehnoloogiat. Iga andmekogus oleva failiga on seotud ruumiline komponent ehk määratud on uuringuobjekti täpne asukoht. Geoloogiafondis hallatavaid andmeid vajatakse igapäevaselt maapõueressursside, sh maavarade, põhjavee, maasoojusenergia jms kasutamisel ning keskkonnaseisundi hindamisel. Geoloogiafondi andmed on aluseks iga järgneva geoloogilise, geotehnilise või valdkondliku keskkonna-alase uuringu kavandamisel.
Projekt käsitleb modulaarse RAG-lahenduse (Retrieval-Augmented Generation, eesti keeles otsinguga täiendatud genereerimine) avatud lähtekoodiga prototüübi arhitektuuri kavandamist, arendamist ja juhtumipõhist hindamist Eesti Geoloogiafondis olevate geoloogilise uuringu aruannete failide põhjal. Sealhulgas keskendutakse järgmistele küsimustele:
• kuidas eraldada usaldusväärselt infot erineva kvaliteediga PDF-failidest, sh tabelitest, joonistelt ja kaartidelt;
• kuidas muuta venekeelne geoloogiline info kasutatavaks eesti keeles, sh testides masintõlke võimalusi (Tartu Ülikooli neurotõlke lahendus: TartuNLP);
• kuidas seadistada dokumentide tükeldamine, indekseerimine ja vektorotsing nii, et leitav info oleks täpne, kontekstis õige ning säiliksid korrektsed allikaviited;
• kuidas kujundada kasutajale otsingulahendus, mis vähendab eksitavate või põhjendamata vastuste riski ning kaasab otsingul andmete ruumilise komponendi;
• kas loodud lahendus on tehniliselt ja sisuliselt piisavalt usaldusväärne ning praktiliselt teostatav, et seda hiljem toodangukeskkonnas kasutusele võtta.;
• kas ja millistel tingimustel on loodav lahendus tehnilist juurutatav ja laiendatav mõnes teises avaliku sektori taristus.
Projekti ajaraam
01.10.2026 – 31.10.2027
Omafinantseeringu suurus ja allikas
41 706,30 EUR, Eesti Geoloogiateenistuse omatulu vahendid
Taotletav toetuse summa [€]
236 335,70 EUR
4. Projekti detailsem kirjeldus
Probleemikirjeldus
Selgitage, miks on probleem aktuaalne ning keda see puudutab. Mida on probleemi lahendamiseks Eestis juba tehtud või mis on tegemisel?
Eesti Geoloogiafondi andmekogus arvel olevad dokumendid (ca 300 000 faili) sisaldavad väärtuslikku infot Eestis läbi viidud geoloogiliste uuringute, sh maapõuressursside ja keskkonnaseisundi kohta. Need on puurimisandmed, geoloogilised ja geotehnilised kirjeldused, mõõtmistulemused, laborianalüüside vastused jms. Kõik need varasemad materjalid on digiteeritud, uusi andmeid võetakse geoloogiafondi vastu samuti digitaalselt. Suur osa, ca 50% andmetest on venekeelne – nõukogude perioodil viidi läbi arvukalt põhjalikke geoloogilisi uuringuid maapõuressursside otsinguks ja uuringuks.
Geoloogiafondis arvel olevad varasemate uuringute andmed on aluseks uute teadus-ja arendusprojektide kavandamisel, samuti kasutatakse varasemate uuringute andmeid rakenduslikel geoloogilistel ja geotehnilistel uuringutel, keskkonnaseisundi hindamisel ja erinevate objektide projekteerimisel. Andmete kasutajaks on ülikoolid, avaliku sektori institutsioonid, sh Eesti Geoloogiateenistus ise oma teadus- ja arendusprojektides ning uuringute ja projekteerimise ning teadus- ja arendustegevusega tegelevad äriühingud.
Geoloogilised uuringud on kallid, varasemate uuringuandmete kasutamine tõstab järgnevate uuringute usaldusväärtust ja võimaldab uusi uuringuid paremini kavandada, vähendades nõnda uuringute maksumust. Näiteks kohe varsti valmiva 6 miljonit eurot maksva fosforiidi ja kaasnevate ressursside uuringu esimene etapp, mis keskendus varasemate uuringuandmete analüüsile ja valideerimisele, maksis ca 1 miljon eurot. Kui taotletav eksperimentaalarendus viib oodatava tulemuseni, aitab see eelduslikult varasemate geoloogiliste uuringute andmeid senisest oluliselt odavamalt analüüsida ning viib geoloogiafondi andmekogus olevate andmete senisest ulatuslikuma taaskasutamise ja väärindamiseni, tuues otsest majanduslikku kasu nii avalikule kui ka erasektorile ning soodustades teadus- ja arendustegevus.
Projekti oodatav tulemus ja mõju
Kas projektil on selge ning mõõdetav eesmärk, mille saavutamist või mittesaavutamist on võimalik hinnata?
Projekti tulemusena on eksperimentaalarendusena loodud RAG teenusel põhinev süsteem - geoloogiafondi otsingu tehisarul põhinev prototüüp tehnoloogilise valmiduse tasemel 5 (TVT 5).
Loodud arendust hinnatakse kuue hindamismeetodi abil. Need käsitlevad:
• funktsionaalsete nõuete täitmist;
• mittefunktsionaalsed nõuete täitmist;
• jõudlust;
• faktilist kvaliteeti;
• allikate jälgitavust;
• kasutajate tajutud kasulikkust;
• juurutatavust, sh mõnes teises potentsiaalses avaliku sektori asutuses.
Jõudluse, faktilise kvaliteedi ja kasutajakogemuse hinnang annab üksnes indikatiivset tõendusmaterjali, sest see tugineb väikesele valimile ja vähestele praktilistele võrdlustestidele, mitte kontrollitud eksperimentidele. Seetõttu tuleb tulemusi üldistada analüütiliselt, mitte statistiliselt laiaulatusliku järeldusena. Kasutajakogemuse hindamisel kaasame ka geoloogiateenistuse välised teadlased-uuringute läbiviijad.
Projekti elluviimisel panustatakse Andmete ja tehisintellekti valge raamatu järgmiste tulemuste saavutamisele:
• avaliku sektori organisatsioonide andmed on kvaliteetsed, kättesaadavad ja kasutatavad lähtuvalt kasutusvajadustest;
• loodud vabavaralised eesti keele spetsiifilised tööriistad on kaasatud tehisintellekti rakenduste arendamisse;
• ruumiinfo vastab kasutajate vajadustele ja leiab laialdast taaskasutamist.
Projekti tulemuste rakendamine aitab otseselt täita Eesti digiühiskonna arengukava 2035 eesmärki 2.2 Tehisaru laialdane kasutuselevõtt.
Projekti elluviimisega kaasneb geoloogiateenistuse töötajate tehisaru kasutuselevõtmisega seonduv teadlikkus ja paranevad sellealased tehnilised oskused. Kavandata eksperimentaallahenduse loomiseks kaasatakse geoloogiafondi materjale erinevatest geoloogia ala-valdkondadest, sh need valdkonnad, mis on kõige suurema teadus- ja arendustegevuse potentsiaaliga nagu näiteks Euroopa kriitiliste toormetega seonduvad uuringud, geoloogilise aluskorra uuringud ning hüdrogeoloogilised uuringud. Seega soodustab projekti elluviimine riigi (Eesti Geoloogiateenistuse) teadus-arendustegvust laiemalt kui vaid kitsalt tehisaru kasutuselevõtu ja hindamisega seonduvalt.
Varasemate geoloogiliste uuringute andmete taaskasutamise vajadus kaasneb iga alustatava geoloogilise uuringuga. Eesti Geoloogiafondi praegu kasutusel oleva tehniliste võimaluste juures on see väga töömahukas manuaalne protsess. Eeldusel, et projekti käigus loodud lahendust jõuab geoloogiafondi süsteemis tulevikus ka juurutamiseni, toob see otsest kulude kokkuhoidu nii geoloogiliste uuringutega, sh keskkonnaalaste uuringutega tegelevatele avalikule kui ka erasektorile ning ülikoolidele.
Projekti meeskond ja töökorraldus
Kirjeldage rollide ja töö jaotust projektimeeskonnas. Missugust täiendavat ekspertiisi tuleb juurde kaasata (nt tehniline ekspertiis, andmekaitse)?
Projekti meeskonda kuuluvad järgmised rollid:
Arendaja – kaks arendajat töökoormusega 1,0;
Analüütik-testija – töökoormusega 0,5;
Analüütik-testija-geoloog – töökoormusega 0,5;
Projektijuht-geoloog – töökoormusega 0,5.
Kavas on projekti meeskond komplekteerida geoloogiateenistuse töölepingulistest töötajatest, et projekti käigus saadavad teadmised ja oskused jääksid teenistusse. See tähendab, et lahenduse kavandamise, arendamise ja hindamisega seotud töid ei tellita teenusena sisse. Selliselt arendustööd oma tiimi-siseselt korraldades saame paindlikumalt ressurssi juhtida, mida eksperimentaalarenduse arendamine eeldab. Plaanis on rakendada kogu meeskonda kogu projekti kestel. Rollid on kattuvad, nt analüütik, kes projekti alguses osaleb nõuete kirjeldamisel, osaleb ka dokumenteerimises ning viib hiljem läbi lahenduse valideerimist ja testimist. Kõikidel meeskonnaliikmetel on kas doktori või magistrikraad (MSc) tehnikateadustes või loodusteadustes.
Väljast (erasektorist või TalTechist) tellitakse tehnilist ekspertiisi seoses arhitektuurse lahenduse kavandamise ja lahenduse tehnilise hindamisega.
Konsulteeritakse Tartu Ülikooli keeletehnoloogia meeskonnaga neurotõlke lahenduse kasutuselevõtuga seonduvalt ning Kliimaministeeriumi haldusala IT-asutuse KeMITiga lahenduse juurutamisega seonduvalt.
Jätkutegevused
Kirjeldage planeeritud jätkutegevusi pärast rahastusperioodi lõppu.
Eeldusel, et lahenduse valideerimisel ja hindamisel saime positiivse kinnituse lahenduse rakendatavuse kohta Eesti Geoloogiafondi infosüsteemis, planeerime järgmist:
• lahenduse paigaldamine geoloogiafondi testkeskkonda;
• jõudluse testid prognoositava reaalsete andmemahtudega;
• turvatestimine;
• lahenduse paigaldamine toodangukeskkonda ja juurutamine.
Riskid ja maandamismeetmed
Kirjeldage peamisi riske, mis võivad takistada projekti elluviimist või eesmärkide saavutamist, millised maandamismeetmed kasutusele võetakse?
• Meeskonnaliikme ajutine töölt eemal viibimine – risk on tõenäoline, mõju on vähene; projekti ajakavas on tööde teostamiseks määratud puhverajad, arvestatud on puhkustega.
• Meeskonnaliikme töölt lahkumine – risk on vähetõenäoline, mõju on piiratud; vajalik on leida meeskonnaliikmele asendaja.
• Valitud konsultatsioonipartner ei paku teenust või ei paku teenust vajalikul määral – risk on vähetõenäoline, mõju piiratud; vajalik on leida kiiresti uus konsultatsioonipartner.
• Projekti eesmärgini jõudmine osutub planeeritust kallimaks (vaja on rohkem tööjõuressurssi, tellida teenust planeeritust suuremas mahus) – risk on vähetõenäoline, mõju piiratud; vajalik on asutusesiseselt ressursse juurde anda.
5. Seos teadus- ja arendustegevuse kriteeriumitega (palun kirjeldage)
Tegevuse liik (alusuuring, rakendusuuring või eksperimentaalarendus)
Eksperimentaalarendus
Uudsus
RAG-lahendus, kui tehnoloogiline kontseptsioon, ei ole iseenesest uus. Uudne sisuline katsetus on RAG-lahenduse rakendamise hindamine suuremahulise, mitmekeelse ja algallikate tehniliselt ebaühtlase andmestiku peal ning kombineerituna ruumiandmeotsinguga.
Loomingulisus
Neorotõlke kvaliteedi valideerimine ja loodavas lahenduses mitmekeelsuse rakendamine.
Ettemääramatu tulemus
Kogu loodav eksperimentaalarendus on suuresti ettearvamatu tulemusega, kõige ettemääramatum on ruumiandmeotsingu integreerimine tehisaru poolt teostatud andmeotsingusse.
Süsteemsus
Arenduse ja lahenduse hindamise protsess dokumenteeritakse igakülgselt.
Ülekantavus või korratavus
Prototüüp arendatakse avaliku lähtekoodiga. Projekti käigus hinnatakse loodava lahenduse juurutatavust, sh mõnes teises potentsiaalses avaliku sektori asutuse vajadustest johtuvalt. Projekti tulemusi tutvustatakse asjaomastele institutsioonidele, sh geoloogiateenistuste rahvusvahelises võrgustikus. Projekti tulemuste põhjal koostatakse teadusartikkel ja edastatakse avaldamiseks (artikli avaldamine on aeganõudev protsess ja jääb seetõttu projektiperioodist tõenäoliselt välja).
6. Projekti eelarve ja ajakava
Lisa iga etapi ning tegevuse juurde tegevuse kirjeldus, algus ja lõpp ning eelarve.
I etapp
01.10.2026-31.11.2026 (kehtib etapi kõigi tegevuste kohta). I etapi eelarve 61 068,00 EUR (sh toetus+omafinantseering)
Ettevalmistustööd
Ettevalmistustööd: projektimeeskonna komplekteerimine, koolitusel osalemine, litsentside ja töövahendite hankimine, projekti juhtimine
Lähteülesande koostamine
Äriliste, funktsionaalsete ja mittefunktsionaalsete nõuete kaardistamine ja analüüs; arhitektuurse lahenduse koostamine; sh dokumenteerimine
II etapp
01.12.2026-31.10.2027. II etapi eelarve 216 974,00 EUR (sh toetus+omafinantseering)
Arendustöö
Süsteemi disainanalüüs ning arendustöö; sh dokumenteerimine
Valideerimine ja hindamine
Tulemi valideerimine ning testimine, loodud lahenduse hindamine; sh dokumenteerimine
Tulemi koondamine
Dokumentatsiooni koondamine ja vormindamine; teadusartikli koostamine.
Projekti juhtimine
Projekti juhtimine, aruandluse koostamine
Palun vaadake täiendavaid selgitusi taotlusega kaasas olevast lisast eelarve kujunemise kohta.
7. Kasutatavate andmete ülevaade
Ülevaade projekti käigus töödeldavatest andmetest
Geoloogiliste uuringute, sh maapõueressursside uuringute alased andmed, mis on avaandmetena hallatud Eesti Geoloogiafondi andmekogus.
Kas vajalik on läbi viia andmekaitsealane mõjuhinnang?
Ei. Projekti käigus, samuti nagu Eesti Geoloogiafondi andmekogus ei töödelda isikuandmeid
Kas projekti käigus rakendatakse andmejälgijat?
Ei. Projekti käigus, samuti nagu Eesti Geoloogiafondi andmekogus ei töödelda isikuandmeid.
Kas vajalik on täita algoritmi kasutatavuse vorm?1
Ei
Kas projekti käigus avalikustatakse avaandmeid?
Jah
8. Muu vajalik teave vabas vormis
Eesti Geoloogiateenistus on evalveeritud teadus- ja arendusasutus.
Volitused
Kontrollige e-äriregistrist2, kas Teil on äriregistri registrikaardi järgi õigus taotleja esindamiseks. Juhul, kui Teil puudub e-äriregistris taotleja esindusõigus, saate oma esindusõigust tõendada, lisades taotlusele digiallkirjastatud volituse.
Kinnitused
Palun tutvuge alljärgnevate tingimustega ning kinnitage, et olete nendega nõus:
Annan nõusoleku:
• teha õiguspädevale organile järelpärimisi;
• teostada taotleja suhtes toetuse andmise tingimustest tulenevaid õigusi;
• edasise infovahetuse toimumiseks elektroonilisel teel.
Kinnitan järgnevat:
• kõik taotluses esitatud andmed on õiged ning esitatud dokumendid on kehtivad ja ehtsad;
• taotluses sisalduv projekt vastab toetuse andmise tingimuste määruses sätestatud eesmärkidele ja toetatavatele tegevustele;
• taotlejal on toetuse andmise tingimustes sätestatud projekti elluviimiseks ja haldamiseks vajalik kvalifikatsioon või kogemus ning õiguslik, organisatsiooniline või tehniline eeldus;
• taotleja kohustub väljastama andmeid ja osutama igakülgselt kaasabi Justiits- ja Digiministeeriumile ning teistele asutustele, kelle kohustus on teha taotluses sisalduva projekti elluviimise üle järelevalvet;
• taotleja kohustub viima projekti ellu taotluses esitatud teabe ja tingimuste alusel;
• taotleja kohustub Justiits- ja Digiministeeriumi viivitamata teavitama taotluses esitatud andmetes toimunud muudatusest ja ilmnenud asjaolust, mis võib mõjutada taotluse kohta otsuse tegemist;
• taotlejal on nõutavad vahendid projekti omafinantseeringu tagamiseks;
• taotleja on teadlik, et toetuse saamise info ja toetuse summa avalikustatakse.
☒ Kinnitan, et kõik taotluses esitatud andmed on õiged ja täielikud, olen ülaltoodud tingimustega tutvunud ja olen nendega nõus.