Üldised küsimused/tähelepanekud:
• HelpDesk, mis aitab SME-de õigusaktidega seonduvate muresid lahendada. Kes selle eest vastutab, kas iga liikmesriik peab avama vastava teenuse? (mainitud lk 1).
◦ Hiljem mainitakse Data Act legal helpdesk-i. Ehk on seesama ning EL-ülene?
• Strateegia eesmärk keskenduda tulemustele on tervitatav, kuid ühe põhilise probleemina on välja toodud potentsiaalsete teenusepakkujate tehniliste oskuste puudumine (lk1), kuid tehniliselt võimekamad ning juba turul olevad teenusepakkujad toovad tihti välja suuremate teenusepakkujate mittekoosvõimelisuse (nt poetšekid või terviseandmed, mida kogub kindel suur teenusepakkuja), mistõttu ei saa väiksemad teenusepakkujad lõppkliendile nende suurte poolt töödeldavate andmete alusel luua uusi innovaatilisi teenuseid, kuna nad lihtsalt ei väljasta andmeid. Seega küsimus on, kas see mainitud probleem on tegelikult tõestatud probleem. Hiljem täpsemalt, kuid SMEd tihtilugu ei mõtlegi luua innovaatilisi lahendusi (s.o tehnoloogiliselt innovaatilisi), mis on eraldiseisev probleem.
• Kas plaanis on ka toetusmeetmed, et aidata kaasa avaandmete direktiivist ning rakendusaktidest tulenevate korralduste täitmisele? (lk 2, 11) Eriti kui need suurenevad, nt suurendatakse väärtuslike andmestike nimekirja.
◦ Tuleb tekstis mainida, et avalik sektor saab ise ka kasu, taaskasutades teiste avalikustatud andmeid, mitte et andmeid tuleb avalikustada vaid SME-de jaoks. Samas, raha puudus andmete avalikustamiseks ning inimeste teadlikkuse madal määr on väga suured probleemid.
◦ Keelemudelite treenimine (lk 12): kas avalik sektor peab hakkama keeleandmeid tootma/tagama, et saaks LLM-e treenida?
◦ Positiivse erandina saab välja tuua sünteetiliste andmete loomise, mille jaoks on juba rahastusallikas määratud.
• Sõnaselgelt tuleb välja tuua, et erasektori andmeid on ka vaja, avalik sektor annab juba välja (või vähemalt on kindel nõue) avaandmete direktiivi jm alusel.
• Euroopa andmekvaliteedi strateegia – strateegiline lähenemine andmekvaliteedile on tervitatav, kuid erinevate andmestike jaoks on erinevad vajadused, nt mõni andmestik peab olema kättesaadav reaalajas, mõni pea 100% terviklikkusega. Tekib küsimus, kuidas luua sobivad nõuded, mis on kõigile vastuvõetavad (halduskoormuse tõus), kuid piisavalt karmid, et tagada andmete kvaliteeti. Kellele need uued nõuded kohalduvad: ainult avalikule sektorile?
• The Omnibus will repeal the Data Governance Act (DGA) and migrate its essential provisions into the Data Act. Obligations for data intermediaries will be clearer, lighter and voluntary to enable viable models and wider uptake. Väga kiiduväärt, kas võetakse arvesse ka arvamusi, mis anti DGAle, aga algselt kõrvale jäeti?
• Kas muudatusi tehakse ka tehisintellekti seadusandlusesse (AI Act): „clarify that legitimate interest can be a legal basis for training AI, including the incidental processing of special categories of data; clarify the provisions on automated individual decision-making“, mis lihtsustaksid TI kasutamist?
• Digital Fitness Check on väga tervitatav, kuid võiks hoida silma lahti ka avaliku sektori halduskoormusele, sest nemad on suur sihtrühm, kellel palju kohustusi pandud andmete valdkonna seadlusandlusega.
◦ Data Act legal helpdesk piletid peaksid olema sisendiks sellele.
• EU prioritiseerimine on dokumendis tugevalt kaetud ja selle alatooniks, mis on väga tervitatav, kuid tuleb leida võimalus, kuidas ausatel tingimustel teha jätkuvalt koostööd suurte LLM pakkujatega, et need peegeldaksid ka tulevikus Euroopa vaateid ja tõeseid fakte.
• Ei ole 100% kindlust, et Simpl cloud middleware kasutuselevõtt andmeturule sisenemise kergemaks teeks, sest ei ole toodud andmeid, kui palju andmeühendusi on selle abil juba loodud ning kui paljud SMEd sellega tuttavad on. Uurides allmärkust, on näha, et tegu on andmeruumide jaoks arendatud teenuse/tarkvaraga, mis „will be gradually transferred to the European data space community“, et pakkuda vabavaralist lahendust, mille abil andmeruumid muuta üldistele nõuetele vastavaks (andmete jagamise vaatest). See on parimal juhul pikaajaline protsess. Samuti jääb segaseks, milliste kuludega peavad arvestama olemasolevate „ökosüsteemide“ omanikud, et olla koosvõimelised. (eriti juhul kui ökosüsteemi all ei ole mõeldud juba andmeruumis olevaid sidusrühmasid.)
Data Lab loomine ning haldamine
• Andmelaboritele on antud dokumendis määratud mitmeid põhirolle, kuid arusaamatuks jääb, kes nende loomise eest vastutab ning millisesse sektorisse kuulub andmelabor? Hetkel on need enamasti teadaolevalt ülikoolide all. Tulevikus „…will be set up independently“, kuid kelle poolt. (lk 8)
• Dokumendis (lk 5) mainitakse SMEsid, kes hakkavad andmelaboritelt abi saama, et andmeid tehisintellekti rakenduste loomiseks/haldamiseks turvaliselt kasutada, mis on üllas eesmärk, kuid millised SMEd need olema peaksid? Tavalised SMEd ei ole Eestis tehisintellekti kasutuselevõtuga hiilanud. Alustavad heade andmepõhiste ärimudelitega SMEd vajaksid aga elujõulise teenuse/toote töös hoidmiseks andmelaborilt pikaajaliselt tuge.
• Tekib küsimus, milline on ühe andmelabori ärimudel. Kas nad peavad ise endale kliente leidma, korraldama toetusvoorusid või innovatsioonipäevasid, et kaasata SMEsid, kes nende teenuseid tahaksid kasutada.
• Dokumendis läbivalt mainitud rollide täitmiseks on andmelabori isikkoosseis kallis pidada, kuna seal peavad töötama kogenud andmeteadlased ja -spetsialistid. Sellised inimesed töötavad juba arendusfirmades, kes on mingil määral erasektori vastus andmelaboritele. Keeruline on aru saada, kust leitakse inim- ning ka rahaline ressurss, et andmelaboreid luua ja töös hoida.
• S.o dokumendist saab tuletada, et andmelabori eesmärk on aidata erasektoril andmetele ligipääsu võimaldada, kuid samas on loetletud andmelabori tööde nimekiri väga tehnilisest ülesannetest õiguslike teadmiste jagamiseni. Andmelabor aitab „overcome various barriers“.
• Kelle poolt luuakse „technical infrastructure and tools“, mis on andmelaboritele lubatud/mõeldud?
• Kas riigis peab olema kindel arv data labs?
• Mis sellise teenuse hind ja hinnastamise mudel on? Kuidas käib kokku hetkel andmeteaduse firmade pakkumusega?
Küsitavad väited dokumendist:
1. Data labs will translate the availability of high-quality data into concrete AI deployment, serving as practical enablers that accelerate experimentation, adoption and scaling. – nõuab aega ja rahalisi vahendeid, tulenevalt huvitatud osapoolte arvust võib ressursivajadus kasvada ülisuureks.
2. Data labs will help overcome a key market failure: limited availability of diverse, high-quality data and reluctance to share privately held data for AI training. They will operate through existing access channels and frameworks without requiring direct data transfer. In doing so, data spaces remain the trusted infrastructures where data is governed and made available, while data labs can act as the operational interface that enables its safe, value-adding use for AI. – usaldusväärsed andmete jagamise teenused on tänuväärt, kuid mitmed väljatoodud väited tekitavad küsimusi. Kes otsustab, milline piiratud ligipääsuga andmestik tuleb kättesaadavaks teha (kohe, kui üks SME seda palub?); millised veenmismehhanismid on ühel andmelaboril (lisaks lubatud turvalisusele?), kui osavõtt on lõpuks ikkagi vabatahtlik.