Tere!
Kas MKMil on mingi seisukoht Lighthouse’i üüripindade andmete tellimise osas? Kas MKM tahaks neid tulevikus kasutada?
Civitta / TLÜ uuring oli selle andmeallika osas kriitiline, järeldades, et nii pakkumise kui ka nõudluse andmed on ülehinnatud.
Järeldused / soovitused: „Kõige usaldusväärsemateks ja praktikas kasutatavaks hindame Eurostati eksperimentaalstatistikat“.
Kuna 2026. a MKM maksab stat.ametile detailsemate Eurostati andmete avaldamise eest (mis on ühtlasi usaldusväärsemad), siis tundub, et Lighthouse’i andmete ostmine ei ole enam põhjendatud.
Noppisin Civitta / TLÜ uuringust välja lõigud andmete sh Lighthouse’ i kohta:
Kogu Eesti kohta ja maakondade lõikes on turu analüüsimiseks võimalik kasutada:
a) MTA andmeid majanduslikult aktiivsete majutuskohtade ja nende haldajate kohta (ligipääs ja kasutamine piiratud, kuid võimalikud avaliku sektori andmepäringud);
b) Eurostati eksperimentaalstatistikat broneeringute arvu, broneeritud ööde arvu ja ööbimiste arvu kohta, s.o ainult nõudluse andmeid (maakonna tasandi andmed kättesaadavad kõigile tasulise päringuga);
c) Lighthouse andmekogu (ligipääs ja kasutamine kõrge hinnalävendiga, kasutajale seatud andmete jagamise piirangud, lisaks suurema veapiiriga).
Andmete võrdlus näitas:
Platvormide poolt maksuhalduritele (MTA) edastatud andmete järgi on
voodikohtade arv võrreldes Lighthouse’i poolt avaldatavaga ligi kaks korda väiksem.
Eurostati avaldatud ööde arv on keskmiselt 40% väiksem kui Lighthouse andmetes.
Meie hinnangul on kõige loogilisem selgitus, et Eurostat saab platvormidelt tegeliku ööbinud inimeste arvu ja nende majutuskohas veedetud ööde arvu; Lighthouse saab teada vaid päevade arvu, mil majutuskoht ei olnud saadaval või oli broneeritud ja teab majutuskoha
mahutavust (maksimaalset külaliste arvu, voodikohtade arvu), mistõttu võib olla, et arvestused tehakse maksimaalse mahutavuse järgi, aga tegelik majutatute arv oli väiksem.
S.t. uuringu teostajate hinnangul on Lighthouse’il nii pakkumise kui ka nõudluse andmed tugevalt üle hinnatud.
Järeldused / soovitused:
Esmastest (Eurostat, MTA, SA) ja teisestest (Lighthouse, AirDNA, jt) allikatest pärinevates andmetes ilmnevad märkimisväärsed erinevused.
Andmeanalüütika teenuseid pakkuvate ettevõtete poolt platvormidelt hangitud (kraabitud) teisesed andmed ei ole piisavalt kvaliteetsed, et nendele tuginedes saaks teha ja jõustada sekkumisotsuseid, nt tundlike piirkondade vmt kohta. Kõige usaldusväärsemateks
ja praktikas kasutatavaks hindame Eurostati eksperimentaalstatistikat, mida tuleks detailsema ülevaate saamiseks kombineerida teistest allikatest (MTA, analüütikaettevõtted, platvormid) kogutud andmetega.
Lisaks on Lighthouse’i puhul palju probleeme andmete ajas võrreldavuse ja järjepidevusega. Praegu näiteks ilmnes, et eelmiste aastate ööbimiste andmeid on nad tagantjärele oluliselt väiksemaks muutnud, ilma et nad suudaks mingit selget
põhjendust tuua või isegi seda otsida – „given our current limited engineering capacity, we are unable to further review the data on that platform“ . Meil olid kuni 2025.a veebruarini andmed Excelis salvestatud ja sellega võrreldes on praegu nende andmebaasis
(Metabase) olevad eelnevate aastate andmed oluliselt väiksemad (vt tabel). Samas on jooniselt näha, et kuna eelmiste perioodide andmeid muudeti väiksemaks, siis alates 2024.a sügisest on avaldatud ööde arv oluliselt kõrgem kui ühelgi eelneval aasta – selline
hüppeline kasv ei tundu tõenäoline ega loogiliselt seletatav.
Praegu nad andsid teada, et sulgevad varsti lõplikult Metabase’i ja jätkavad andmete avaldamist uuel Lookeri platvormil (see valmis suvel ja üleminekust on juba mõnda aega juttu olnud), aga seal olevad andmed erinevad omakorda senistest
Metabase’i andmetest (küll mitte väga suurel määral).


Kõike seda kokku võttes mulle tundub, et ainuke mõistlik lahendus on Lighthouse’i andmete tellimisest 2026.a üldse loobuda ja jääda kasutama Eurostati andmeid. Kas MKM tahaks Lighthouse’i andmeid tulevikus kasutada?
Terv.
Piret