Negyven adatforrást, köztük a NAV-bevallásokat kapcsolja össze a KSH egy komplex adatbázishoz

Negyven különféle adatforrást kapcsol össze új, Virtuális Magyarország (VIMA) névre keresztelt adatbázisában a KSH.

A 2023-ban indult projekttel a céljuk egy havonta frissülő, összefüggő adatbázi készítése az eddig különálló adatforrásokból – mint például a NAV-bevallások, a MÁK kifizetései vagy a Népszámlálás és a Gazdasági Szervezetek Regisztere.

„A részletinformációkból tudjuk, hogy ki hány éves, hol lakik, és ha ezt összekapcsoljuk a NAV adataival, akkor már azt is tudjuk, mennyi a keresete, és ezek alapján sokkal mélyebb tartalmú statisztikák készíthetőek” – mondta a Portfoliónak Bóday Pál, a KSH elnöki tanácsadója. Megnyugtatta az állampolgárokat, hogy a rendszer teljesen anonimizált, semmilyen személyes adatot nem tartalmaz, és az információkat kizárólag aggregált formában, statisztikai célokra használják fel, szigorúan betartva a felfedés elleni védelmi szabályokat.

A részletinformációk alapján településszinten vizsgálhatóvá válnak a jövedelmi, foglalkoztatási mutatók, illetve ezek időbeli alakulása. A rendszer alkalmas lesz szakpolitikai intézkedések, például adóváltozások vagy támogatási programok várható hatásainak modellezésére. A rendszerről azt írják, hogy európai szinten is úttörőnek számít „komplexitása és dinamikus frissítési mechanizmusa miatt”.

A projekt jelenleg a módszertani szakasz után tart, a következő lépés a teljesen automatizált, adatvédelemmel összhangban működő infrastruktúra létrehozása. 

Bóday Pál szerint az adatok puszta felhalmozása önmagában még nem jelent tudományos értéket; rendszerezni, értelmezni kell őket, és ha ez megtörtént, fontos a közérthető formában történő bemutatás is.