Statistika v uších – série podcastů z dílny Eurostatu
27. 11. 2024
Události Svět
Zhruba jednou za dva měsíce si můžete poslechnout půlhodinový podcast ze série „Stats in a Wrap“ z dílny Eurostatu. Již třetí ročník se zaměřil mimo jiné na využívání umělé inteligence.
Pozvaní odborníci se podělili o to, jak by umělá inteligence mohla změnit tvorbu statistik, například pokud jde o sběr dat, kladení otázek v různých šetřeních nebo urychlení publikace statistik o námořní dopravě. Mnoho inovativních zdrojů dat není původně určeno pro statistické účely, ale tato data přesto mohou být využita k vytvoření statistik. Umělá inteligence může například pomoci přeměnit nesourodá data na smysluplné ukazatele mobility.
A právě v dopravě je množství informací, která jsou určena primárně např. pro komunikaci nebo pro bezpečnost, ale nikoli pro statistiku. I takové údaje však statistici potřebují, protože kromě toho, že zlepšují aktuálnost, mohou také poskytnout více podrobností, a mohou také přinést informace z oblastí, kde je provádění průzkumů velmi nákladné, nebo, kde zbytečně nastává velká prodleva mezi získá(vá)ním dat a publikací výsledků.
V současné době Eurostat inovuje statistiku námořní dopravy. Lodě musí před vplutím do přístavu ohlásit svůj příjezd a místo, odkud připlouvají. Musí nahlásit, co vezou a jaká je hmotnost zboží, které vezou. Jedná se tedy o velmi podrobný systém hlášení, přesto jsou ucelená data o námořní dopravě Eurostatem zveřejňována s dvanáctiměsíčním, zatímco všichni v každém okamžiku vědí, kde se lodě nacházejí.
A tak se zrodila myšlenka využívat data v reálném čase k tomu, aby Eurostat získal podobné statistiky, jako jsou ty, které už z pravidelných měsíčních hlášení dostává, ale mnohem rychleji, tak, aby už na konci každého čtvrtletí mohlo být zveřejněno, kolik lodí připlulo do přístavů EU.
Při navigaci vysílá každá loď signál, který říká, o jakou loď se jedná, jaký je to typ lodi a kde se nachází. Údaje z automatického identifikačního systému (AIS) zachycují pobřežní stanice, které jsou na pobřeží, a satelity. Tyto signály jsou nyní z bezpečnostních důvodů nepřetržitě monitorovány Evropskou agenturou pro námořní bezpečnost a mohou být použity pro statistické účely.
Odborníci z Eurostatu museli vymyslet, jak tyto signály přeměnit na údaje, které jsou podkladem statistik, které shromažďuje a zveřejňuje. Jedna věc je získat data, ale zajistit jejich vysokou kvalitu, ať už pro trénování algoritmů umělé inteligence nebo pro použití ve statistice, to je věc druhá. Jak vlastně z nových signálů udělat statistiku? To byla pro odborníky z Eurostatu skutečná výzva.
Statistici analyzovali různá pole záznamů signálů z období let 2015 až 2019 a porovnávali je s výsledky v již publikovaných statistikách za dané období, pro něž data byla získána tradiční metodou. Byly zjištěny mnohé nesrovnalosti, například v přiřazení polohy plavidel ze signálů AIS, když byly identifikovány např. stojící lodě nebo lodě bez hospodářské činnosti, které nenakládají ani nevykládají zboží nebo cestující. Někdy bylo třeba kontaktovat poskytovatele údajů, tedy přístavy nebo národní statistické úřady, aby objasnili případné rozdíly v obou zdrojích údajů. Cílem tohoto srovnání bylo vytvořit metodu, algoritmus, jak z okamžitých, agregovaných signálů AIS odvodit později získané statistické údaje.
Zatím je tento postup součástí experimentální statistiky, ale umělá inteligence je postupně využívána v různých oblastech naší činnosti. A postupně se dostává právě i do statistiky. Ne, není třeba se obávat o důvěryhodnost dat. Žádné údaje si nevymýšlí, jen pomáhá se zpracováním.
Podcasty jsou dostupné i s textovým přepisem na webu Eurostatu zde, na YouTube, Apple Play či Spotify.