Nároky na kvalifikaci statistiků neustále rostou
16. 09. 2025
Rozhovory
S místopředsedou ČSÚ Jaroslavem Sixtou jsme mluvili o tom, jak statistiku ovlivňují nové technologie a jak tento obor reaguje na rychlé změny v současném světě.
Za měsíc si připomeneme Světový den statistiky, který upozorňuje na význam tohoto oboru pro život společnosti. Myslíte si, že se lidstvo dostatečně řídí statistickými daty?
Obávám se, že nikoliv. V některých aspektech našeho života je využívání statistických údajů vidět. Řídí se jimi především oblast financí a finančních trhů, ale jinde je deficit dost značný. Přitom máme k dispozici spoustu kvalitních informací, které by mohly sloužit pro daleko lepší plánování a organizaci života lidské společnosti, než se to děje dnes. Je to škoda.
Statistika si na jedné straně zakládá na stabilitě a kontinuálnosti, na druhé straně musí být schopná reflektovat a popisovat změny, k nimž ve společnosti dochází. Co tedy zůstává i v současnosti na statistice stabilní, a kde naproti tomu dochází k největším změnám?
Domnívám se, že tradiční role statistiky nezmizí nikdy. Stále budeme sledovat nejdůležitější ukazatele týkající se populace, jako jsou narození, zemřelí nebo pohyb obyvatelstva. Tam žádné zásadní změny nevymyslíte.
Další stupeň tvoří statistika ekonomická, kde se v zásadě také držíme ustálenějších definic, ale zase ne až tolik jako u těch narozených a zemřelých. Například pro statistiku inflace je postup víceméně daný, ale přitom se průběžně vyvíjí a přizpůsobuje novým podmínkám. V minulosti se to týkalo třeba započítávání imputovaného nájemného nebo cen nemovitostí.
A nakonec jsou tu statistiky úplně nové, založené na moderních postupech a technologiích, například statistika dojížděk vycházející z údajů od mobilních operátorů. Ta je zatím extrémně datově náročná a využívá se jenom pro dílčí projekty. Není to ještě ucelená statistika. Velký potenciál pro rozvoj nových metod a inovativních přístupů má také environmentální statistika založená na využívání satelitních snímků.
doc. Ing. Jaroslav Sixta, Ph.D.

V ČSÚ pracuje od roku 2002. Začínal jako referent ve statistice národních účtů a zabýval se problematikou fixních aktiv a input- output tabulkami. V letech 2014 až 2018 působil jako ředitel sekce makroekonomických statistik a významně přispěl k modernizaci statistiky zahraničního obchodu a implementaci machine learningových postupů v oblasti cenových statistik. Má řadu zkušeností z působení v zahraničí v oblasti implementace statistických postupů a statistiku přednáší na vysokých školách. Od roku 2016 je docentem a je autorem více než stovky vědeckých a odborných příspěvků. Místopředsedou ČSÚ je od roku 2018.
Jak hodnotíte roli Eurostatu v určování směru evropské statistiky?
Role Eurostatu je velmi záslužná v oblasti metodiky, v podpoře zavádění nových postupů a v oblasti získávání datových zdrojů. Například míra harmonizace statistik a mezinárodní srovnatelnost výsledků je díky Eurostatu v Evropě světově unikátní.
Eurostat rovněž silně podporuje členské země v tom, že se jim snaží ulehčovat cestu k administrativním zdrojům dat a snižovat byrokratickou náročnost získávání dat. Ve spolupráci s Evropskou komisí se například podařilo v nařízení o statistice zakotvit princip, že národní statistické úřady mají mít pro účely statistiky bezplatný přístup k existujícím zdrojům dat jiných subjektů. Protože nařízení má přednost před národní legislativou, pomáhá nám to při jednání s vlastníky a správci administrativních zdrojů dat. Na straně státu jsou to třeba různé registry, u soukromých subjektů například data z pokladních systémů obchodních řetězců pro výpočet indexu spotřebitelských cen. Řekl bych, že představitelé byznysu i státní správy pochopili, že poskytování dat statistikům je i v jejich zájmu. Že díky tomu získávají lepší přehled o situaci na trhu a ve společnosti.
Z Evropy ale přicházejí i požadavky, které nevítáme s radostí. V některých případech se na statistiku nakládá víc, než je schopná zvládnout. Jako opravdu špatný příklad uvedu snahu statisticky zjišťovat projevy násilí. Prosazují to zejména někteří uživatelé statistiky, kteří si bohužel dokážou získat odpovídající lobby u evropských institucí. My a některé další země tyto snahy dlouhodobě odmítáme a říkáme, že statistici nejsou policisté. Považuji za nešťastné posílat tazatele do domácností, aby se ptali na násilí na dětech nebo na ženách. To statistikům nepřísluší a výsledky takového šetření nemohou poskytnout reálné výsledky.
Jak je na tom se zaváděním novinek a moderních postupů konkrétně ČSÚ?
V uplynulých letech se nám podařilo uskutečnit řadu poměrně velkých kroků, a jsem moc rád, že uživatelé si jich téměř nevšimli. Kdyby totiž vyvolaly nějaký větší ohlas, nejspíš by to znamenalo, že jsme něco udělali špatně.
Svůj výčet začnu tím, co už běží delší dobu, a sice implementací scanner dat z pokladních systémů obchodních řetězců do výpočtu indexu spotřebitelských cen. Využíváme k tomu metodu strojového učení a stále rozšiřujeme okruh sledovaného zboží. Dnes už takto zpracováváme třetinu spotřebního koše. Tento obsáhlý zdroj dat nám umožnil výrazně zpřesnit odhady průměrných spotřebitelských cen a letos jsme také zavedli zveřejňování předběžného odhadu indexu spotřebitelských cen.
Další oblastí, kde jsme zásadně postoupili dopředu, je statistika zahraničního obchodu. V červenci 2023 jsme spustili databázi zahraničního obchodu se zbožím, která nabízí údaje na velice podrobné úrovni v takzvaném národním pojetí. Data v ní vypovídají o skutečném obchodu mezi rezidenty a nerezidenty, tedy o tom, když zboží opravdu změnilo majitele, nikoli jen bylo převezeno přes naše hranice.
Mezi nedávné novinky patří Statistický geoportál, který mimo jiné získal ocenění na konferenci České asociace manažerů informačních technologií. Ve spolupráci s Ministerstvem zemědělství jsme začali využívat nové zdroje administrativních dat a zredukovali jsme tak dotazování zemědělských podnikatelů. Zároveň se zvýšila kvalita výsledků. Začínáme s využíváním webscrappingu a strojového učení pro automatické kódování v registru ekonomických subjektů.
Aktuálně připravujeme dokončení přechodu prezentace našich výstupů na platformu DataStat. Ta už běží v testovacím provozu a uživatelům výrazně rozšíří možnosti zobrazování statistických dat a práce s nimi. Děláme ji maximálně komfortní, aby si tam každý mohl navolit strukturu výstupů přesně tak, jak to potřebuje a jak mu to vyhovuje.
V ČSÚ také naplno běží práce na portálu respondenta. Můžete čtenářům tuto novinku trochu přiblížit?
Portál respondenta bude branou mezi naším úřadem a respondenty. Poskytne všechny informace k respondentovi na jednom místě, umožní rychlé, bezpečné a kvalitní vyplnění výkazů včetně uchování jejich historie. Díky němu získá respondent přehled a kontrolu nad svými daty a současně si usnadní práci. Portál chceme zprovoznit v první polovině příštího roku a věříme, že to bude další kvalitativní skok od současných PDF formulářů a Dante Webu k bohatšímu a uživatelsky přívětivějšímu prostředí. Respondenti se budou přihlašovat svou státem garantovanou elektronickou identitou.
Současně s Portálem respondenta připravujeme rovněž technologii pro napojení podnikových informačních systémů (ERP, agendové systémy) na naše rozhraní a odesílání dat na stisknutí tlačítka. Dodavatelé podnikových informačních systémů mohou, dle zadaných požadavků a datové struktury, vytvořit pro své klienty funkci, která jim výrazně ulehčí plnění zpravodajské povinnosti vůči ČSÚ.
V rámci šetření v domácnostech už mají respondenti od letošního roku možnost vyplnit některé formuláře online přes webové rozhraní. Jak se tato nabídka osvědčila, kolik respondentů ji zatím využilo?
Jsem moc rád, že se nám online dotazníky podařilo zprovoznit a respondentům nabídnout. Jsou nasazeny na oblast sociálních statistik. Po absolvování úvodního rozhovoru s tazatelem si respondent může nechat poslat e-mailem odkaz na online dotazník, který pak do určeného termínu vyplní. Dotazníky jsme se snažili vytvořit tak, aby byly dynamické a snadno srozumitelné, aby jejich vyplňování respondenty nijak zvlášť nezatěžovalo. Vše se zatím teprve rozbíhá, za období od února do srpna 2025 se nám vrátilo zhruba 500 vyplněných dotazníků od respondentů. Ve zjišťování o informačních technologiích využilo online sběr dat 10 procent ze všech vyšetřených osob. Další online sběr dat bude opět spuštěn v příštím roce.
V posledních letech se nejen v Česku, ale i v celé Evropě snižuje ochota respondentů mluvit s tazateli a poskytovat data. Lze nějak tento negativní trend zvrátit?
O tomto problému diskutujeme s ostatními evropskými statistiky mnoho let. Míra response v Česku přesahuje 60 procent a patří k těm výrazně lepším. Přesto hledáme způsoby, jak respondenty motivovat, a jedním z nich jsou právě uvedené online dotazníky na webu. Možná se někomu může zdát, že jejich zavedení trvalo dlouho, ale musíme si uvědomit, že pro nás je klíčové uchovat anonymitu a bezpečnost respondenta. Informace, které nám svěří, musejí být dokonale zabezpečeny, aby je nikdo nemohl zneužít. Dotazníky nelze jen tak zavěsit na nějaký web. Vyžaduje to celou řadu kroků a opatření, na jejichž realizaci je potřeba čas a důkladné testování.
Druhou možností, jak zvýšit response, je omezit množství otázek, na které se ptáme. To se ale bohužel na evropské úrovni moc nedaří. Stále šetříme oblasti, které zajímají možná několik málo expertů, ale z širšího pohledu nemají pro společnost nějaký zásadní význam. Kupříkladu ve zjišťování o tom, jak domácnosti využívají informační technologie, je takových dotazů celá řada.
Domácnosti se snažíme motivovat i prostřednictvím drobných dárečků a upomínkových předmětů, ale to samozřejmě není to hlavní, co by zabralo. Myslím, že mnohem účinnější je víc a lépe vysvětlovat, že statistická zjišťování přinášejí užitek pro všechny. Když nám lidé dají data, bude statistika kvalitnější a bude moci být lepší i rozhodování o tom, na co by se měla společnost zaměřit, co a jakým směrem je potřeba změnit, a v důsledku se zlepší i život těch, kteří ta data poskytli. Osvěta ovšem není jednoduchá, ale stále se o ni snažíme.
Rezervy máme i ve využívání administrativních zdrojů. Stále u nás neexistuje registr bytů, který by nám umožnil zjišťovat bytovou situaci domácností, aniž bychom se jich museli ptát. Rádi bychom využili také třeba informace o úvěrech z bankovních systémů. To by výrazně posunulo statistiku finančních aktiv a závazků domácností. Pomohlo by to například s identifikací konkrétních skupin obyvatel, které jsou předlužené, nevycházejí s příjmy nebo nemají žádné úspory, a stát by pak mohl lépe zacílit podporu potřebných. Je to velmi náročná oblast, která se bude v následujících letech teprve rozjíždět.
Myslíte, že bude někdy možné se bez dat z dotazování v domácnostech obejít a nahradit je kompletně administrativními zdroji?
Pokud máme plnit předepsané úkoly, tak to nepůjde. Například při zjišťování materiální deprivace se ptáme na věci typu, kolikrát v týdnu si lidé mohou dovolit jíst maso, zda jsou schopni platit dětem zájmové kroužky a podobně. To se z žádné databáze nedozvíme.
Osobní dotazování je důležité také vzhledem k propojení zjištěných údajů s charakteristikou osob či domácností. Dnes třeba funguje spousta nástrojů, které měří, odkud se lidé připojují k internetu, jak dlouho tam tráví a co tam vyhledávají a dělají, ale z těchto dat nepoznáme, jaký mají ti lidé příjem, vzdělání, jak početná je jejich domácnost nebo jak velký mají byt. Musíme se jich na to zeptat.
Nové metody a technologie snižují zátěž respondentů a zvyšují kvalitu statistických výstupů. Roste ale také efektivita práce statistiků? Snižují se díky zavádění novinek stavy zaměstnanců ČSÚ?
Modernizace statistického úřadu má za následek spíše to, že neustále rostou nároky na naše zaměstnance. Postupně sice zefektivňujeme různé procesy, ale zároveň se na nás hrnou nové požadavky, které musíme zvládnout.
Třeba přechod statistiky trhu práce z výkazů sbíraných od firem na Jednotné měsíční hlášení zaměstnavatelů sice ulehčí podnikům, které vyplňovaly a posílaly nám údaje, pro nás ovšem mnohonásobně vzroste množství zpracovávaných dat. Dosud jsme měli výkazy od vybraného vzorku firem. Nyní dostaneme údaje za všechny. To s sebou nese obrovskou počáteční investici, protože se musíme kompletně přepnout na nový systém, přizpůsobit metodiku, vyvinout a otestovat nové postupy v analýze a zpracování dat. A přestože jednotné hlášení zahrne všechny firmy, některé skupiny v něm budou chybět. I s tím se musíme nějak vypořádat.
Zavádění novinek si tedy neustále žádá další a další kapacity, a bohužel, dost často je nelze nahradit těmi, jejichž práci ušetříme. Práce statistiků se víc a víc posouvá směrem k analýze velkých datových souborů, programování a dalším vysoce specializovaným činnostem, které vyžadují specifické znalosti a nedá se na ně snadno během krátké doby přeškolit. Snažíme se tedy nalákat studenty a absolventy vysokých škol a nabízet jim zajímavou práci v tomto velmi dynamicky se rozvíjejícím prostředí. Statistika dnes rozhodně není nudné zapisování čísel do nekonečných tabulek.
Co považujete za největší výzvu, které bude evropská statistika čelit v příštích letech?
Největší změnou a výzvou je nasazení umělé inteligence. Z mnohých článků v médiích to vypadá, že AI za nás všechno vyřeší, ale ukazuje se, že AI je sice výborný sluha, ale dost špatný pán. Pro statistiky je klíčové udržet si kontrolu nad celým procesem – jaká data a jak jsem získal, jak jsem je zpracoval, co mi vyšlo a co předkládám uživatelům. Nemůžeme si proto dovolit jen tak zadat úkol nějakému nástroji umělé inteligence a spolehnout se na výsledek. Tyto nástroje nám jistě výrazně pomohou třeba při hledání chyb a podezřelých záznamů, při výběru vzorku respondentů nebo při vizualizaci a prezentaci výsledků. Vlastní vyhodnocování však stále musí dělat člověk, který musí vědět, co a proč se s daty děje.
Proč jste si vybral jako obor pro svou kariéru zrovna statistiku?
Když jsem nastupoval na VŠE, nebyl jsem pro konkrétní obor úplně rozhodnut. Vždycky mě bavila matematika, a tak jsem se hlásil současně na finance a na statistiku a k tomu ještě na ČVUT. Nakonec jsem se rozhodl pro statistiku a jsem za to rád. Myslím, že statistika je velmi zajímavá a pořád je co nového objevovat.
Rozhovor najdete v zářijovém vydání časopisu Statistika&My.