Život sčítacího formuláře v deseti krocích
23. 06. 2021
Statistiky Lidé Sčítání lidu, domů a bytů Sčítání 2021
Listinné sčítací formuláře poté, co opustily zdi tiskárny, absolvují dlouhou a náročnou cestu, na jejímž konci stojí kompletní znehodnocení v podobě skartace.
1. Tisk
Pro letošní sčítání bylo vytisknuto celkem 3,8 milionu listinných formulářů, proces výroby trval téměř 6 měsíců.
2. Roznos
Deset tisíc sčítacích komisařů rozneslo ve dvou kolech formuláře do domácností po celé České republice.
3. Vyplnění
Podoba a rozmístění polí pro zápis údajů, druh papíru, použité barvy a technologie tisku byly voleny tak, aby bylo možné formulář bez problémů vyplnit (např. bez rozpíjení a rozmazávání zápisů) a později naskenovat.
4. Sběr a digitalizace
Vyplněné formuláře putovaly prostřednictvím pošty a kontaktních míst na pracoviště digitalizace. Tam velkokapacitní skenery rozpoznávají údaje, které obyvatelé do formulářů zapsali. V případě, že stroj nedokáže některé znaky přečíst, z formuláře je do elektronické podoby ručně přepíšou pracovníci digitalizace. Ti však již nemají k dispozici celý formulář, ale pouze jeho výřez se špatně čitelným zápisem.
5. Kódování
Během automatizovaného procesu se identifikuje význam odpovědí a různě formulované odpovědi se převádějí do standardizované podoby. Shodný kód dostanou např. národnost „moravská“, „Moravan“, nebo „Moravák“. I v této fázi pomáhají strojům s luštěním některých nejasných zápisů speciálně proškolení lidé.
6. Konsolidace
Pokud se ve formuláři například neshoduje pořadí členů domácnosti s pořadím údajů o jednotlivých osobách, je třeba je sjednotit. Vyplněné údaje jsou poté propojeny se záznamy v registru obyvatel a dalších administrativních zdrojích.
7. Deduplikace a prioritizace
Z propojení s registry v předchozím kroku mimo jiné vyplyne, které osoby ve formulářích chybějí (ty se z registrů doplní), a naopak které osoby či domácnosti jsou sečteny vícekrát. Duplicitní záznamy se musejí odstranit tak, aby zůstaly zachovány aktuální údaje a byly smazány ty chybné.
8. Vytvoření domácností
Ze získaných údajů je třeba sestavit posloupnost osoba- domácnost-byt. Zároveň se opravují nelogické vztahy jako třeba rodiče mladší než děti.
9. Anonymizace a statistické zpracování
Údaje se přenesou do jiné databáze, avšak už bez rodných čísel, jmen, příjmení, typů a čísel občanských průkazů nebo ID datových schránek tak, že už nebude možné spojit je s konkrétní osobou. Data z původní databáze budou vymazána. Anonymizovaná data se dále statisticky zpracovávají a vytvářejí se souhrnné údaje za sídla, obce, kraje či celou republiku.
10. Skartace
Formuláře budou mechanicky znehodnoceny. Ze vzniklé papírové drti už není možné získat jakékoli údaje.
Článek si můžete přečíst také v časopisu Statistika&My.
Více se dočtete zde: Sčítání lidu, domů a bytů