Jak statistikulovat
Dezinformování veřejnosti s využitím statistických materiálů se dá považovat za manipulaci; mohlo by se to také nazývat statistikulace (i když to slovo není moc pěkné). Podle názvu této knížky a některých příkladů, které jsou v ní uvedené, by se mohlo zdát, že cílem všech takových postupů je klamat.
Nedávno mi kvůli tomu vynadal prezident pobočky Americké statistické asociace. Řekl mi, že ve většině případů nejde o záměr, ale o neschopnost. Na tom, co říká, možná něco bude, ale nejsem si jistý, která z těch dvou možností je pro statistiky méně hanlivá. Možná je důležitější si uvědomit, že deformace statistických dat a manipulace s nimi, není konec konců vždy záležitostí jen profesionálních statistiků. To, co z rukou statistiků vyjde jako zcela korektní, mohou překroutit, přehnat, příliš zjednodušit a výběrem zkreslit obchodníci, lidé z public relations, novináři nebo tvůrci reklamních sloganů.
Ale ať už je v konkrétním případě viníkem kdokoliv, těžko ho lze považovat jen za nevinného packala. Klamavé grafy v novinách a časopisech vytvářejí často senzace tím, že přehánějí, zřídka cokoliv podcení. Podle mých zkušeností lidé, kteří jménem průmyslových odvětví prezentují statistické argumenty, těžko dají k dispozici taková čísla, která by dělníkům nebo odběratelům nahrávala víc, než je nezbytně nutné. Spíš jim trochu uškodí. Zaměstnaly snad někdy odbory tak neschopného statistika, že by jejich požadavky podcenil místo přehnal?
Pokud jdou chyby stále jen jedním směrem, těžko to přisuzovat jen břídilství nebo náhodě.
Jedním z nejošidnějších nástrojů dezinterpretace statistických dat jsou mapy. Taková mapa obsahuje velké množství proměnlivých veličin, ve kterých se dají fakta ukrýt a zkreslit. Mou oblíbenou trofejí v tomto oboru je mapa, které říkám „Matoucí šrafování“. Nedávno ji zveřejnila First National Bank of Boston a dál ji pak vehementně šířily tzv. zájmové skupiny daňových poplatníků, noviny a časopis Newsweek.
Tato mapa ukazuje, jakou část našeho národního důchodu si bere a spotřebovává federální vláda. Znázorněno je to tak, že jsou vyšrafovány oblasti států na západ od Mississippi (vyjma Louisiany, Arkansasu a části Missouri), což znamená, že federální vláda spotřebuje tolik, kolik celkově vydělají lidé v těchto státech.
Podvod spočívá v tom, že se vybraly státy, které mají velká území, ale vzhledem k řídkému osídlení, relativně malé příjmy. Se stejnou poctivostí (a stejnou nepoctivostí) měl ten, kdo mapu vyráběl, začít se šrafováním v New Yorku nebo v Nové Anglii a plocha, kterou by vyšrafoval, by byla daleko menší a méně působivá. S použitím stejných dat by byl vytvořil úplně jiný dojem v mysli každého, kdo se na jeho mapu podívá. Nikdo by se ovšem také neobtěžoval takovou mapu dál publikovat. Konec konců nevím o žádné zájmové skupině, která by měla zájem prezentoval veřejnou spotřebu nižší, než jaká ve skutečnosti je.
Pokud by byl autor mapy chtěl pouze zprostředkovat informace, které měl k dispozici, mohl to udělat celkem snadno. Byl by mohl vybrat skupinu průměrných států, jejichž rozloha má k celkové rozloze USA stejný poměr, jako má jejich produkt k celkovému produktu USA.
Je to jasný pokus o klamání veřejnosti, ale není to v propagandě zdaleka nový trik. Je to klasika. Starý, otřepaný fór. Jistá banka publikovala už dříve různé varianty této mapy, aby ukázala federální výdaje v letech 1929 a 1937. Tato mapa se pak objevila v učebnici Grafická prezentace od Willarda Cope Brintona, jako odstrašující příklad. Tato metoda „překrucuje fakta“ řekl Brinton naplno. Ale First National klidně pokračuje v kreslení map a Newsweek a další lidé, kteří by měli vědět o co jde – a nejspíš také vědí – je klidně dál přetiskují, aniž by někoho varovali nebo se omluvili.
Matoucí šrafování
Jaký je průměrný příjem amerických rodin? Jak jsme už poznamenali dříve, Statistický úřad říká, že „v roce 1949 měla průměrná rodina příjem 3.100 dolarů“. Když ale v novinách čtete zprávu o „dobročinných darech“, kterou vydala Nadace Russell Sage, dozvíte se, že to za stejný rok bylo pozoruhodných 5.004 dolarů. Když jste se dozvěděli, že se lidem vedlo tak dobře, tak vás to možná potěšilo, nebo jste naopak byli trochu zklamáni tím, jak málo tento údaj ladí s vašimi vlastními zkušenostmi. Třeba se nestýkáte s těmi správnými lidmi.
Jak je ale možné, že jsou světy Russella Sage a Statistického úřadu tak vzdálené? Úřad se vyjadřuje prostřednictvím medianu, tedy tak, jak správně má. Ale i kdyby lidé od Sage použili aritmetický průměr, rozdíl by neměl být až takhle velký. Jak se ukázalo, Nadace Russella Sage došla k tomuto blahobytnému údaji tak, že vytvořila virtuální rodinu. Jinak se to nazvat nedá. Svůj postup vysvětlili (když o to byli požádáni) takto: vzali celkové příjmy amerických občanů, vydělili je počtem obyvatel, tedy 149ti miliony a dostali průměr 1.251 dolarů na jednoho obyvatele. „Což znamená“, jak dodali, „5.004 dolarů pro čtyřčlennou rodinu.“
Tento podivný typ statistické manipulace přehání dvěma způsoby. Jednak používá aritmetický průměr, namísto menšího a lépe vypovídajícího medianu … to je něco, s čím už jsme se vypořádali v jedné z předešlých kapitol. Dále je zde předpoklad, že příjem rodiny je přímo úměrný její velikosti. Takže když mám čtyři děti, přeji si, aby to tak fungovalo, ale ono to tak není. Čtyřčlenné rodiny rozhodně nebývají dvakrát bohatší než rodiny dvoučlenné.
Buďme ale spravedliví ke statistikům od Russella Sage, o nichž se dá předpokládat, že se neprovinili snahou podvádět. Budiž řečeno, že jejich hlavním záměrem bylo vytvořit dojem, že je lepší dávat než brát. To legrační číslo o příjmech rodin bylo jen vedlejším produktem. Účinnost šíření tohoto bludu tím ale nijak neklesá. Nadále je to jasný příklad toho, že blíže neurčenému průměru se nedá moc důvěřovat.
Desetinná čárka vytváří falešný nádech přesnosti a nejpochybnějším statistikám tak dává punc závažnosti. Zeptejte se stovky občanů, kolik hodin minulou noc spali. V součtu vyjde, řekněme 783,1. Jakýkoliv takový údaj je předně na hony vzdálený od toho, aby byl přesný. Většina lidí dokáže odhadnout dobu svého spánku s přesností na 15 i více minut a nikde není psáno, že se tyto odchylky navzájem vyruší. Každý známe někoho, komu bude pět minut bez spánku připadat, jako že se polovinu noci vrtěl v posteli a nemohl usnout. Pojďme ale dál. Provedete výpočet a můžete ohlásit, že lidé spí v noci v průměru 7,831 hodiny. Bude to vypadat, že víte naprosto přesně, o čem mluvíte. Kdybyste byli tak bláhoví, že byste pouze oznámili, že lidé spí za noc 7,8 (nebo „téměř 8“) hodin, nikdo by se nad tím nepozastavil. Znělo by to tak, jak to ve skutečnosti je, tedy jako obyčejná přibližná hodnota, což by nebylo o nic poučnější než odhad, který může udělat kdokoliv.
Karel Marx neodolal a také použil nádech přesnosti stejného střihu. Když vysvětloval „míru nadhodnoty“ v mlýnu, začal s nádhernou sbírkou předpokladů, odhadů a zaokrouhlených čísel: „Předpokládejme, že odpad je 6 % … surovina … stojí zaokrouhleně 342 libry. 10.000 vřeten … stojí, předpokládejme, 1 libru za vřeteno … opotřebení dáme 10 % … nájemné za budovu předpokládejme, že bude 300 liber …“ a pak říká: „Tato data, ze kterých budeme vycházet, mi dal jeden přadlák z Manchesteru.“
Z těchto odhadů Marx vykalkuloval, že: „Míra nadhodnoty je proto 80/52 = 15311/13 %“ při desetihodinové pracovní době mu to dává „nezbytnou práci – 3 21/33 hodin a přidaná hodnota = 6 2/33.“
Ty dvě třiatřicetiny hodiny vzbuzují příjemný pocit přesnosti. Ale všechno je to blaf.
Procenta jsou živnou půdou pro zmatení čtenáře. Stejně jako ta působivá desetinná čárka, mohou zcela nepřesnému sdělení propůjčit dojem přesnosti. Měsíční přehled práce Ministerstva práce Spojených států jednou uvedl, že 4,9 % nabídek zaměstnání na částečný úvazek a s úhradou jízdného ve Washingtonu, D.C. v oboru práce v domácnosti bylo v určitém měsíci za 18 dolarů týdně. Toto procento, jak se ukázalo, představovalo ve skutečnosti přesně 2 nabídky z celkových 41. Každý procentní údaj, založený na malém počtu případů, je pravděpodobně zavádějící. Daleko lepší je uvést přímo to číslo. A když je to procento uvedeno s přesností na několik desetinných míst, je na vás, zda to budete považovat za důsledek hlouposti nebo za snahu podvádět.
„Kupte svůj vánoční dárek teď a ušetříte 100 procent,“ radí reklama. Zní to jako nabídka od samotného Santy, ale ukáže se, že je to v podstatě jen záměna základu. Sleva je pouhých 50 procent. Úspora je 100 procent ze snížené, tedy z té nové ceny. To je sice pravda, ale to není to, co slibuje ona reklama.
Je to podobné, jako když prezident Asociace pěstitelů květin řekl v novinovém interview, že „květiny jsou o 100 procent levnější než před čtyřmi měsíci.“ Tím nemyslel, že květináři své zboží nyní rozdávají zdarma. Tak to ale řekl.
Ida M. Tarbell ve své Historii společnosti Standard Oil zašla ještě dál. Řekla, že „snížení cen na jihozápadě … dosahovalo od 14 do 220 procent.“ To by znamenalo, aby prodejci platili kupcům značné obnosyza to, že si tu benzínovou veteš vůbec odvezou.
Deník Hlasatel z Columbusu v Ohiu (Columbus Dispatch) tvrdil, že vyráběný produkt se prodával se ziskem 3.800 procent, což vypočítali z nákladů 1,75 dolaru a prodejní ceny 40 dolarů. Když počítáte procento zisku, máte na výběr několik metod (a měli byste uvést, kterou jste použili). Když je to zisk vůči nákladům, vyšel by v tomto případě ve výši 2.185 procent; vůči prodejní ceně by vyšlo 95,6 procent. Hlasatel použil zřejmě svou vlastní metodu a dospěl – což se zjevně stává velmi často – k přemrštěnému číslu, které zveřejnil.
Dokonce i The New York Times podlehl kouzlu posunutého základu, když publikoval zprávu agentury Associated Press z Indianapolisu:
Deprese dostala dnes pořádnou ránu do brady. Klempíři, štukatéři, tesaři, lakýrníci a další, kteří jsou sdružení v Indianapolisské odborové organizaci stavebnictví, dostali 5 procent zvýšení mezd. Tím se každému z nich vrátila jedna čtvrtina z 20procentního snížení mezd, které je postihlo minulou zimu.
Zní to na první pohled rozumně – ale snížení bylo vypočítáno z jednoho základu – z platu, který ti lidé dostávali původně – zatímco zvýšení vycházelo z menšího základu, totiž z úrovně platu po snížení.
Na tomto příkladu si můžete zkusit statistické posouvání základu, když si pro zjednodušení představíte, že původní mzda byla 1 dolar za hodinu. Snížení o 20 procent znamená, že dostávali 80 centů. Zvýšení této sazby o 5 procent je zvýšení o 4 centy, což není čtvrtina, ale pětina původního snížení. Jako u tolika dalších, pravděpodobně neúmyslných chyb, i u této se nějak podařilo dojít ke zveličení, které celý příběh vylepšilo.
Z toho všeho vyplývá, že když chcete vyrovnat 50tiprocentí snížení mzdy, musíte tu sníženou mzdu zvednout o 100 procent.
Timesy také jednou napsaly, že za fiskální rok letecká pošta „ztratila kvůli požárům zásilky o váze 4,863 liber, což bylo v procentech pouhých 0,00063 %.“ V článku se psalo, že letadla přepravila za rok celkem 7.715.741 liber pošty. Pojišťovací společnost, která by svoje sazby odvozovala tímto způsobem, by si nadělala spoustu potíží. Přepočítejte si tu ztrátu a zjistíte, že to bylo 0,063 procent čili stokrát víc, než kolik uvedly tyto noviny.
Posunutý základ je také zdrojem iluzí, spojených s dodatečnými slevami. Když obchodník se železářským zbožím zlevní všechno „o 50 % a pak ještě něco o 20% proti ceníku,“ nemyslí tím slevu 70 %. Sleva je 60 %, protože těch dodatečných 20 % se vypočítá z menšího základu, který zbude, když se odečte těch prvních 50 %.
Ke spoustě nesmyslů a podfuků vede také sčítání věcí, které nejdou dohromady, ale vypadají, že dohromady jdou. Děti po generace používaly tuto hříčku v různých formách, aby jim vyšlo, že vlastně vůbec nemusejí do školy.
Třeba si na to vzpomenete. Začneme s 365 dny v roce, od kterých můžeme odečíst 122 dnů jako jednu třetinu času, kterou strávíme v posteli a dalších 45, což jsou 3 hodiny denně, které trávíme tím, že jíme. Ze zbývajících 198 odečteme 90 na letní prázdniny a 21 na Vánoční a Velikonoční prázdniny. Zbývající dny nestačí pokrýt ani soboty a neděle.
Řekli byste, že je to příliš starý a nápadný trik, aby se dal použít ve skutečných záležitostech. Ale odbory zaměstnanců v automobilovém průmyslu ve svém měsíčníku Ammunition trvají na tom, že se to proti nim stále používá.
Tato rozšířená, smutná lež se objeví během každé stávky. Pokaždé, když někde dojde ke stávce, Hospodářská komora oznámí, že ta stávka stojí tolik a tolik milionů dolarů denně.
Získají to číslo tak, že sečtou všechna auta, která by byla vyrobena, kdyby stávkující celou dobu pracovali. Přičtou stejným způsobem ztráty u dodavatelů. Přičtou všechno možné, včetně jízdného v tramvajích a ztráty prodejců.
Podobná a stejně lichá myšlenka, že se procenta dají sčítat tak jednoduše, jako jablka, byla použita proti spisovatelům. Podívejte se, jak přesvědčivě to zní v knižním přehledu The New York Times.
Rozdíl mezi rostoucími cenami knih a příjmy autorů, zdá se, vzniká v důsledku podstatně vyšších výrobních a materiálových nákladů. Odstavec: dílenské a výrobní výdaje samotné vzrostly za posledních deset let o 10 až 12 procent, materiály jsou dražší o 6 až 9 procent, prodejní a reklamní výdaje vyšplhaly o 10 procent. Dohromady je to zvýšení minimálně o 33 procent (za jednu společnost) a téměř 40 procent pro některá menší vydavatelství.
Ve skutečnosti, pokud každá položka, ze kterých se skládají celkové náklady na vydávání knih, vzrostla zhruba o 5 procent, tak také celkové náklady musely vzrůst zhruba o tolik. Logika, která dovoluje sečíst tato procenta růstu dohromady by otevírala fantastické možnosti. Kupte si dnes dvacet věcí a zjistěte, že každá z nich podražila o pět procent proti loňskému roku. To by se dalo „sečíst“ jako 100 procent a životní náklady by se tedy zdvojnásobily. Nesmysl.
Podobně zní příběh stánkaře, který měl vysvětlit, jak může prodávat králičí sendviče tak levně. „No jo,“ řekl, „musím tam přidat také trochu koňského masa. Já to ale míchám půl na půl: jednoho koně a jednoho králíka.“
Jedna odborářská publikace použila karikaturu, aby protestovala proti jinému typu neoprávněného sčítání. Byl na ní šéf, který sečetl sazbu 1,5 dolaru za normální pracovní hodinu se sazbou 2,25 dolaru za přesčasovou hodinu a sazbu 3 dolary za jednu dvouhodinovku a z toho vypočítal průměrnou hodinovou mzdu 2,25 dolaru. Těžko by se hledal jiný příklad tak nesmyslného průměru.
Další živnou půdou pro obelhávání je záměna mezi procentem a procentním bodem. Kdyby vám zisk v poměru k investicím stoupnul ze 3 procent v jednom roce na 6 procent v dalším roce, můžete to upravit, aby to znělo skromněji a říct, že je to zvýšení o tři procentní body. Stejnou platnost bude mít i výrok, že se jedná o 100procentní zvýšení ziskovosti. Svévolné nakládání s těmito dvěma pojmy nejlépe uvidíte na průzkumech veřejného mínění.
Také percentily jsou záludné. Když vám řeknou, jak si Johnny stojí v porovnání se svými spolužáky v počtech nebo v nějaké jiné schopnosti, to číslo bude nejspíš percentil. Znamená to jeho umístění v každé jednotlivé stovce studentů, jinými slovy jeho umístění přepočtené tak, jako by studentů bylo celkem 100. Ve skupině, kde je dejme tomu 300 studentů, budou tři nejlepší studenti na 99 % percentilu, další tři budou na 98 % a tak dál. To číslo bude zároveň říkat, kolik procent studentů bylo horších než Johny. Na percentilech je hloupá jedna věc: Student s 99procentním percentilem je zřejmě o trochu lepší než student na 90tiprocentním percentilu, ale dva studenti s výsledky 40 a 60 percentilů mohou být prakticky na stejné úrovni. Vyplývá to z tendence, kterou má celá řada charakteristik, totiž shlukovat se kolem svého průměru a vytvářet tak onu „normální“ křivku ve tvaru zvonu, kterou jsme zmínili v jedné z předcházejících kapitol.
Čas od času vypukne bitva mezi statistiky, a i zcela prostý pozorovatel musí ucítit, že to zavání. Slušný člověk zpozorní, když se statistikulátoři pustí do sebe. Ocelářský výbor upozornil na některé lumpárny, kterých se dopouštely ocelářské společnosti a ocelářské odbory. Odbory chtěly ukázat, jak dobře šly obchody v roce 1948 (jako důkaz toho, že si společnosti mohou velmi snadno dovolit zvýšení mezd) a tak srovnaly produktivitu v tom roce s produktivitou v roce 1939 – tedy v roce, kdy byla úroveň zvlášť nízká. Společnosti nechtěly být v tomto klání podvodů poraženy a tak trvaly na tom, že srovnání musí být provedeno podle peněz, které zaměstnanci obdrželi a ne podle průměrného hodinového výdělku. Háček byl v tom, že v tom dřívejším roce bylo hodně dělníků zaměstnáno na poloviční úvazek, takže jejich příjmy musely vzrůst, i kdyby se mzdové tarify vůbec nezvýšily.
Časopis Time, uznávaný zejména pro důslednou dokonalost své grafiky, otisknul graf, který je zábavným příkladem toho, jak statistika dokáže vytáhnout z rukávu téměř cokoliv, co je zrovna libo. Když měli na výběr dvě stejně platné metody, z nichž jedna byla příznivá z hlediska ředitelství a druhá z hlediska dělníků, Timejednoduše použil obě. V grafu byly vlastně dva grafy, namalované na sobě. Oba vycházely ze stejných čísel.
Jeden ukazoval mzdy a zisky v miliardách dolarů. Bylo zcela zřejmé, že obojí roste a to o více méně stejný obnos. A že na mzdy šlo zhruba šestkrát víc dolarů než činily zisky. Zdálo se, že nejsilnější inflační tlak přichází z mezd.
Druhá část tohoto duálního grafu vyjadřovala změny jako růst v procentech. Čára mezd byla relativně plochá. Čára zisku mířila strmě vzhůru. Podle ní se dalo odvodit, že hlavním zdrojem inflace byly zisky.
Mohli jste si vybrat, jaký si z toho uděláte závěr. Nebo ještě lépe, mohli jste snadno vidět, že ani jeden prvek nelze spolehlivě označit za viníka. Někdy je podstatnou službou prostě ukázat, že sporná věc není tak jednoznačná, jak se někdo snažil ukázat.
Indexy růstu jsou zásadním ukazatelem pro miliony lidí, neboť se od nich většinou odvozují mzdové tarify. Možná tedy stojí za zmínku, co všechno se s nimi dá udělat, aby skákaly, jak si kdo pískne.
Abychom si to ukázali na co nejjednodušším příkladu, řekněme, že litr mléka stál loni 20 centů a bochník chleba byl za pěticent. Letos je mléko zlevněné na 10 centů a chléb podražil na 10 centů. Tak a teď – co byste chtěli dokázat? Že životní náklady rostou? Nebo že naopak klesají? Nebo že jsou pořád stejné?
Považujme minulý rok za základní období, to znamená že ceny za toto období budou 100 procent. Protože cena mléka od té doby klesla na polovinu (na 50 procent) a cena chleba se zdvojnásobila (na 200 procent) a průměr z 50 a 200 je 125, celkově se ceny zvýšily o 25 procent.
Zkuste to znova a vezměte jako základní období letošní rok. Mléko stálo 200 procent toho, co stojí teď a chleba se prodával za 50 procent proti letošku. Průměr: 125 procent. Ceny byly o 25 procent vyšší, než jsou teď.
Pokud bychom chtěli dokázat, že se cenová hladina nezměnila vůbec, přejdeme jednoduše na geometrický průměr a použijeme kterékoliv období jako základ. Je to trochu odlišné od aritmetického průměru, který jsme použili původně, ale je to naprosto legitimní typ čísla a v některých případech nejužitečnější a nejlépe vypovídající. Chcete-li získat geometrický průměr tří čísel, vynásobíte je mezi sebou a vypočítáte třetí odmocninu. Pokud máte čtyři čísla, pak čtvrtou odmocninu; pro dvě druhou odmocninu. Asi takto:
Vezměte minulý rok jako základ a loňskou cenovou hladinu nazvěte 100 procent. Vy vlastně vynásobíte mezi sebou těch 100 procent za každý druh zboží a vypočítáte odmocninu, která je 100. Pak přejdete k letošnímu roku, kdy je mléko za 50 procent loňské ceny a chléb za 200 procent. Takže 50 násobíte 200 a dostanete 10.000. Druhá odmocnina, což je geometrický průměr, je 100. Ceny nešly ani nahoru ani dolů.
Faktem je, že bez ohledu na matematický základ, je statistika natolik uměním, nakolik je vědou. Velmi mnoho manipulací, a dokonce deformací se dá udělat ve vší slušnosti. Statistik se často musí subjektivně rozhodnout mezi různými metodami a zvolit tu, kterou k prezentaci faktů použije. V komerční praxi je dost nepravděpodobné, že by vybral nevýhodnou metodu, jako by textař těžko nazval výrobek svého sponzora chatrným a levným, když může stejně dobře říct, že je lehký a šetrný.
Dokonce i ve vědecké práci může mít člověk (možná nevědomky) určitý sklon k tomu, aby si přihříval polívčičku. Dá se to dokázat. Z toho vyplývá, že je nutno statistické materiály, fakta a čísla v novinách a v knihách, časopisech a reklamách, podrobit velmi přísnému zkoumání, než kterékoliv z nich přijmeme. Pozorně přimhouřené oko někdy umožní lépe zaostřit. Apriorní odmítání statistických metod nemá také žádný smysl. To je jako odmítat číst, protože spisovatelé někdy používají slova, aby fakta a vztahy spíš utajili než odhalili. Konec konců politický kandidát na Floridě nedávno vytřískal pozoruhodný kapitál, když nařknul svého oponenta, že „praktikuje celibát.“ Majitel kina v New Yorku, který promítá film Quo Vadis použil velká písmena na citát z The New York Times. Tyto noviny totiž nazvaly film „historickou okázalostí.“ A výrobci Crazy Water Crystals, patentovaného léku, psali v reklamách o svém výrobku, že poskytuje „rychlou, krátce trvající úlevu.“
Poznámka Evy Zamrazilové:
Takže pokud jste dočetli až sem, měli byste mít v zásadě jasno, na co vše si dávat pozor. Na výsledky průzkumů, které nemusí být objektivně provedené ani interpretované. Na „průměrné“ hodnoty všeho možného. Na podezřele přesná čísla, na grafy, které jsou příliš přesvědčivé, ale přitom nemají jasnou legendu, měřítko, neuvedou přesné měrné jednotky či zdroj, z něhož tvůrce grafu čerpal. Na tvrzení či dokonce výzkumy potvrzující na základě „statistiky“ nejrůznější souvislosti, aniž by za nimi stál logicky a věcně zdůvodnitelný příběh. Na záměnu příčiny a důsledku, a také na to, jestli je opravdu předmětem zkoumání jev, který je „statisticky“ dokazován. A v neposlední řadě i na slevy : kolik vlastně ušetříte na deklarované slevě? Anebo úpravy platů – je plat, snížený loni o 10% a zvýšený letos o 10% opět stejný jako před úpravou? Chce to jen trochu přemýšlení, abychom zjistili, že stejný není, že se snižoval vyšší plat a tento snížený se pak zvyšoval. Nejde tedy o stejných 10 % – pokaždé je to jiná peněžní částka.
Nebylo by špatné, kdyby se pro manipulace se statistickými údaji nalezl a vžil výraz jako statistikulace, statistipulace nebo třeba manipulistika, o což se autor snaží. Mnohé z toho, co se na nás denně valí z médií a z Internetu se sice tváří jako statistika, ale ve své podstatě je to statistikulace. A je celkem jedno, jestli se jí dopustil “nevinný břídil“ nebo „lstivý manipulátor“.
Autor knihy se snažil především podnítit ve čtenářích základní instinkty kritického myšlení, V řadě případů poukázal na to, jak optiku trochu pootočit – kdo nosí brýle zná ze zkušenosti u optika, že často stačí jen pootočit sklíčkem a hned se nám rozjasní. Nevěřit bez rozmyslu, všemu, co je nám předkládáno pod pláštíkem „nezpochybnitelně vědecké odbornosti“ a nezapomenout používat zdravý rozum. V poslední kapitole nám autor ještě jednou a tentokrát systematicky zrekapituluje, které základní otázky bychom si jako statisticky gramotní občané měli pokládat.
doc. Ing. Eva Zamrazilová, CSc.
Po studiu na národohospodářské fakultě VŠE vyučovala teorii statistiky a ekonomickou statistiku na VŠE, pracovala jako vědecký pracovník v Ústavu prognózování VŠE, v Ekonomickém ústavu ČSAV a Výzkumném ústavu práce a sociálních věcí. V 90. letech spolupracovala na řadě studií k tématice transformace české ekonomiky, absolvovala krátkodobé stáže v zahraničí. Doktorandské studium ukončila v roce 1990 na Katedře statistiky NH fakulty VŠE. Od roku 1994 pracovala na makroekonomických analýzách a prognózách v Týmu hlavního ekonoma Komerční banky. Byla členkou vědeckého grémia České bankovní asociací v rámci Pracovní skupiny pro ekonomické a měnové otázky, je členkou předsednictva České společnosti ekonomické a nositelkou ceny ČSE. Přednáší makroekonomickou analýzu na Vysoké škole ekonomie a managementu. Dlouhodobě publikuje v domácím i zahraničním odborném tisku na témata makroekonomické rovnováhy, konvergenčního procesu tranzitivních ekonomik, hospodářské politiky, trhu práce (je autorkou či spoluautorkou více než 150 odborných titulů), rovněž přednáší na odborných konferencích. S účinností od 1. března 2008 byla Eva Zamrazilová jmenována členkou bankovní rady ČNB.
Poznámka ČSÚ – Tereza Košťáková, Petr Musil
Devátou kapitolu můžeme vnímat jako shrnutí úmyslných či neúmyslných chyb, které vedou ke klamání uživatelů statistiky. Některé chyby byly podrobněji popsány v předchozích kapitolách a rovněž jsme se k nim vyjadřovali ve svých komentářích. Téma posuvných základů a výpočtu procent stojí za hlubší zamyšlení. D. Huff uvádí řadu někdy i těžko uvěřitelných příkladů nesprávných anebo zavádějících výpočtů. Ovšem tato problematika skýtá jistá interpretační úskalí, i pokud jsou výpočty korektní.
Meziroční indexy jsou u uživatelů populární, neboť si je lze na rozdíl od bazických indexů, které se vztahují k průměru často velmi vzdáleného roku (např. k průměru roku 2015), dobře představit. Jde prostě o srovnání vůči stejnému období předchozího roku (např. srovnáváme 1. čtvrtletí 2022 s 1. čtvrtletím 2021). S každým dalším měsícem nebo čtvrtletím dochází k posunu základu, což musí mít uživatelé na paměti a vzpomenout si, co se dělo ve stejném období předchozího roku. Například, že meziroční index HDP byl v 2. čtvrtletí 2021 významně ovlivněn uzávěrou ekonomiky ve 2. čtvrtletí 2020 (čili tím, co se dělo o rok dříve). V publikacích ČSÚ bývají obvykle v takových případech uživatelé upozorněni na tzv. „efekt základny“, čili na mimořádnosti ovlivňující období, s nímž se srovnání provádí. Je to přece jen již rok a ne každý má v paměti, co se tehdy dělo.
Na tzv. „efekt základny“ je nutné pamatovat vždy, bez ohledu na to, zda jde o meziroční, meziměsíční nebo mezičtvrtletní (či jakýkoliv jiný) index. Připomeňme na tomto místě ještě jednu důležitou skutečnost, na kterou se občas při práci s meziměsíčními či mezičtvrtletními indexy zapomíná: aby bylo možné provádět takové srovnání, musí se u většiny statistik používat sezónně očištěná data.
Nedávalo by smysl porovnávat „jarní“ čtvrtletí se „zimním“ čtvrtletím (tj. se „zimní“ základnou), pokud by nebyl vliv specifických odlišností sezón eliminován. A připomeňme ještě dva příklady, které dokreslují zdánlivé záludnosti posuvných základen, které však vychází jen z běžně známých skutečností při práci s procenty. Jestliže například ekonomika v jistém období klesne o 10 % (oproti původní základně), tak pokud by se měla ekonomika dostat na původní úroveň, musí v následujícím období vzrůst o 11,1 %, neboť tento následný růst se již počítá z nového (nižšího) základu.
Poslední příklad, který zde uvedeme, připomíná, že je sice důležité mít na paměti, co se dělo před rokem, ovšem nesmíme zapomínat ani na sledování toho, co se dělo v průběhu celého roku.
Neobvyklý vývoj v průběhu roku totiž může vést k na první pohled nekonzistentním výsledkům. K tomu došlo například v lednu 2010, kdy byla cenová hladina měřená indexem spotřebitelských cen vyšší meziročně o 0,7 % a meziměsíčně o 1,2 %. Nižší meziroční než meziměsíční index spotřebitelských cen není obvyklý, ale má vždy logické vysvětlení. V průběhu roku 2009 totiž cenová hladina klesala, a proto byl v konečném důsledku meziroční index nižší (tj. srovnání ledna 2010 oproti lednu 2009) než meziměsíční index (tj. srovnání ledna 2010 oproti prosinci 2009).
Ing. Tereza Košťáková
Absolvovala obory Hospodářská politika a Ekonomická žurnalistika na Vysoké škole ekonomické v Praze. Pracuje v Českém statistickém úřadě, kde postupně zastávala různé pozice. Mimo jiné se podílela na vývoji nové metody odhadu zahraničního obchodu v podmínkách jednotného trhu EU, od roku 2014 byla vedoucí oddělení čtvrtletních odhadů v odboru národních účtů, které odpovídá za čtvrtletní odhady hrubého domácího produktu a souvisejících makroekonomických agregátů. Patří mezi uznávané odborníky v oblasti zahraničního obchodu a dopadů globalizace na vypovídací schopnost statistických ukazatelů. Je autorkou populárně naučné knihy „O složitém jednoduše – aneb nebojte se statistiky, nekouše“.
Ing. Petr Musil, Ph.D.
Absolvoval obor Statistické a pojistné inženýrství na Vysoké škole ekonomické v Praze, kde získal doktorát v oboru Statistika. Již při studiích nastoupil do Českého statistického úřadu, kde prošel několika pozicemi a od roku 2021 je ředitelem sekce makroekonomických statistik. Podílel se na zavádění mezinárodních standardů národního účetnictví ve vybraných zemích v rámci mezinárodních projektů. Je autorem nebo spoluautorem desítek odborných článků a konferenčních příspěvků. Patří mezi uznávané odborníky v oblasti ekonomické statistiky. V rámci pedagogické činnosti se podílí na výuce ekonomické a sociální statistiky na Fakultě informatiky a statistiky VŠE v Praze.