Posuzujme statistické ukazatele kriticky
Někdy totiž mají i ty nejjednodušší statistické ukazatele svůj pravý význam trochu skrytý. A ten nakonec může vést k úplně jiným závěrům, než by se na první pohled zdálo. Uveďme několik typických příkladů, kdy se vše zdá jasné, ale přesto bychom měli zpozornět a věnovat číslům i druhou myšlenku.
Začněme tvrzením, že podíl potravin (ve výdajích domácnosti) se snížil z 30 % na 10 %. Na první pohled by taková věta mohla rozpoutat úvahy o hladovění nebo alespoň o tom, že domácnost šetří a zkonzumuje méně. Ale pozor! Z vývoje samotného podílu potravin nic takového nevyplývá. Záleží přece i na vývoji ostatních položek. Celek je vždy 100 %. Jestliže podíl jedné položky roste, podíl druhé klesá. Pokud ostatní zboží tvořilo 70 %, na potraviny zbývá podíl 30 %. Jestliže bylo na potraviny vydáno 10 % výdajů, na ostatní položky připadne 90 %. Taková informace nám ale nic neříká o tom, jestli jsme toho snědli méně, nebo více.
Když něco dramaticky vzroste, nemusí to být drama…
Představme si, že naše parádivá rodina utrácí jen za potraviny a oblečení. Jeden rok utratila za potraviny 30 000 Kč a za oblečení 70 000 Kč (30 % potraviny, 70 % oblečení). Druhý rok jsme dostali v práci přidáno, a tak utrácíme více: za potraviny 40 000 Kč a za oblečení 360 000 Kč (10 % potraviny, 90 % oblečení). Takže přestože jsme za potraviny utráceli více, jejich podíl se propadl. Prostě jen výdaje za oblečení vzrostly rychleji než za potraviny. Proto jakmile slyšíme o tom, že nějaký podíl poklesl nebo vzrostl, vždy bychom se ještě měli ptát na vývoj samotné položky, než si uděláme názor a začneme hledat příčiny nebo nápravu.
Jiným příkladem nebezpečí ukvapeného prvního dojmu může být tvrzení, že počet úrazů způsobených ulomením nohy od židle vzrostl z roku na rok o 300 %. Takový nárůst vede k úvaze, že kvalita židlí zásadně klesá a je třeba s tím něco dělat. Když ale zjistíme, že takový úraz byl vloni jeden a letos jsou čtyři, pak se celá situace dostává do trochu jiného světla. Proto když slyšíme o nějakém dramatickém růstu nebo poklesu, vždy bychom se měli zamyslet, jestli se náhodou nejedná o velmi řídký jev, který málokdy nastane. V takových případech je totiž lepší uvádět raději absolutní údaje, například že počet úrazů vzrostl z 1 na 4.
Jsou ale samozřejmě i případy, kdy nám celou pravdu nerozkryje ani vývoj v procentech, ani absolutní údaj. Řekněme například, že počet zkažených mandarinek vzrostl v obchodě ze 100 v listopadu na 600 v prosinci (tj. jejich počet vzrostl o 500 %). Oba údaje by mohly vést k závěru, že je třeba rychle změnit dodavatele. Nicméně bychom se ještě měli zeptat: A nezměnil se náhodou celkový počet mandarinek, které byly v jednotlivých měsících prodány? Pak by to totiž mohlo být celé jinak.
… ale některé věci se dějí.
Řekněme, že v listopadu se prodalo 1 000 mandarinek, zatímco v prosinci 10 000. Míra zkaženosti (tj. podíl zkažených mandarinek na celku) tak v listopadu činila 10 % (100 zkažených mandarinek z 1 000 všech prodaných mandarinek), zatímco v prosinci pouze 6 % (600 zkažených z 10 000 všech prodaných mandarinek). Takže obrázek je opravdu nakonec jiný! Počet zkažených mandarinek sice vzrostl, ale míra zkaženosti poklesla. Díky tomu, že jsme se neukvapili a neudělali si názor hned z prvního dojmu uvedených čísel, nakonec dodavatele asi nevyměníme a uděláme dobře.
Uvedli jsme jen podíl, růst v procentech a absolutní údaje. Nic složitého. A přesto i tyto jednoduché ukazatele mohou vést k mylným závěrům, pokud se nad nimi nezamyslíme. Ať už jsme tedy v roli čtenáře (posluchače), nebo autora tvrzení (uživatele dat), vždy musíme vypovídací schopnost ukazatelů posuzovat kriticky. Používejme čísla, ale přemýšlejme o nich. I když jsou kvalitní a správná, mohou na první pohled vést k závěrům, které správné nejsou.