Rozvětvená rodina kvantilů
Kvartil, decil a percentil jsou tři bratři s latinskými jmény a se společným příjmením kvantil. Mají dokonce i další, ještě méně známé bratříčky (například kvintil), nebo naopak mnohem známější (medián). Všichni tito bratříčci jsou čísla, která rozdělují soubor jednotek (např. skupinu lidí) na menší části podle hodnot vybrané proměnné (například podle tělesné výšky). Medián rozdělí takový soubor na dvě části, kvartil na čtyři části, kvintil na pět, decil na deset a percentil na sto částí. A jakým způsobem jej rozdělí? Předně si všechny jednotky (lidi) seřadíme vzestupně podle velikosti a pak je rozdělíme do skupin tak, aby v každé skupince byl (zhruba) stejný počet jednotek (lidí). A hraniční hodnoty mezi těmito skupinkami jsou právě kvantily.
Kvartily, decily, percentily – jaký mají rodokmen?
Je to stejné, jako když žáci při cvičení nejprve nastoupí vedle sebe podle velikosti a pak se rozdělí do (pokud možno) stejně početných družstev (podle velikosti). To, kde se nakreslí pomyslná dělicí čára mezi žáky, záleží na tom, kolik družstev chceme. Pokud dvě, pak stačí jedna dělicí „čára“ – medián: odpočítáme polovinu žáků (od nejmenšího) a nakreslíme čáru. V družstvu malých budou všichni menší než hodnota mediánu (pod čárou) a v družstvu velkých bude druhá polovina (všichni nad mediánem). Podobně můžeme pracovat s kvartily (potřebujeme 3 čáry), decily (9 čar), či dokonce percentily (99 čar), a výsledných družstev bude víc.
A k čemu nám to je? Kvantily nám umožňují rychle se orientovat ve velkém souboru jednotek a popsat jeho vnitřní strukturu (tohle průměr neumí). Díky nim můžeme zjistit, zda v rámci souboru existují extrémy, nebo zda je soubor víceméně homogenní. Nebo obráceně, pokud známe kvantily, do kterých určitá jednotka spadá, víme, jak si stojí v rámci celého souboru, aniž bychom museli znát podrobnosti.
Uveďme alespoň tři příklady, kdy se s kvantily setkáme. Prvním je mzdová statistika: vedle mediánu se obvykle publikují i další kvantily mezd. Jak je patrné z obrázku 3, 5 % pracovníků s nejnižší mzdou pobíralo v roce 2017 méně než 12 307 Kč (5. percentil). Méně než 14 106 Kč pobíralo 10 % pracovníků (1. decil). Také zjistíme, že pouze 5 % pracovníků má mzdu nad 62 227 Kč (95. percentil). Ale můžeme se na to podívat i jinak: když měl člověk měsíčně 37 tis. Kč, zjistí, že patřil mezi zhruba 25 % nejlépe placených (jeho mzda byla vyšší než 3. kvartil).
Jakpak nám ten kluk roste?
Druhým příkladem je prezentace výsledků různých srovnávacích zkoušek. Když se například dozvíme, že náš synek skončil ve 3. decilu, asi nebudeme moc rádi, protože to znamená, že 70 % jeho spolužáků bylo lepších než on.
A třetí příklad: každý rodič se s kvantily setkává už od narození svého potomka. Na konci zdravotních a očkovacích průkazů dětí v ČR dnes najdeme tzv. růstové grafy. Díky nim si může každý porovnat svou ratolest s ostatními dětmi stejného věku. Pro ilustraci se podívejme na Honzíka (graf 13). Když se narodil, patřil mezi nejmenší děti – pouze 3 % dětí se narodí ještě menších než on (byl na 3. percentilu). Honzík pak sice rostl, ale i při druhém měření zůstával mezi 3 % nejmenších ve svém věku (i ve věku 3 měsíců byl stále na křivce 3. percentilu). Až pak začal růst jako z vody – v 6 měsících už poskočil na 75. percentil – byl totiž vyšší než 75 % dětí jeho věku! Původně po svých vrstevnících oblečení dědil a všechno na něm plandalo, teď už mu většina oblečení pro jeho věk bude malá.