Přejít k obsahu

Datoví novináři sestavují z čísel příběhy

Pavel Černý

29. 07. 2024

  • Rozhovory

Kateřina Mahdalová a Michal Škop působí jako datoví novináři v redakci Seznam Zprávy. V rozhovoru jsme zjišťovali, jak vznikají jejich články.

Čím se liší datový novinář od ostatních novinářů?

KM: V práci s daty i s kontextem. My na číslech stavíme celý příběh, a nepoužíváme data jako doplněk nebo zpestření textu. Zkrátka tam, kde práce kolegů a kolegyň končí, naše teprve začíná. Pro představu: každá redakce zveřejňuje volební průzkumy. K nim dává samozřejmě grafy – buď od konkrétní agentury, jež zrovna průzkum přinesla, nebo si jednoduchá data snadno překreslí do vlastní grafiky a ta pak slouží jako ilustrace k textu. My průzkumy sledujeme dlouhodobě, vždy za celé volební období, všechny zaznamenáváme do jednoho speciálního interaktivního grafu a počítáme z nich vážený průměr. Proč? Protože jeden průzkum bez kontextu vám mnoho neřekne. Navíc čtenářům umožňujeme, aby si sami filtrovali, co je zajímá. Vývoj preferencí pro jednotlivé strany nebo porovnání odhadů různých agentur. A právě tahle sledování jsou cenná.

MŠ: Nedatoví novináři také publikovaná čísla často doplňují komentáři osob, které v dané oblasti považují za důležité. K inflaci se vyjadřují ekonomové a bankéři, k počtu uprchlíků představitelé neziskovek, zástupci ministerstev a podobně. My své závěry samozřejmě také konzultujeme s odborníky, ale články nestavíme primárně na citacích.

Kdo určuje témata, jimiž se budete zabývat?

MŠ: My sami. Velké téma pro datovou žurnalistiku jsou volby. Těm se věnujeme pravidelně. Další témata vybíráme podle toho, co je důležité nebo co se děje ve veřejném prostoru. Například když začala nabobtnávat debata o tom, že se ve velkém přeprodávají do zahraničí léky a na české pacienty jich zbývá málo, zkoumali jsme, jestli se to skutečně děje. A zjistili jsme, že se jedná o zárodek dezinformací, data tomu neodpovídala.

KM: Zaměřujeme se na oblasti, jež se významně dotýkají životů lidí, sledujeme dlouhodobé trendy a také změny. Třeba když se před dvěma roky výrazně zvedly ceny benzínu. Vláda spustila velké kontroly čerpacích stanic kvůli podezření, že mají vysoké marže, ale my jsme po hloubkovém pátrání a analyzování dat zjistili, že benzínky nezískávají skoro nic navíc. Všechny obří zisky totiž inkasovaly rafinerie.

Nebo když obrovsky narostly výdaje na příspěvek na bydlení, podívali jsme se detailně na byznys s chudobou, o kterém už slyšel snad každý. Stát vyplácí peníze nízkopříjmovým domácnostem, ale inkasují je vlastníci nájemních bytů. Výnosné podnikání prakticky bez rizika. Vyžádali jsme si od Úřadu práce data za jednotlivé obce, jaké částky se na tuto sociální dávku vydaly za posledních deset let. Zkombinovali jsme je s daty z katastru nemovitostí a rozkryli důležitou korelaci: čím více bytů v dané lokalitě drží jen jeden nebo dva majitelé, tím větší díl lidí zde čerpá příspěvek na bydlení. Velcí hráči totiž určují pravidla. A skutečný trh v těchto místech neexistuje, když jaksi není konkurence. Můžete se přestěhovat do jiné ulice, do jiné čtvrti, ale nepomůžete si, protože i zde byty vlastní týž majitel, od něhož odcházíte.

Kateřina Mahdalová

Studovala bohemistiku na Filosofické fakultě UK, mediální studia a informační vědy na Masarykově univerzitě v Brně. Absolvovala studijní stáže na Kalifornské univerzitě v San Diegu (USA) a na Bangor University (Velká Británie). Publikovala v řadě tuzemských i zahraničních médií, řídila datové projekty v ČTK. V roce 2016 byla nominována na Evropskou novinářskou cenu, je držitelkou tří finálových ocenění Novinářská cena a v roce 2020 zvítězila v kategorii Inovativní online žurnalistka.

 

Michal Škop

Vystudoval Matematicko-fyzikální fakultu UK a následující doktorské studium demografie na Přírodovědecké fakultě UK. Absolvoval stáže na Max-Planck institutu v Rostocku (Německo) a na Institutu iberoamerických studií v Salamance (Španělsko). Studoval rovněž v Latinské Americe. Je zakladatelem spolku KohoVolit.eu a držitelem finálových ocenění Novinářská cena za roky 2011 a 2023.

 

Obracejí se na vás kolegové z jiných částí redakce, kteří by chtěli pomoct při zpracování dat pro svá vlastní témata?

KM: Jen málo. Coby datoví novináři jsme v profesní hierarchii jakoby bokem. Často chybí propojení s dalšími kolegy, kteří se věnují podobným tématům. A když jejich článek vyjde, my si pak jen smutně říkáme, co se s tím dalo ještě udělat, co všechno by bylo dobré analyzovat a upřesnit nebo vysvětlit. Ale téma spláchne pěna dní a bývá obtížné ho znovu otevřít. Jak je jednou téma publikováno, média se k němu nerada vracejí. Občas se ale zadaří a prosadíme si možnost ho ještě pořádně rozpracovat.

Jak složité je v Česku získávat data?

MŠ: Záleží na tom, jaká. Často používáme data veřejná, která jsou přístupná snadno. Třeba ta z ČSÚ, který jich nabízí obrovskou škálu, a my z nich také hojně čerpáme. Jiná data je třeba takzvaně stošestkovat. Podle zákona 106/1999 o svobodném přístupu k informacím žádáme o data příslušné instituce. Někdy se s nimi musíme dohadovat, ale většinou nám vyhoví a data pošlou. A pak jsou data, k nimž se nedostaneme ani přes zákon 106. V takových případech si musíme najít zdroj, který nám data poskytne.

KM: To se stalo třeba během pandemie covidu-19. ÚZIS sice poskytoval data o postupu nákazy, ale část z nich posílal jenom vybraným politikům a institucím. Nám se díky poslanecké iniciativě podařilo zařadit se mezi adresáty a zjistili jsme, že poslancům a poslankyním chodí obrovské soubory dat v excelovských tabulkách. Neměli šanci je denně analyzovat, a pak na jejich základě kvalifikovaně rozhodovat. Začali jsme tato poloveřejná data zpracovávat a zveřejňovat v přehledných mapách a grafech. A teprve pak ÚZIS data mnohem víc otevřel.

MŠ: Existují ale i data, ke kterým se dostat nedokážeme. Už delší dobu se například snažíme od Úřadu vlády zjistit, kdo všechno má přístup do elektronické knihovny eKLEP. Ta slouží k výměně dokumentů v průběhu připomínkového řízení k návrhům zákonů a vyhlášek. Chtěli bychom vědět, kteří lobbisté mohou v této fázi tvorbu legislativy ovlivňovat, ale nebylo nám to umožněno. Společnost by však podle nás měla mít možnost kontroly.

Váháte někdy, zda výsledky, k nimž jste dospěli, zveřejníte? Třeba proto, že by mohly vyvolat paniku, nebo negativní postoj vůči určité skupině obyvatel?

KM: Nevzpomínám si, že bychom něco nepublikovali, ale hodně promýšlíme, jak data co nejlépe předat veřejnosti a předcházet dezinterpretacím. Nemůžeme jen položit čísla na stůl, musíme zkoumat, co skutečně říkají. Zasazujeme je do kontextu a poctivě vysvětlujeme, kde jsou skutečné příčiny jevů, které veřejnost automaticky spojuje s různými skupinami lidí.

MŠ: Ono to totiž v praxi chodí spíš naopak. Ve společnosti koluje mnoho nepodložených informací vyvolávajících obavy, a kvalitní data dokážou uvést věci na pravou míru.

KM: Úskalí datové novinařiny ovšem je, že bývá o dost pomalejší než šíření nepodložených zpráv. Celý proces, kdy musíme data získat, ověřit, analyzovat a upravit do srozumitelné podoby, nějakou dobu trvá. Vypustit nějaký blábol je oproti tomu dílem okamžiku.

Zveřejnili jste někdy něco, o čem jste později zjistili, že je to nesmysl?

KM: Velkého kiksu, kdy by byla špatně celá analýza, jsme se snad nikdy nedopustili. Menší drobné chyby ale děláme jako každý. Já například v rychlosti špatně vyfiltrovala jednoduchou přehledovou tabulku, a tím se zpřeházely počty obyvatel v krajích. Nebo jsem při editování nahradila podíl v procentech za zlomek a nevšimla si, že u číselného údaje zůstala značka procent. Většinou si ale chyb nebo nesrovnalostí všimnu ještě před publikováním analýzy. Třeba když vytvářím mapu s obcemi a barevné stínování neodpovídá tomu, co čtu v datech – je jasné, že se jen posunuly řádky, nejčastěji kvůli vojenským újezdům.

MŠ: Takové věci se občas stávají a nejsou příjemné. Výhodou online média ale je, že je můžeme po objevení rychle opravit nebo do článku doplnit upřesnění.

Dokázal nějaký váš článek posunout řešení problému správným směrem?

KM: To se stalo vícekrát. Letos je to deset let, co jsem založila web datovazurnalistika.cz a jedno z prvních témat, na které jsem se zaměřila, byly exekuce. Nebudete tomu věřit, ale tato data se tehdy získávala pouze z nepravidelných tiskových zpráv Exekutorské komory nebo ze zmínek jejích představitelů v médiích. Věnuji se tomu dodnes, a postupně se povedlo velký problém natolik medializovat a vysvětlit veřejnosti i voleným zástupcům, že se situace o dost zlepšila. Jedním z řady úspěchů je, že Exekutorská komora po dvaceti letech své činnosti musela povinně ze zákona otevřít svá data.

MŠ: Loni jsme poprvé publikovali mapu zobrazující index kvality života. Pro jednotlivé obce vyhodnocujeme dvě desítky různých kritérií a sestavujeme z nich souhrnný ukazatel, jak dobré podmínky k životu kde mají. Ozvalo se nám pak několik institucí, které na naši mapu navázaly a rozšířily ji o další sledované oblasti. To se děje i s jinými našimi analýzami.

Můžete srovnat úroveň datové žurnalistiky u nás a v jiných zemích?

MŠ: Špičku představují globální média typu The Guardian nebo New York Times. Datovou žurnalistikou se tam zabývají celé týmy, a jejich úroveň tomu odpovídá. A pro nás je to obrovský zdroj inspirace. Myslím ale, že jsme na standardní evropské úrovni. Třeba ve volebních analýzách máme velmi dobré výsledky a spolupracujeme i se zahraničními médii.

KM: Hodně žádané jsou naše volební predikce, v těch se řadíme na špici i v mezinárodním srovnání. A překvapivě bylo těžší vysvětlit veřejnosti, proč je vlastně děláme, než co říkají. Odpověď je jednoduchá: protože jsme zažili desítky, možná stovky volebních vysílání a často to bylo tristní. Do volebních studií se zvou výrazně častěji muži než ženy, a tito moudří mužové, jak jim lehce ironicky říkám, se během sčítání hlasů zamýšlejí, co se stane, až se sečtou velká města, a jak to celé dopadne. Pokaždé stejný scénář: odhady, ale leckdy mimo. No, a my umíme přesně spočítat konečné výsledky už při malém podílu sečtených hlasů. Ani jednou se nám nestalo, že by naše predikce nevyšla, a třeba nového českého prezidenta jsme loni vyhlašovali sedm minut poté, co jsme z ČSÚ obdrželi první průběžná data. Sečteno bylo 0,6 procent hlasů, a výsledek jsme měli přesně – na desetiny procent.

Konkurujete si s dataři z jiných redakcí?

MŠ: Témat je daleko víc než týmů datových novinářů, takže si všichni tak nějak přirozeně nacházíme to svoje a nijak si nekonkurujeme. Jediné, co děláme všichni, jsou volby. Ty pokrývá každá redakce.

KM: A protože je nás málo, všichni o sobě víme, potkáváme se a udržujeme přátelské vztahy. Občas se samozřejmě stane, že se druhá redakce věnuje stejnému nebo podobnému tématu jako my. Obvykle to ale rozebírají z jiného pohledu a zajímají se o jiné detaily, takže se naše práce spíš doplňují a my jsme za to rádi.

Jak je připraveno na datovou žurnalistiku publikum? Jsou vaše články oblíbené a dostatečně srozumitelné pro čtenáře?

KM: Zrovna připravujeme výzkum, který čtenáře našich článků podrobněji zmapuje. Zatím tady žádný takto zaměřený nebyl a víme toho dost málo. Třeba, že lidé v online prostředí většinově neholdují dlouhým textům a že jich na konec analýzy doscrolluje jen zlomek.

MŠ: Jsme internetové médium. To znamená, že články musí být možné rychle přečíst a vstřebat, orientace v nich by měla být jednoduchá a snadná. Výhoda je, že v Česku lidé umějí číst mapy, což v některých zemích světa vůbec nebývá samozřejmost.

Jak ovlivní datovou žurnalistiku umělá inteligence?

MŠ: V tuto chvíli nám pomáhá. Významně například urychluje zpracování velkého množství dat. To, na čem jsme dříve trávili hodiny, nyní trvá deset minut. To je jasné plus. Co dalšího přinese AI do budoucna, ale přesně neví nikdo.

KM: Nemyslím si, že by za nás umělá inteligence v dohledné době začala dělat datovou novinařinu. Bude to spíš stále účinnější generátor dezinformací. Teď jsme s ní spíš kamarádi, dost ji testujeme pro různé typy prací a pilujeme prompty a postupy. Rizika ale bereme vážně.

Co by se stalo, kdybyste neměli k dispozici data z ČSÚ?

KM: Byla by to strašná ztráta. Sice máme spoustu dat stažených, takže bychom nějaký čas vydrželi, ale dlouhodobě se bez vás neobejdeme. Data z ČSÚ používáme téměř denně, protože na nich stavíme mnoho dalších analýz.

MŠ: Máme dost velké mezinárodní srovnání a jsme moc rádi za důvěryhodná a nestranná data. V některých zemích jsou oficiální statistici pod velkým politickým tlakem a na jejich údaje se nelze spoléhat, takže si novináři musejí leccos počítat sami, kupříkladu inflaci.

KM: Spolupráci s vámi usnadňuje i to, že máte odborníky na mnoha úrovních a že jste jako instituce celkově sdílní. Leckde jinde bývá poměrně zdlouhavé a náročné vysvětlit, co vlastně chceme, nebo najít kompetentní osobu, která našemu požadavku rozumí. A dodnes někde narážíme na neochotu. To se v ČSÚ neděje.

Posílají vám náměty na články sami čtenáři?

MŠ: Spíš se občas stane, že nás čtenáři upozorní na souvislosti, které jsme v analýze nezmínili. Někdy je doplníme do stávající analýzy, jindy je necháme jako extra téma na příště. A jsme za tyhle podněty moc rádi.

Rozhovor si můžete přečíst v chystaném prázdninovém dvojčísle časopisu Statistika&My.