Přejít k obsahu

Chatbot sčítání odpovídal na 11 tisíc dotazů denně

Pavel Hortig

13. 08. 2021

  • Statistiky
  • Lidé
  • Sčítání lidu, domů a bytů
  • Sčítání 2021

Nebývalý rozsah využití chatbota při sčítání nemá ve světě obdoby. Ten náš úspěšně zvládnul i nástrahy obtížné gramatiky českého jazyka.

Chatbot je obecně počítačový nástroj k automatizované komunikaci, v případě letošního sčítání byl využit k online zodpovídání dotazů v písemné podobě. Na položené dotazy reagoval ve vteřině a v provozu byl po celou terénní fázi sčítání 24 hodin denně, 7 dní v týdnu. Jeho nasazení znamenalo velmi významnou úsporu nákladů i lidských kapacit, např. kontaktnímu centru sčítání odlehčil zhruba 86 % zátěže tím, že v řadě případů odbavil několik prvních dotazů, než uživatelům nabídl přepojení na operátora.

Chatbot sčítání umožnil psát dotazy volným způsobem, aniž by bylo nutné volit z přednastavených konverzačních schémat, což bylo podle dostupných informací jedinečné jak v rámci státní správy ČR, tak dokonce v celosvětovém měřítku. Ve spojitosti s náročností počítačového zpracování češtiny jako jazyka s bohatým tvaroslovím a volným slovosledem byl způsob využití chatbota při Sčítání 2021 průkopnický i v kontextu sčítání v jiných zemích, a to napříč všemi kontinenty.

V průběhu ostré fáze sčítání, která začala 27. března a trvala do 11. května, reagoval chatbot přibližně na 510 tisíc zpráv, v průměru tedy na 11 tisíc za jediný den. Pouze na 3,6 % z nich nedokázal najít odpověď. Z celkového počtu zhruba 258 tisíc uživatelů využilo jen 20 tisíc možnost následného přepojení na lidského operátora livechatu, tedy 435 denně. Na každých 100 nově založených elektronických formulářů připadlo průměrně 8,5 dotazu na chatbota.

Přípravy kratší než rok

Při průzkumu trhu provedeném v červenci a srpnu 2019 představilo 6 uchazečů technologicky a funkčně velmi rozmanitá řešení s náklady přesahujícími i 10 mil. Kč. Projekt byl oficiálně zahájen 4. května 2020, kdy došlo k podpisu smlouvy se společností UnitX, která vzešla z otevřeného výběrového řízení na zakázku malého rozsahu. Celková konečná cena za projekt se započítáním plnění ze všech dodatků smluv byla přibližně 2 mil. Kč. Poměr cena/výkon vysoutěženého řešení tak byl velmi výhodný.

Samotné přípravy chatbota (obecného programu a specializovaných dat z oblasti sčítání) trvaly méně než rok. První verze s omezenou databází otázek a odpovědí (cca 15 % rozsahu použitého při reálném sčítání) a navíc bez možnosti přepojovat na lidského operátora livechatu byla využita již při zkušebním sčítání v září a říjnu 2020. Tehdy se jednalo řádově o stovky tazatelů a méně než tisíc dotazů.

Chatbot, včetně integračního rozhraní na službu livechat kontaktního centra, zajišťovaného firmou Conectart, byl vyvinut speciálně pro potřeby projektu sčítání, protože standardně dodávané chatboty nebyly pro účely projektu Sčítání 2021 a jeho specifičnost optimální. Jednalo se o modulární řešení s unikátním NLP (natural language processing) jádrem. Vznikl tak systém, který umožnil operativní správu rozsáhlé databáze a její efektivní optimalizaci na základě vyhodnocení položených dotazů.

Dotazy seriózní i kuriózní

Chatbot fungoval jako tzv. cloudová služba (zabezpečený server), která byla v podobě komunikačního okna (klienta) integrovaná do elektronického sčítacího formuláře na webu onlinescitani.cz, dostupného v internetovém prohlížeči i v mobilní aplikaci, a také do informačního webu (scitani.cz). Zadat dotaz bylo možné po kliknutí na malou ikonu s nadpisem „Potřebujete poradit?“ v pravém dolním rohu obrazovky. Vnitřní algoritmus chatbota se poté snažil rozpoznat, na co se tazatel ptá, a následně vybral nejvhodnější odpověď z rozsáhlé databáze pokrývající všechny důležité aspekty sčítání.

Když si byl chatbot jistý, vybral jednu správnou odpověď, pokud byl dotaz širší, nabídl až pět možností. V případě, že nedokázal správně zareagovat, dostal uživatel možnost přepojení na operátora kontaktního centra.

Nástroj si v přiměřené míře poradil i s překlepy, zvládl vstupy bez diakritiky, uměl česky skloňovat i časovat a pracoval rovněž se synonymy (např. formulář a dotazník, zahraničí a cizina, chyba a omyl) nebo ustálenými spojeními (např. rodné číslo, kontaktní místo, ochrana osobních údajů).

Databáze otázek a odpovědí, s níž chatbot pracoval, pokrývala problematiku sčítání v širokých souvislostech a v průběhu projektu byla navíc na základě obdržených dotazů průběžně obohacována. Tematicky zahrnovala 993 různých klíčových slov a 265 odlišných ustálených spojení. Podle následné analýzy nejčastěji poskytovaných odpovědí mířily dotazy zejména na obecný smysl a povinnost sčítání, vyplňování adresy trvalého/skutečného pobytu, konkrétní postup při sčítání, využití osobních údajů nebo zjištění plochy bytu. Zapomnětlivci se po oficiálním konci sčítání nejčastěji ptali, zda se ještě mohou sečíst, kde získají sčítací formuláře a na metody vymáhání sankcí.

Tazatele trápily také problémy se zadáváním adres (našeptávačem), ověřováním dokladů nebo vyplňováním údajů za příbuzné žijící mimo domácnost či v zahraničí. Dotazovali se rovněž na způsob sečtení občana cizího státu, získání potvrzení o úspěšném odeslání formuláře a na zachycení specifických okolností sčítané domácnosti.

Současně s dotazy na frekventovanější témata z oblasti sčítání byla zaznamenána i řada těch kurióznějších. Uživatelé se například ptali, zda mají sčítat veškeré své nemovitosti a občany v nich žijící, nebo zda je možné odkoupit vybavení, které bylo použito během sčítání. Jiní zase měli potřebu pouze sdělit svůj pozitivní pocit z rychlého a snadného sečtení pomocí online formuláře.

V malé skupině nezodpověditelných dotazů (3,6 %) převažovaly vulgární výpady, témata, na která chatbot neznal odpověď, a cizojazyčné vstupy, zejména slovenština, ruština, vietnamština a také angličtina. Ovšem i na ofenzivní výpady občana dokázal chatbot v některých případech vhodně zareagovat diplomatickým způsobem, a to s odůvodněním, proč je nezbytné sčítání realizovat.

Budoucnost na webu ČSÚ

Projekt se od 1. července 2021 přesunul z cloudu (serverů) dodavatele do infrastruktury ČSÚ a do roku 2023 má zajištěnou i podporu provozu. Do té doby bude chatbot kontinuálně využíván na webu scitani.cz pro účely informování o výsledcích sčítání. S jeho nasazením se počítá i na hlavních stránkách ČSÚ, kde pomůže tazatelům při získávání nejčastěji žádaných statistický údajů a dalších užitečných informací a kontaktů.

Vytížení chatbota v průběhu terénní fáze sčítání

Zdroj: ČSÚ

Článek si můžete přečíst také v časopisu Statistika&My.

Více se dočtete zde: Sčítání lidu, domů a bytů