.

Novinka

24. 05. 2016

To, že má někdo mnoho dat, ještě neznamená, že čelí problematice Big Data

Délka čtení: 10 minut

Není tomu ani tak dávno, kdy se v Adastře začala rodit nová kompetence zaměřená na Big Data. Po řadě dílčích projektů nyní trh uzrál a firmy se postupně chystají uchopit „velká data“ komplexně a maximalizovat jejich přínos pro vlastní byznys. Jak tuto výzvu vnímá Jakub Augustín, nový Big Data Competency Leader, a nač by se trh i firmy měly v následujících měsících připravit?

Po čtyřech letech působení v Adastře jste se nyní stal novým Big Data Competency Leaderem. Je pro vás tato pozice něčím nová? Co jí předcházelo?

Zase tak úplně nové to pro mě není. Zhruba 2 roky nazpět, kdy jsem byl ještě konzultantem banking divize, zasáhla i nás, podobně jako řadu dalších firem, recese. Práce bylo méně a bylo jasné, že se musí něco začít dít. Právě v té době se ale v Adastře rozhodlo, a to dodnes oceňuji, že místo, aby se snižovaly stavy, začneme dělat nové věci a vstoupíme na nové trhy. Tak jsem vlastně dostal příležitost ještě jako konzultant pracovat na projektu v Rusku…

V Rusku? To mohla být zajímavá příležitost.

Sám bych si Rusko jako pracovní destinaci asi nevybral, jak se ale později ukázalo, byla to skvělá zkušenost. Měli jsme u klienta pracovat na projektu týkajícího se datových skladů, což je jedna z klíčových kompetencí Adastry. Zatímco ale většina českých bank už datové sklady v té době měla, ruský trh je v tomto za námi. Dostal jsem tak příležitost pracovat na komplexním projektu od samotného začátku. Pamatuji si každopádně vtipnou situaci, kdy jsme prve ke klientovi přijeli realizovat audit datového skladu a záhy vyšlo najevo, že vlastně žádný datový sklad zatím nemají… Ve výsledku ale projekt dopadl skvěle a klient byl spokojený. Mně samotnému přinesl mnoho nového a navíc mě utvrdil v tom, že odbornost profesionálů z Adastry je opravdu na světové úrovni.

Pak jste se vrátil a začal se věnovat Big Datům?

Po mém návratu do Čech ještě stále na trhu doznívala recese. Big Data byla v té době úplnou novinkou. Ještě zhruba ty dva roky nazpět to bylo něčím, co na českém trhu nebylo etablované, každopádně to byla zajímavá oblast s potenciálem. Tak jsem se jí vedle své stávající práce začal věnovat. Ze začátku to byla spíše „one man show“, pak ale přibývali noví lidé a v Adastře vznikla samostatná Big Data kompetence s vlastními projekty. Moje pozice se tedy vyvíjela postupně.

Jaké jsou vaše stávající vize a cíle v této nové pozici?

Beru to jako velký závazek i výzvu. Abychom si my mohli hrát s Big Daty, ostatní kolegové se musí i nadále starat o projekty, které byly a jsou pro Adastru stěžejní. Musíme dokázat, že Big Data nejsou pouze marketingový „buzzword“, ale že se za nimi skrývá skutečný byznys. Navíc nyní přesně nastává ta doba, kdy se Big Data začnou naplno používat v praxi. Doposud o nich všichni hovořili, představovaly se menší projekty a studie, ale zatím do toho firmy nešly naplno. Aktuálně už máme u několika našich klientů fázi představování za sebou a postupně se rozjíždějí vlastní velké programy implementující Big Data technologie.

Opravte mě, jestli se mýlím, ale pro řadu firem „velká data“ zase nemohou být takovou novinkou. Jejich systémy protéká obrovské množství informací, s nimiž musí pracovat. Odkdy se vůbec začalo hovořit o Big Datech jako pojmu a jeho potenciálu?

Pracujeme s takovými datovými zdroji, které banka sama nedokáže řádně uchopit a vytěžit, protože jsou nejen objemná, ale také se rychle vytvářejí nebo jsou nestrukturovaná.

Uvedu ještě příklad týkající se analýz nákupního koše. Známe je nějakých deset let, ale doposud je nikdo pořádně nedělal kvůli vysokým nákladům. Díky novým dostupnějším technologiím je to ale konečně možné. Navíc jsme také schopni posouvat reakční dobu (například u nabídky produktů) z měsíců či dní na reálný čas a rychle tak reagovat na aktuální životní události a potřeby klientů – například narození dítěte či rekonstrukce bytu. Tomu se říká event driven marketing.

Postupně tak budou pojmy jako textová analytika, prediktivní modelování nebo geoanalýza v souvislosti s Big Daty stále běžnějšími metodami, což je i náš cíl.

Big Data jsou tedy výzvou sama o sobě. Ve kterých konkrétních oblastech vnímáte jejich největší potenciál?

Marketing je určitě jednou z klíčových oblastí. Chtěli bychom ho ale posunout více z prodeje produktů směrem k poskytování služeb, za čímž se skrývá právě reakce na životní události v reálném čase, ať už potřebné informace zjistíme z textu, hlasových dat či aktivity na Facebooku. S tím pak souvisí také lepší možnosti mikrosegmentace. Další oblastí využití je pak například risk management.

Vedle toho stojí samotné technologické řešení. Vidím to u našich klientů, kteří mají dat opravdu více než je mnoho. Například segment telca s přechodem na 4G síť generuje stále objemnější množství informací, a o to více pak nastávají technologické výzvy, jak tato data vůbec zpracovávat. V samotných technologiích je ukrytý velký potenciál, jen jej technologicky uchopit.

Vraťme se k vám. Můžete přiblížit některý z vašich aktuálních projektů?

Například nedávno jsme dokončili projekt textové analytiky, na jehož základě jsme na zmiňovaném konceptu event driven marketingu postavili úplně nový marketing pro jednu z největších tuzemských bank. Dodnes firmy běžně praktikuji „kobercové nálety“, kdy rozešlou tisíce nabídek klientům s dotazem, jestli náhodou nechtějí kreditku. Náš projekt se cíleně zaměřil na konkrétní mikrosegmenty mimo jiné lidí, kteří se právě chystají na dovolenou, což dokážeme z dat vyčíst, a cíleně jim nabídnout vhodné produkty. Podařilo se nám tak zvýšit odezvu na kampaň několikanásobně, což je skvělé.

Předtím jsme třeba dělali ještě takovou zajímavou věc, kdy jsme z webových log predikovali pohlaví a věk uživatelů, kteří na ně klikají.

To je možné? K tomu jsou přeci potřeba nějaká další vstupní data.

Jde to. Máme-li vzorek uživatelů, kteří o sobě například uvedli, že jsou ženy ve věku 30 let (třeba 2 %) a zbytek o sobě neuvedl nic, jsme schopni podle určitých vzorců odvodit, o koho by se ve druhém případě mělo jednat. Ve výsledku jsme se tak dostali až k 80 % identifikovaných uživatelů, které jsme dokázali s vysokou pravděpodobností zařadit podle toho, kam klikali.

A co třeba analýza vizuálních dat. To také s Big Daty zvládnete?

Analýzy vizuálních dat jsou zatím jednou z nejtěžších oblastí, které se realizují. Například zvuková data jsou pro analýzu mnohem jednodušší. Každopádně funguje to obdobně jako u těch webových log. Dělá se to přes strojové učení, kdy stroj porovná přes určité vzorce podobnost znaků a zařadí obrázek do určité kategorie. Nedokáže však rozpoznat konkrétní subjekt, nýbrž jeho vlastnosti. Například zná-li souhrn znaků, které nadefinujeme jako kočka, pak dokáže vlastnosti obrazů porovnat a označit podobající se. Oblastí, na které se dá zaměřit, je bezpočet a je potřeba si vybrat, kterým směrem se vydat.

Vstoupili jsme do nového roku, jaké trendy v Big Datech budou letos stěžejní?

Rok 2016 bude ve znamení toho, že klienti vůbec začnou používat samotné Big Data technologie. Tyto změny budou muset nastat jako první, aby se mohly rozvíjet vlastní projekty a zkrátila se i reakční doba. Firmy pravděpodobně zatím také nebudou chtít využívat data externích stran, ale začnou samy u sebe. V telekomunikacích se začne vytěžovat geolokace, v bankovnictví se budeme posouvat více k event driven marketingu. Mobilizují se více elektronické kanály, které podle mého názoru postupně sníží práci pobočkám, kde o sobě klient zanechává obrovské množství informací, ale pracovníci je nejsou v takové míře schopni zpracovávat. Zákazník už tak nebude muset nutně přijít na pobočku a i tak mu banka bude schopna nabídnout výhodný produkt na dálku.

Firmy čeká ještě hodně práce. Myslíte si, že to bude zpočátku chaos?

Bude to bohužel dost velký chaos. Navíc s technologiemi se mění také styl fungování. Doposud, když už se klient rozhodl pro nějakou technologii, nebylo možné ji poté zaměnit, protože investice byla příliš veliká. Nové technologie jsou ale tzv. open source a umožňují vybírat z více řešení. Nemyslím si ale, že ten zmatek ale bude trvat dlouho. Směr je totiž poměrně jasný, což je dobré.

Jak a kde v práci s Big Daty tedy vůbec začít?

Vždy klientům říkáme: „Vyberte si oblasti, které vás trápí, a my vám v krátkém čase zpracujeme byznys výstupy. Nemá význam začít technologiemi, pokud neznáte účel celé práce. Nechte si vytvořit několik návrhů, které vás v zásadě nic nestojí (výhoda open source) a rozhodněte se.“ To je cesta, kterou bych obecně doporučil každému, kdo chce Big Data ve svém podnikání začít řešit komplexně.

Jakub Augustín

Do Adastry nastoupil v roce 2011 ještě v rámci studií na univerzitě na pozici konzultanta v divizi banking. Má bohaté zkušenosti s datově orientovanými projekty pro významné hráče na poli bankovnictví. Jeho hlavním zaměřením jsou oblasti Data Warehousing, Master Data Management, Data Governance a datová migrace. Zhruba od roku 2013 postupně začal budovat novou Big Data kompetenci, jíž je v současnosti lídrem. Vedle své práce aktivně publikuje do odborných periodik a online médií a pravidelně také vystupuje v rámci workshopů s klienty.