.

Novinka

20. 11. 2017

Big Data nás obklopují

Délka čtení: 10 minut

Téměř nikdo z nás si neuvědomuje, jak velké množství dat o nás koluje po internetu. Mobilní operátoři, banky nebo e-shopy – ti všichni sledují naše chování a sbírají o nás data, mezi něž patří i celá řada velmi důležitých informací. Ty nám mohou slušně ulehčit život, tedy pokud se ví, jak s nimi dále nakládat.

Vezměme si příklad letecké společnosti, se kterou běžně lítáte na dovolenou či jazykové pobyty. Ta v případě, že si zakoupíte letenku do lokality, která je z určitého pohledu pro vás nestandardní, vás hned upozorní na některé důležité aspekty spjaté s cestou, o nichž možná ani nevíte. Ať už jsou to odlišné rozměry zavazadla, vízum, cizí měna anebo dřívější nástup k odletu.

Na podobném principu fungují například i analýzy nákupních košíků v e-shopech. „Sledování, které zboží, jak často a za jakých podmínek si lidé kupují, je klíčové pro oboustrannou spokojenost a budování zákaznické loajality,“ objasňuje Dagmar Bínová, Big Data Science Leader z Adastry, která se pokročilou analytikou zabývá už delší dobu. V letošním akademickém roce se navíc podílí na odborném cyklu přednášek spjatých s tímto tématem na Vysoké škole ekonomické v Praze.

Časopis Studenta s Dagmar Bínovou na téma práce s Big Daty připravil rozhovor.

Dášo, co vlastně znamenají Big Data? Jak byste je představila úplnému laikovi?

O Big Datech hovoříme jednoduše, pokud máme k dispozici hodně dat. Slovo „hodně“ je nicméně relativní, neboť se mění v čase. Je tudíž potřeba doplnit zároveň podmínku kontinuálního vzniku nových dat. Tato data zároveň nejsou typicky strukturovaná (tudíž není možné z nich okamžitě tvořit tabulky a grafy). Pro další využití je obvykle potřeba je specifickým způsobem transformovat. Vznikají interakcí člověka se strojem (například pokud si klient vybírá z bankomatu) nebo interakcí stroje se strojem (telefon se pravidelně přihlašuje k mobilní síti).

K čemu je možné tato data používat?

Big Data v dnešní době slouží například k monitoringu: Jejich vyhodnocováním lze zjistit, jak například na velkém prodejním portálu lidé nakupují a zda na webu vše funguje. Firmy je nenechávají zcela ležet ladem, jejich sbírání, ukládání a příprava ke zpracování je však obtížné. Klíčové je na nich také jejich propojení s jinými systémy, především těmi, které zajišťují komunikaci s klientem, jejich vytěžení tak může být velmi efektivní a pro společnost přínosné.

Můžete dát konkrétní příklad?

Jelikož Big Data netvoří jen klasická čísla, ale zároveň různé logy, transakce, signální data, senzorická data, texty, obrázky, hlasy či videa, je jejich využitelnost možná prakticky v jakémkoliv odvětví. Největší využití nacházejí typicky ve finanční sféře, zdravotnictví a v e-commerce. Nesmíme však zapomínat ani na průmysl, kde je díky automatizaci a robotizaci výroby celá řada dat sledujících především kvalitu výroby. Cenná Big Data mají také telekomunikační operátoři, neboť díky lokalizacím mobilních telefonů mohou identifikovat místa, kde je třeba netypicky velký shluk zákazníků – např. hudební festival – a mohou následně reagovat například dynamickou rekonfigurací sítě.

Nejedná se tak trochu o špehování zákazníka?

Jestliže firmy nakládají se svými daty obezřetně a dodržují zákonem stanovené rámce, pak to naopak může posloužit dobré věci a společnosti tak mohou zefektivnit celou řadu procesů a leckdy i lidem usnadnit život.

Co dalšího lze pomocí velkých dat zjistit?

Z velkých dat můžeme získat celou řadu popisů skutečných situací a událostí, jež v minulosti nastaly. Můžeme zjišťovat, co různé výkyvy a změny stavu způsobil a můžeme je také použít k predikci stavů, které v budoucnosti mohou nastat. Co je pro nás asi nejdůležitější – můžeme je zároveň využít také k inteligentnímu doporučování. To už se v současnosti děje, například používáte-li navigaci Google, tak ta vám s ohledem na okamžitou změnu situace na vaší plánované trase téměř instantně doporučí jinou cestu. Obdobně to takto může fungovat i s kteroukoliv další chytrou věcí – lednicí, domem či autem. Propojení Big Dat a IoT (internet věcí) je tedy velmi těsné.

Co konkrétně děláte v tomto směru v Adastře?

Naší doménou je Business Intelligence (BI) a cenným na našem řešení je přirozený a postupný vývoj. V ideálním případě si tak obě strany mohou v menším měřítku vyzkoušet, že vše funguje tak, jak má. To znamená, že si zákazník stíhá zaškolit a připravit svůj tým obsluhy pro nové technologie, a umí je také využít pro business. Preferujeme tedy dodávat nejprve laboratorní řešení, vyzkoušet na něm reálné využití Big Dat pro nějakou specifickou oblast a následně teprve přecházíme k velkému systematickému zavádění a integraci s ostatními systémy. Právě tím, že naše zkušenosti s Big Daty jsou bohaté, tak se pohybujeme v našem regionu na špičce.

Najdou u vás uplatnění i mladí lidé?

Samozřejmě. Na naší zkušenosti se studenty a mladými absolventy je pozitivní především to, že mají chuť se učit, chtějí studovat a podílet se na inovativních postupech. Nebojí se zkusit nové, nejsou zatíženi zkušenostmi tradičního řešení. Na druhou stranu nám někdy u těchto lidí chybí zkušenosti z tradičních BI projektů – ukazuje se to především u úloh integrace Big Dat s dalšími systémy. Proto musíme naše týmy vyvažovat a skládat z různě zkušených pracovníků.

Od října 2017 jste zahájili sérii přednášek o problematice Big Data (DS&BI Academy) na VŠE. Proč?

Důvodů pro to máme několik. V prvé řadě nám záleží na tom, abychom dodávali zákazníkům řešení, čili aby technologie pomohla byznysu. Potřebujeme tudíž do týmu lidi, kteří mají určitý přesah od technologií k potřebám zákazníka, anebo lidi, kteří umí pojmenovat technické požadavky tak, aby jejich společnost fungovala efektivně. Toto prolínání obou světů je poměrně důležité pro úspěšné realizace projektů v BI, a tedy potřebujeme edukované kolegy nejen na naší straně, ale i na té druhé – u zákazníka. Ukazuje se, že aktuálně je takových lidí všeobecně nedostatek, a tak nutné udělat něco pro to, aby ze škol vycházeli absolventi s aktuálně potřebným vzděláním. Profil absolventa Vysoké školy ekonomické je svým Adastře velmi blízký, a tak padla volba právě na tuto instituci.

Tento program je výběrový, podle čeho studenty vybíráte?

Studenti museli absolvovat vstupní písemný test, splnit podmínku absolvování několika předmětů (Databáze, Analýza a návrh informačních systémů, Business Intelligence nebo Základy BI) a následně projít výběrovým řízením. Celý přijímací proces byl zajištěn skrze KIT FIS VŠE. Pro nás je důležité, aby studenti byli schopni pracovat v týmu a dodat projekt praktické realizace. Nejde tedy o to, že by všichni studenti museli mít identické znalosti a motivaci, ale měli by být jako tým schopni pokrýt jak technicky, tak byznysově orientované části projektu.

V čem je váš kurz odlišný od běžné univerzitní výuky?

Kurz je veden lektory s praxí a jeho velkou část věnujeme tomu, abychom se studenty sdíleli naše zkušenosti, postřehy a diskutovali o tom, jak se věci v realitě dělají, a také, aby měli možnosti si to na ilustrativním projektu vyzkoušet. Cílem je, aby se studenti co nejvíce přiblížili reálnému prostředí praxe.

Na otázky odpovídala: Dagmar Bínová, Big Data Science Leader, Adastra

Dagmar Bínová

Big Data & Data Science Team Lead