.

Novinka

24. 04. 2022

Nikola Pleska (Microsoft) a Jiří Čermák (Blindspot Solutions): Computer vision často odhalí nedostatky, o kterých firmy nemají ani tušení

Délka čtení: 15 minut

Minimalizace opotřebení a poničení velkých průmyslových strojů, security problémy v obchodních centrech, samořízení aut, okamžité řešení zdravotních událostí na ulici… To všechno umí počítačové vidění (computer vision) v reálném čase, takže je schopno incidenty předvídat. A to firmám ušetří hodně peněz. „Computer vision navíc často odhalí i nedostatky, o kterých firmy neměly ani zdání,“ shoduje se Nikola Pleska, digitální transformátor v Microsoftu s Jiřím Čermákem, vedoucím AI projektů v Blindspot Solutions.

  • Jak funguje ve firmách spolupráce IT a byznysu?
  • Jak proces zavádění computer vision do firem co nejvíc zjednodušit?
  • Proč dodavatele služby zahrnout už do plánování a prvotních analýz? A kde na tom ušetřit?
  • Proč nedělat monolitické projetky end-to-end, ale rozdrobit je a prototypovat?

Poslechněte si podcast

Přečtěte si podcast jako rozhovor

Ivana Karhanová: Computer vision, česky počítačové vidění. Technologie, která nám pomáhá hlídat bezpečnost, dodržování pandemických opatření, kvalitu výroby nebo třeba řídit auta. Povídat si o něm budu s Jiřím Čermákem, vedoucím AI projektů z Blindspot Solutions. Dobrý den.

Jiří Čermák: Dobrý den.

Ivana Karhanová: A Nikolou Pleskou, digitálním transformátorem z Microsoftu. Dobrý den i vám.

Nikola Pleska: Krásný dobrý den.

Ivana Karhanová: Computer vision. Ten název zní hrozně hi-tech, přesto je tu s námi tato technologie už docela dlouho. Pojďme uvést pár příkladů, jak se computer vision používá, Nikolo.

Nikola Pleska: Ta aplikace může být velmi jednoduchá. Zkušení harcovníci si asi z minulosti pamatují softwarové vidění nebo čtení dokumentů, kterému jsme říkali OCR. To je v podstatě jedna z prvních aplikací počítačového vidění, kdy jsme začali číst z naskenovaných dokumentů písmenka. Začali jsme je skládat do strojem čitelné podoby a akceptovat jejich obsah. No, a postupem času se na to nabalovala další problematika, se stoupajícím výkonem, protože pro čtení a sledování reality optikou počítačů potřebuji mít značný výkon. O tom asi dokáže mluvit velmi dobře Jirka, jak jsme postupně nabírali na výkonu a dokázali jsme číst více věcí a lépe rozumět realitě. To znamená, že dnes jsme schopni vidět, co je na fotografii, co je tam za objekty. Můžeme se bavit i o video analytice a o tom, že při dobrém umístění senzorů jsme schopni třeba řídit auto, protože vidíme, co se kolem něj děje.

Ivana Karhanová: Jirko, řízení aut je možná hodně o pokročilém počítačovém vidění. Přesto, jaké jsou nejčastější use casy v dnešních dnech, co vlastně firmy využívají?

Jiří Čermák: Ve videu se obecně skrývá strašné množství informací a každé obchodní centrum má vlastní desítky kamer. I výrobní linky mají desítky kamer, které permanentně snímají prostor. V současné situaci jsou videa vlastně využívaná hodně reaktivně. Něco se stane a člověk se podívá na video, aby například zdokumentoval loupež.

Ivana Karhanová: To znamená, že jdeme do historie.

Jiří Čermák: Přesně tak. Nicméně to, co umožňuje vidění, je snímat a analyzovat záběry prakticky kontinuálně a reagovat na události okamžitě, nebo je dokonce předvídat. A jak říkal Nikola, v současné době probíhá obrovský vývoj jak kvality modelů, které slouží pro analýzu a detekci objektů a různých situací, jak ve videu, tak v hardwaru. Takže vývoj modelů je specifický v oblasti hlubokého učení, kde se nejčastěji právě na analýzu videa používají hluboké neuronové sítě, a ruku v ruce s tím jde vývoj konkrétního hardwaru grafických karet a specifických čipů, které pak už dokážou velmi levně umožnit analýzu videa a opravdu v reálném čase na malém počítači nebo na malém dedikované čipu přímo u kamery. A dokážu pak dávat informaci, která je obsažená ve videu lidem, kteří na základě toho vlastně můžou dělat rozhodnutí. Takže může to být buď nastavení údržby stroje, nebo nebo security problém v obchodním centru, zdravotní událost někde na ulici a tak dále.

Ivana Karhanová: Pojďme probrat jednotlivé use casy podrobně, aby si i posluchači představili, co vlastně se s tou technologií dá dělat. Vy třeba nasazujeme do obchodů nebo do obchodních center a do veřejných prostor detekci roušek. Jak toto funguje?

Jiří Čermák: Detekce spočívá v tom, že typicky na schodech do uzavřených oblastí, kde se mají vynucovat omezení, způsobená covidem, automaticky detekujeme lidskou postavu, oblast, kde má být tvář, a analyzujeme automaticky, jestli kritické body té tváře jsou zakryté, což znamená, že nos ústa jsou zakrytá něčím, co má dostatečný ochranný faktor. Takže dokážeme detekovat nejenom to, že člověk je zakrytý, jestli zakrytý dobře a jestli zakrytý správnou pomůckou. A to vše probíhá v reálném čase. Ve chvíli, kdy je detekovaný člověk, který to zakrytí nemá dostatečné, můžeme upozornit security notifikací, a ti ho pak dokážou upozornit a napravit tu situaci.

Nikola Pleska: Díky aplikovatelné síti to znamená, že vznikají modely, které jsou poměrně snadno uchopitelné. Tak jsme schopni detekovat od roušek až po detekci vzdálenosti mezi lidmi. Na to jsou vytrénované modely, které si dneska může stáhnout de facto kdokoliv. A tak se víceméně demokratizuje přístup k něčemu, co dřív bylo jenom pro velký firmy a stálo to bambiliony peněz na vývoji. Dneska si dokážete stáhnout natrénovaný model strojového učení pro rozpoznání, případně pro odhad vzdálenosti mezi osobami, a jednoduše je krásně využíváte ve svých koncových aplikacích.

Ivana Karhanová: Vy jste zmínil rozestupy mezi lidmi, nicméně v bezpečnosti se používá v podstatě počítačové vidění pro porušování zón.

Jiří Čermák: Ano, ale třeba verifikaci toho, že člověk, který tu zónu porušil, má k tomu oprávnění - sken tváře, sken čočky v oku a tak dále. Takže jde nejenom o upozornění, že tam někdo vstoupil, ale i o verifikaci toho, jestli to byl oprávněný vstup, nebo ne.

Ivana Karhanová: Doteď jsme se bavili o analýze lidského chování, o tom, jestli jsou lidé zakrytí, jestli porušují ochranné zóny. Počítačové vidění se ale používá i ve výrobě. Jak tam funguje?

Nikola Pleska: Může být na různých místech. Můžeme se třeba bavit o tom, že mám speciální kameru, která mi sleduje proces výroby nějakého výrobku, a na výrobku sleduji nějakou anomálii. Jako typický příklad může sloužit výroba kachliček, a když je sleduji kamerou přesně na daných místech, tak dokážu sledovat možná daleko lépe než lidské oko to, že tam je mikroprasklina, která by mohla být potom důvodem k potenciální reklamaci. A zastavím výrobu v pravý čas, ještě dřív, než nastanou dalekosáhlé problémy. Případně se dá ve výrobě kombinovat vidění z hlediska bezpečnosti, to znamená nepřistupuje mi k lince nikdo, kdo nemá patřičné pověření pro to, aby s tou linkou operoval. Možná tady je krátká nápověda podívat se na video, které jsme dělali pro konferenci Microsoft Build už v roce 2019, kde byla krásná ukázka toho, jakým způsobem detekujeme sbíječku ve výrobní hale. A k té sbíječce se přiblíží nějaký Jirka, který nemá patřičné pověření, a ta sbíječka se zkrátka nepustí. To znamená, že jakmile na ni člověk sáhne, tak se zastaví proud a nevzniká bezpečnostní problém. Je to kombinace veškerého vidění, kdy kombinuji samotnou výrobu, případně její okolí, abych zamezil nějakým neduhům, které při výrobě nebo procesech mohou vzniknout.

Ivana Karhanová: Jirko, vy jste zmínil poškození strojů. To funguje jak?

Jiří Čermák: Je to součást predictiv maintenance. Typicky na těžko dostupných částech obrovských strojů, kde dochází k častému opotřebení kvůli zátěži, můžeme kontinuálně monitorovat, jak tam dochází k opotřebení. A místo toho, aby se stalo to, že stroj se skutečně spotřebuje do té míry, že dojde k poškození a zastavení celé výroby a s tím spojeným obrovským výpadkům peněz, tak dokážeme varovat, že k poškození dochází, včas a vyřešit ho v naplánovaných odstávkách toho stroje. Znamená to, že údržbář, který má expertízu, dostává od těchto přístupů varování, že na konkrétních částech stroje dochází k opotřebení. Může finální inspekci udělat sám a naplánovat například údržbu do dalšího odstávkového okna a naprosto eliminovat výpadky, které by jinak vznikly.

Nikola Pleska: Anebo snížím výkon té mašiny prostě tak, abych zachoval kontinuitu provozu i za cenu, že tam je třeba nějaká chyba. Ale stroj, pakliže má menší zátěž, mi vydrží o něco déle a třeba až do další plánované odstávky. To znamená, že je to zase kombinace jakéhosi lidského rozhodnutí, anebo automatického rozhodnutí, což je to, kam asi míříme - necháváme stroje, které vidí, rozhodovat o tom, co se má stát a jak se to má stát a proč se to má stát. To je vize, kterou máme, abychom eliminovali typické lidské chyby, protože člověk se v tomto rozhoduje docela zle, možná podle něčeho, čemu říkáme selský rozum.  Většinou je to špatně, a to, co nechceme, aby v těchto případech nastávalo.

Ivana Karhanová: Co k tomu potřebuju v praxi, abych dokázala, dejme tomu, mikropraskliny na lodičkách nebo opotřebení strojů snímat a samozřejmě potom i vyhodnocovat?

Jiří Čermák: Samozřejmě, pokud chci snímat nějaký fenomén, musím mít dostatečně detailní záběr, abych na tom ten fenomén byl schopný rozpoznat.

Ivana Karhanová: Tím fenoménem myslíte tu prasklinu.

Jiří Čermák: Například. Dobré pravidlo je, že pokud ta prasklina je tak drobná, že není možné ji zaznamenat v záběru lidským okem, tak je velmi těžké pro algoritmus ten defekt nějakým způsobem rozpoznat. Potřebuji tedy mít dostatečně kvalitní snímání produktu, který například může být prasklý, a dostatečné množství příkladů toho, jak různé praskliny můžou vypadat. V průběhu projektu typicky probíhá analýza, na které dokážeme validovat, že je něco takového možné detekovat. Nejjednodušším způsobem, jak tohle udělat, je dostat mnoho příkladů, jak ty defekty můžou vypadat, a udělat nejdřív studii proveditelnosti, na které zákazníkovi budeme demonstrovat dosažitelnou přesnost detekce a to, co vlastně může od toho systému očekávat.

Ivana Karhanová: Možná jsme začali docela složitým příkladem. A když se bavíme například o hlídání roušek nebo rozestupu, tak tam si vystačíme s běžnými kamerami, které jsou v těch provozech nasazené.

Jiří Čermák: Ano, tam typicky v současnosti všichni mají osazená  obchodní centra a různé obchody normálními a hyper kamerami. A tam skutečně není žádný požadavek na to, aby ta kamera měla specifické vlastnosti. Standardní kamera stačí. Do infrastruktury, do sítě, kde ta kamera je připojená, se umístí stroj, který zpracovává to video. A to je vlastně celé.

Ivana Karhanová: Takže potom ty samotné výpočty nebo algoritmy probíhají v cloudu, protože to umožňuje čím dál více rostoucí výkon?

Nikola Pleska: Já myslím, že díky cloudu jsme dostali výkon a začali jsme si ty věci zkoušet, trénovat modely a opravdu rozpoznávat svět kolem nás. Ale je naprosto nepředstavitelné, že by například samořiditelná Tesla posílala věci do cloudu proto, abych se spoléhal na to, že někde je infrastruktura, která mi zamezí průtoku dat a najednou kvůli tomu nabourá. Dnes se blížíme k tomu, že modely využíváme na takzvaném computingu. To znamená, že se naučím tu věc v cloudu, ale pak jakousi kontejnerizací dostávám tu chytristiku na koncové zařízení, kde pak probíhá realizace strojového vidění, tedy to, že tomu to koncové  zařízení rozumí, a pak třeba pošle jenom data z toho zase zpátky do cloudu, kde se data využijí k nějakému dalšímu účelu. Ale je obrovský trend tyto věci řešit spíš on-prem, ale za pomoci cloudu pro učení a pro vyzkoušení si těch věcí. Možná bych zbytečně pálil prostředky na to, že budu vyvíjet specifickou krabičku pro něco, co pak by nenašlo uplatnění.

Ivana Karhanová: To znamená, že zde, edge computing můžeme představit jako chobotnici, která v podstatě sahá až k jednotlivým zařízením, a vyhodnocování stavu probíhá u těch zařízení.

Nikola Pleska: Úplně jednoduše si to představte jako chytřejší kameru, která dokáže zaznamenat obraz a rovnou ho v kameře zpracovat. A abych si byl jistý, že model strojového učení, který jsem zatím vždycky dokázal aktualizovat podle svých potřeb, tak tam právě potřebuji schopnost dostat tam tu chytristiku z cloudu. To znamená, že jde o programovatelnou kameru. Dalo by se to říct takovýmhle způsobem.

Ivana Karhanová: Vy jste zmínil i demokratizaci technologií. V podstatě si pod tím můžeme představit něco, že tak, jak jsme schopni z AppStoru nebo Storu na Googlu dokupovat aplikace, tak v podstatě totéž mají firmy možnost aplikovat v enterprise prostředí - zjednodušeně řečeno.

Nikola Pleska: Je to tak. V podstatě my jako Microsoft, jako dodavatel základních technologií toho základního výkonu máme k dispozici několik základních modelů, které můžete začít používat hned. A dneska si můžu představit jednoduché čtení dokumentu v papírové podobě za pomoci nějaké powerappky, a pak se řeší schvalovací proces, který je vázaný na data, která jsem dostal z toho dokumentu. Nebo máme modely pro rozpoznávání demografie obličejů, detekci roušek, nebo odhadování vzdálenosti. A tímhle způsobem část těch věcí vyvíjíme. No, ale pakliže to neexistuje a je to specifikum, tak pak přichází partneři typu Blindspot Solutions, kteří říkají: hele, tady ten model pro detekci anomálií na kachličkách zkrátka nemáme. No, tak si musíme vyhrnout rukávy a udělat to zvlášť. Ale v zásadě platí, že se neuvěřitelně prolevňuje celý přístup k těm technologiím. A dnes tou technologií dokážou vládnout firmy, které by na to v životě neměly prostředky. Dneska si to koupí za pár šupů, anebo případně doplatí znalosti datových firem, které jim to rozpohybují. Ale je to poměrně laciná záležitost.

Ivana Karhanová: Jirko, když se bavíme o vývoji v podstatě na míru, kdy něco vyhodnocujeme, kolik na to firmy potřebují času a peněz třeba ve srovnání právě s tím, když využijeme už hotové řešení?

Jiří Čermák: I v rámci využití hotového řešení je cenová relace poměrně rozsáhlá, takže se můžeme bavit o něčem, co už je skutečně úplně hotový produkt. Například prostě statistiky na schodech obchodních center. To už jsou hotové kamery, které tam dáte a propojíte je spolu, a ony vám počítají statistiky vstupů, východů a tak dále. A ta řešení se pohybují ve stovkách eur za jednu kameru. Druhý extrém jsou samozřejmě věci, které jsou úplně na míru, protože jsou tak specifické, že je nikdo neřešil. Pak je třeba sesbírat data, vyvinout ten model a tak dále. Tam ty ceny můžou jít do statisíců eur. Samozřejmě typicky se pohybujeme někde ve střední cestě, protože nedá se úplně paušálně dát cenovka každé úloze. Ta úloha má svojí složitost a až složitost té vlastní úlohy definuje, cenu, definuje, kolik dat je potřeba sebrat, jak náročné je ten model natrénovat i to, jakou přesnost ten model může mít. Takže tady bych asi doporučil už v rámci analýzy toho, že přemýšlím o tom, že bych chtěl nějaký proces automatizovat a zefektivnit, oslovit nějakou z těch firem už do té analýzy, aby poskytla expertizu a třeba i pomohla tu myšlenku specifikovat tak, že se nedostaneme do ničeho extrémně složitého, ale je tam možná jednodušší přístup, cenově dostupnější a efektivnější. Ta firma s tím má zkušenosti a dokáže v tomhle rozhodně pomoct.

Ivana Karhanová: Nikolo, co je největší přidanou hodnotou computer vision z pohledu třeba zákazníků firmy - lepší kvalita, nebo vyšší spolehlivost?

Nikola Pleska: Řekl bych, že to je asi  business continuity. To znamená, že v různých částech různých industry můžou nastat různé destrukce v procesech. A já se snažím najít funkční model, abych co nejvíc tady těch distribucí eliminoval a dokázal fungovat relativně bez výpadků. Na druhou stranu třeba v retailu přidaná hodnota může být v lepší zákaznické zkušenosti. Zkrátka prostě pro toho zákazníka vystavím zákaznickou cestu tak, aby prostě byla famózní, a využiju k tomu tu technologii. To znamená, že za mnou nechodí žádný hlídač, který by mně říkal: vezmi si roušku. Je to prostě podané takovou formou, která je pro jednadvacáté století. To znamená, že zákazníka nijak neobtěžuji vládním nařízením. A to jsme jenom v části, kdy je to pro  zákazníka opruz. Velmi pravděpodobně bychom našli spousty dalších případů, kdy opravdu díky tomu stavím  jedinečnou zákaznickou zkušenost, ať je to třeba sledování doplněnosti regálů, protože to je určitě nedostatek. To zase dokážu využít vision, protože zjišťuji, jestli tam ten produkt je vystavený, nebo není. Zjišťuji, jestli tam je shoda mezi cenovkou a výrobkem, který je tam vystavený. Zase prostě dávám dva vstupy dohromady.

Ivana Karhanová: To znamená, že dejme tomu řetězec prodá víc a zákazník nepřijde k prázdnému regálu, kde hledá zboží, které tam prostě má být a není?

Nikola Pleska: Nebo si třeba nekoupí zboží po expiraci. Při lustrování regálů projíždím kamerou a zjišťuji, jestli náhodou štítek neříká: hele, tady to se blíží expiraci. Pokud ano, tak to radši z regálu vytáhnu, což samozřejmě v momentě, kdybych to tam náhodou zapomněl, tak si zadělávám na možný průšvih. Takhle to automaticky řeším a většinou ten průšvih nevzniká.

Ivana Karhanová: My jsme se doteď bavili o detekci událostí, kde následně rozhoduje člověk. A co nás tedy čeká dál? Plná automatizace procesů, kdy v podstatě eliminujeme lidská rozhodnutí?

Jiří Čermák: Je potřeba pamatovat, že se pořád bavíme o strojovém učení. A nepsané pravidlo je, že vždycky budou corner casy, které je extrémně těžké vyřešit. Podívejte se na samořiditelná auta. To je věc, o které se mluví už roky a pořád to nikdo nedotáhl ke schválení do plného provozu. Se současným stavem poznání vždycky budou situace, kde ten algoritmus nedokáže rozhodnout perfektně. Takže za mě je odpověď, že vždycky by měl fungovat lidský faktor, nějaký expert, který dokáže tyhle situace rozhodnout. Cesta by měla být spíš v tom, že 90, možná 99 procent situací vyřeší stroj v jasných situacích, a expertní znalost člověka se využívá jenom na opravdu těžké, nějakým způsobem kritické situace. Tím, že mu uvolníte ruce, dokáže obsluhovat možná stonásobek událostí - těch, kde je skutečně potřeba.

Nikola Pleska: No, asi míříme k tomu, že ty stroje budou autonomní při vysoce repetitivních činnostech. Tam, kde se něco opakuje, ten stroj velmi dobře naučím rozpoznávat anomálii, nebo dělat repetici toho procesu, ale v momentě, kdy chci nějakou odbornost, tak to od toho stroje rozhodnutí úplně čekat nemůžu. A pak je tam samozřejmě ještě oblast etického využívání strojového učení, nebo neřkuli umělé inteligence. To je další rozměr, který to s sebou nese, protože firmy by se k tomu měly stavět asi trošku odpovědněji, viz různé modely strojového učení pro rozpoznávání obličejů. Tam je velmi tenká hranice, kdy se to dá zneužít, kdy můžete začít lidi nepříjemně sledovat a můžete z toho vyhodnocovat, třeba že se pohybujete tam a tam, když si tu story dáte dohromady. A je velmi důležité, aby firmy, které poskytují takovou technologii, se k ní stavěli odpovědným způsobem.

Ivana Karhanová: Kdy bývá nejčastější aha moment, kdy se management firem rozhodne, že podobnou technologii poptá, vyzkouší - kdy u nich nastane ten posun?

Nikola Pleska: Doufám, že to je poslech tohoto podcastu.

Ivana Karhanová: Jasně, a v praxi? To, co zatím máte za sebou?

Jiří Čermák: Typicky je to dlouhodobé pozorování nějaké neefektivity, která tam vzniká. Lidé vědí, že tam je, například nemají dalšího experta, díky němuž by mohli zvýšit produkci, a doslechli se o tom, že konkurence používá vision, nebo si přečetli nějaký článek o tom, že umožňuje zefektivnit procesy. Tak to je typicky situace, kdy začnou prozkoumávat trh - co je možné, co není možné - a začnou se seznamovat s produkty, které jsou k dispozici.

Ivana Karhanová: Když vás pak reálně poptají, neleknou se toho, když jim pak představíte, co všechno to obnáší v praxi?

Jiří Čermák: Někdo se lekne, někdo ne, ale ty, co to samozřejmě pálí zásadně, ti jsou ochotní s námi pracovat a zanalyzovat si tu situaci. My jim rádi vysvětlíme limity, které ty přístupy mají, co je možné dosáhnout, co by to pro ně znamenalo. A právě se snažíme ten projekt fázovat tak, že s nimi uděláme analýzu, kde jim všechno vysvětlíme. Uděláme s nimi hypotézu, jakých úspor by mohli dosáhnout, pak studii proveditelnosti, kde jim na malých příkladech levně provedeme evaluaci, jestli ta hypotéza je splnitelná. A až pak doporučujeme produktizaci, takže jít přístupem: chci zefektivnit celou svoji továrnu tím, že nasadím kamery a poptávám end-to-end řešení. A firma řekne: naceňte mi to. Tím se ale většinou nedosáhne dobrého cíle, k výsledkům se typicky dostáváme mnohem lépe rozdrobením a postupnou prací s firmou, která může dodávat to řešení.

Ivana Karhanová: Jaké jsou pak požadavky, které kladete na firmy?

Jiří Čermák: Co musí splnit, je velmi intenzivní spolupráce s námi. Musí nám na začátku vysvětlit ten proces prakticky dokonale. Tam se často setkáváme s tím, že neexistuje žádný jeden mozek, který celému procesu rozumí. Takže v této fázi často s tím klientem pracujeme na tom, abychom vůbec sepsali specifika a pravidla procesu, který se snažíme nějakým způsobem optimalizovat, což už samo o sobě má typicky velkou přidanou hodnotu pro obě dvě strany. Pak nastává samozřejmě sběr dat, zpětná vazba na výstupy toho procesu. Musí to být velmi intenzivní a úzká spolupráce, kdy se bavíme vlastně skoro každý den o kvalitě dosažitelného řešení, o plánech, co máme. To jsou hlavní předpoklady, aby ten projekt vůbec měl šanci uspět.

Ivana Karhanová: Nikolo, umí si manažeři vůbec představit, co všechno mohou od computer vision chtít?

Nikola Pleska: Zlepšuje se to, ale neřekl bych, že máme vyhráno. Ještě nás čeká spousta evangelizační práce. Je potřeba prostě zejména lidem z byznysu vysvětlovat těžkou problematiku IT, aby začali chápat, kde pro ně ta technologie má nějaké dopady a kdy má pro ně nějaké přínosy. Oni na to nejsou zvyklí, jsou zvyklí prostě koukat optikou toho svého procesu, za který jsou zodpovědní. My se snažíme extrémně tyto mantinely bourat.  Jsme schopni pomáhat i se začátky projektů, jako zaplatit část vstupních investic, které jsou nutné pro to, aby se ta technologie nahodila, trochu se nám okotila a pak se rozjela ve velkém.

Ivana Karhanová: Když už se firma rozhodne, že computer vision aplikuje, tak předpokládám, že výsledky z toho by měla promítnout do dalších procesů, že to ovlivní nejenom jeden konkrétní proces, jeden konkrétní výrobní krok, ale v podstatě celou řadu věcí v té firmě.

Jiří Čermák: Je to tak, vlastně jim otevře cestu k tomu, mít nějaká data-driven rozhodnutí. Například v obchodním centru můžou být na statistikách návštěvnosti být založené slevové akce, změny layoutu, designy nájmů různých prostor podle toho, jak často tam lidé chodí a tak dále. A pak už je to hodně na klientovi. My mu rádi pomůžeme s tímhle vším, ale měl by být schopný ty actionables z těch dat získat. Není to vždycky triviální, ale je potřeba samozřejmě skončit na tom, že mám statistiky, jak mně navštěvují lidi obchod ve dnech, a začít tato data dál vytěžuje.

Ivana Karhanová: Jaká je vůbec ochota manažerů a lidí se stát data-driven firmou?

Nikola Pleska: Většinou, když se jedná o ten daný proces toho daného člověka, tak ta ochota je poměrně velká. Ochota bavit se multidepartment způsobem -  protože v zásadě potřebuju, aby to všechno na sebe navazovalo - je ale dost často nízká, a to je problém. Dost často se setkáváme třeba s nápadem, který přijde z oddělení marketingu. My bychom chtěli zlepšovat zákaznickou zkušenost a chceme tam ty a ty prvky. No, a narazíme na druhý department, který se jmenuje třeba Security, který říká: „No, ale to nejde, to prostě neumíme, nechceme, to nám k ničemu nepomůže. Já mám svoje vlastní KPI (klíčové ukazatele výkonnosti), a když nám to naše KPI neplní, tak nezájem.“ Pak bychom se mohli bavit o dalších divizích, na které to vlastně nepropadá. Právě optika pouze jedním směrem pak dost často projekty brzdí. A je to neschopnost spolupráce jednotlivých manažerů se domluvit na obecném zájmu.

Ivana Karhanová: Myslíte, že je to jejich nezkušeností, nebo třeba jejich egem?

Nikola Pleska: Může to být oboje. Asi to právě pramení z toho, že kdybych býval té problematice rozuměl, tak ego mi dovolí projekt spustit, a ono mi to možná nedovolí právě z toho důvodu, že šlapu do neznáma a nevím, co od toho mám čekat.

Ivana Karhanová: To jsme omezení lidským faktorem. Přesto, vnímáte nějaká omezení na straně technologií? Abychom se v computer vision posunuli dál, aby reálná aplikace v byznysu byla větší?

Nikola Pleska: Já nevnímám, že bychom trpěli nedostatkem technologického zázemí. Naopak, my překypujeme. My máme k dispozici věci, o kterých se nám v životě nesnilo. Teď jenom my, kteří tu technologii vyvíjíme, stojíme s nataženou rukou a říkáme: berte, ale to braní je do značné míry pomalé, když to srovnáme s jinými částmi světa. Když srovnám, jakým způsobem probíhá osvojení si těchto technologií v České republice a v technologicky rozvinutějším světě, tak je to jako nebe a dudy. Tady v naší kotlině jdou ty věci zkrátka pomalu a jsou těžkopádné. Když se u nás něco povede, tak je za tím člověk, který má silnou vizi a opravdu tlak a výtlak na to, ty věci prosadit. A pak je to famózní. Ale dost často takoví lidé ve firmách schází. Běžný střední management si myslí, že nepotřebuje vlastně nic změnit, je spokojený s tím, jak firma funguje. Je to dané samozřejmě ekonomickou situací, konjunkturou obecně, která tady byla, tím, že je na trhu nedostatek lidí, kteří by je mohli nahradit, a tím pádem je tam určitá pohodlnost. Jsme prostě tady v tom svém zakyslém rybníčku a točíme se v kruhu.

Ivana Karhanová: Není to třeba obava i z toho, že je ty algoritmy nahradí?

Nikola Pleska: Může být, ale ve výsledku zkušenost ukazuje, že se to stejně stane. To znamená, že buď z toho vytěžím, naučím se to, akceptuji to a vezmu si z toho to dobré, anebo proti tomu budu bojovat a budu převálcovaný.

Jiří Čermák: A převálcuje mě konkurence, která to používá. Chtěl bych doplnit další specifika těchto projektů. Jedno je ve výrobě, kde vím, kolik mě třeba stojí ročně zmetkovitost, když to nejsem schopný adresovat. V retailu je specifikum, že se projektu těžko přiřazuje návratnost, protože na to jsou vázané actionables a zákazníci jednoduše pak nedokážou oevaluovat return of investment, a tím pádem firmy váhají s těmito projekty. Často jim pak ujede vlak od konkurence, která neváhá a zkusí to s tím, že je to někdy krok do neznáma.

Ivana Karhanová: Když jsem dejme tomu manažer, který má potřebu více využívat data, zapojit třeba právě computer vision, na co mám vlastně svoji firmu připravit?

Jiří Čermák: Jak jsem říkal, bude potřeba intenzivní spolupráce s dodavatelem, který to bude řešit. Opravdu bude potřeba rozkrývat procesy, které se tam dějí, otevírat Pandořiny skříňky, hledat neefektivity v jejich procesu.

Ivana Karhanová: Takže se mám smířit s tím, že najdu neefektivity ještě na spoustě jiných míst, než si myslím, že jsou?

Jiří Čermák: Přesně tak. Není to spojené s computer vision, tohle s sebou obecně přináší optimalizace procesů. Lidé by měli dát stranou svoje ego a odstranit argument „ale takto se to dělá posledních 40 let“ a prostě umět do procesů rýpat sami, protože právě oni mají samozřejmě obrovskou znalost, kterou my potřebujeme předat, abychom jim mohli pomoct.

Ivana Karhanová: To znamená, že se mám připravit na možnou změnu rozhodovacích procesů? Mám se připravit na to, že mi data odkryjí možná další nepříjemné věci, které jsem třeba doteď chtěl přehlížet? Ale jak je to například s napojováním na stávající systémy?

Jiří Čermák: Tam samozřejmě do toho vchází požadavky security departmentu toho daného zákazníka. My se typicky snažíme využívat existující kamerové systémy, protože to sráží cenu celého řešení, ale často z nějakých důvodů -  například v banking sektoru - nechtějí umožnit externím dodavatelům mít přístup ke kamerám. Pak to samozřejmě znamená, že se musí nainstalovat nová infrastruktura a dochází k zásahům v těch lokacích. Jak velkým, záleží na konkrétnímu use casu. Může se jednat o monitorování vchodů - to je drobnost, u všech prostor jde samozřejmě o víc. Takže je dobré zamyslet se hned na začátku, jestli je možnost využít současnou infrastrukturu pro ten projekt, a interně si to zjistit, protože to je jedna z prvních otázek, která padne při řešení toho projektu.

Nikola Pleska: Napojení na další systémy z nějaké business platformy, kterou mám, je pak poměrně snadné. Dost často používám příměr k centrálnímu mozku firmy, což znamená, že když mám data po kupě, ideálně v cloudu, abych nad tím mohl dělat celkovou analytiku, tak mám z poloviny vyhráno, protože pak začnu ty patterny skládat a začnou se mi odhalovat právě ty nedostatky, případně i dobré věci. Najednou můžu vidět, že tímhle způsobem bychom to měli dělat. No, a potřebuju mít na to data na jednom talíři, abych je dokázal rozkrájet rozpracovat a pak si je vychutnat v rámci analytické večeře.

Ivana Karhanová: Jak například ve firmách funguje spolupráce právě byznysu s IT týmem, který je k tomu všemu potřeba?

Nikola Pleska: To je  pro nás otázka hodně na tělo. Samozřejmě bychom byli rádi, kdyby ta spolupráce byla intenzivnější a já se odkážu na mojí předchozí odpověď: lepší se to. Se vzdělanými lidmi, kteří už mají co do činění s technologií, je o něco lepší spolupráce. Ale dost často pořád bývá situace, že projekt řeší IT a nebaví se s byznysem a naopak, že projekt řeší byznys a IT mu do toho nezasahuje. Dneska je to možné. S demokratizací si jako lidi z byznysu můžete koupit službu relativně bez vědomí IT a začít ji najednou konzumovat, což samozřejmě přináší určitá bezpečnostní rizika, protože najednou se vám ve fabrice nebo ve vaší organizaci objeví něco, čemu říkáme šedá IT, a nemáte to pod kontrolou. To znamená, že tady je spíš potřeba dát důraz na lidi z IT, aby začali plnit svoji úlohu, protože oni jsou interním dodavatelem a mají své interní zákazníky. Ty interní zákazníci by měli přinášet zadání, a když to budu hodně abstrahovat, tak vlastně to budoucí IT by nemělo řešit nic jiného než data governance. To znamená kdo se dostane do jakých dat, proč a jak a jakým způsobem mu zprostředkují přístup k těm datům. Může to být člověk, nebo systém. To je jedno, ale v zásadě potřebuji začít orchestrovat, kde ta data mám a kdo se do nich dostane, aby z toho vznikla přidaná hodnota. To je budoucí IT, protože všechno ostatní si dokážu koupit, outsourcovat, všechno ostatní si třeba byznys udělá sám. A teď mluvím třeba o byznys aplikační platformě low-code/no-code přístupech, jako jsou u nás třeba power appky. To znamená, že dneska si člověk z byznysu udělá vlastní business proces a hledá pro něj IT podporu. Napojí na to kus modelu, tedy computer vision, který je někde připravený v nějakém katalogu a má krásnou aplikaci, která mu jeho proces, jeho činnost pozdvihne na daleko vyšší úroveň.

Ivana Karhanová: To jste popsal moc hezky, ale jaká je, Jirko realita?

Jiří Čermák: Jak říkal Nikola, lepší se to. Ale samozřejmě často narážíme na to, že něco prosazuje IT a nemá podporu byznysu. A naopak, že byznys má konkrétní use case, který chce řešit a nemá podporu IT, ať už protože to oddělení je přetížené, nebo nechce zavádět novou technologii do jejich portfolia a tak dále. Samozřejmě to vždy komplikuje dodání toho projektu, ať už kvůli časově náročnosti, nebo i tím, že se to prostě nepovede. Dokud nejsou tyhle dvě strany sehrané a nekopou za jeden tým, tak to je vždycky komplikace.

Ivana Karhanová: Když bychom to tedy shrnuli na závěr a oba dva byste měli dát jednu radu firmám, které chtějí pokročit s digitalizací a třeba být data-driven firmami, co by to bylo?

Jiří Čermák: Podle mě určitě už na začátku přivést do diskuse někoho, kdo by jim s tím mohl pomoct, což znamená firmu, která s tím má zkušenost, ať už od konkurence, z jiných projektů a tak dále. A může jim opravdu pomoct vyspecifikovat problém tak, že je mnohem řešitelnější, mnohem levnější a má mnohem větší přínos, protože s tím už prostě má zkušenosti. Tohle dělat na zelené louce bez expertizy je vždycky hrozně riskantní, protože člověk může vyspecifikovat prakticky nerealizovatelný projekt.

Nikola Pleska: Já bych k tomu dodal: hlavně začněte s projektem. Dnes je obrovsky levné něco zahodit, což znamená, že když půjdete cestou, o které mluvil Jirka, to znamená neutratím na tom bambiliony, tak si můžu dovolit prostě mít ten fail. Můžu prostě ztroskotat. Vedle toho ale mám ve své krabičce nápadů dalších pět, které se můžou chytit a můžou být naprosto famózní. S tímto principem do toho jít znamená rychle vyzkoušet, jestli to funguje, případně rychle zahodím nebo rychle rozvíjím dál a generuji nápady jak na běžícím páse.

Jiří Čermák: Tady ještě doplním, že to je přesně to, co jsem zmínil v rozpadu projektu: nedělat monolitické end-to-end projekty, od nápadu až k realizaci je vysoutěžit, ale rozdělit je na analýzu, studii proveditelnosti a teprve potom, co mám jistotu, že do toho má cenu investovat velké peníze, to rozjíždět.

Nikola Pleska: Asi by se odborně mělo říct „prototyping“, což znamená, že to poměrně rychle prototypuji, případně to za hodím, protože to k ničemu není.

Ivana Karhanová: Díky oběma za návštěvu ve studiu. To byl tedy Nikola Pleska, digitální transformátor z Microsoftu. Díky, že jste přišel.

Nikola Pleska: Já děkuji.

Ivana Karhanová: A Jiří Čermák, který je vedoucím AI projektů v Blindspot Solutions. Díky i vám.

Jiří Čermák: Díky moc.

Více informací o těchto řešeních se můžete dozvědět zde