.

Big data anonymizační framework

Firmy dnes disponují velkým množstvím dat. Vzhledem k jejich velkému množství se ukládají ve strukturovaném formátu v datovém skladu (DWH). V průběhu času společnosti nashromáždily kvanta dat a náklady na rozšíření DWH exponenciálně rostly, přičemž ne všechna data musela být k dispozici okamžitě.

Tento problém začaly firmy řešit ukládáním historických dat na platformách Hadoop, které lze snadno a levně rozšiřovat a které poskytují rozsáhlé distribuované úložiště dat i distribuovaný výpočetní výkon pro jejich zpracování.

Kvůli GDPR však nelze všechna data uchovávat navždy.

GDPR definuje, co mohou zákazníci po firmách požadovat v oblasti nakládání s jejich údaji, a nedovoluje jim zpracovávat nebo uchovávat osobní údaje navždy. Doba uchovávání osobních údajů je stanovena zákony jednotlivých zemí.

Protože firmy nemohou uchovávat osobní údaje navždy, musejí je po určité době vymazat nebo anonymizovat. Vymazání však znamená, že společnost přijde o cenné údaje, a úplná anonymizace může vést ke zbytečnému používání údajů pro jakékoli analytické účely.

Náš přístup

Pro naše zákazníky chceme co nejdéle uchovávat co nejvíce přehledných dat, aby analytici mohli s daty stále efektivně pracovat a poskytovat inovativní řešení v oblasti umělé inteligence a strojového učení. Aby to bylo možné, je náš přístup rozdělen do tří fází:

  1. Rozsáhlá analýza zákaznických dat.
  2. Konfigurace a nasazení vlastního anonymizačního rámce.
  3. Provedení anonymizace.

Anonymizační framework

None

Proces analýzy je nejdůležitější částí, protože každý zákazník má jiné údaje, jiné potřeby a jiné definice toho, co považuje za identifikovatelné informace. Proto je každá tabulka a každý sloupec analyzován s cílem určit, zda se jedná o informace umožňující identifikaci osob, a pokud ano, jaký druh anonymizace nebo pseudoanonymizace by měl být použit. To vše pak potvrdí klient

None

Další kroky zahrnují konfiguraci, nasazení a provedení procesu anonymizace. Adastra vyvinula anonymizační rámec pro prostředí DWH a Hadoop, který umožňuje okamžitou anonymizaci, pseudoanonymizaci a tokenizaci hodnot v případě, že některé hodnoty musejí být reverzibilní. Pokud stávající metody nestačí, lze přidat nové metody anonymizace. Jakmile je framework nasazen a nakonfigurován, je přidání nové tabulky pro anonymizaci jednoduchou záležitostí konfigurace.

Zanechte nám kontakt, ozveme se vám

Děkujeme

V co nejbližší době se vám ozveme.

Matej Bordáč