Water Torture - An Analytics Analogy Goes a Bridge Too Far

kapková analýza

Data, stejně jako voda, mají mnoho podob. Lidská mysl se vyvinula tak, aby odfiltrovala většinu dat, která se nám dostanou do cesty, protože je toho prostě tolik.

Když otevřete oči a uši, data jsou všude. Barva stěny, zvuk klimatizace a vůně kávy vašeho souseda jsou považovány za vlhkost. Voda je stále ve vzduchu, ale není užitečné jí věnovat velkou pozornost.

Když voda kondenzuje do mlhy, nutí vás to vidět a o to obtížnější je porozumění světu kolem vás. Neúplné datové sady, poškozená data, špatná věda, falešné závěry a kognitivní zkreslení - to vše způsobí, že se ztratíte v mlze.

Data padají jako déšť. Když je toho málo, je to divoce neuspokojivé - jen tolik, aby se vaše auto zašpinilo a zmátlo rozhovor. Zjistíte, že si utíráte místo na brýlích, když někdo chrlí nějaký náhodný datový bod získaný z nějakého temného zdroje.

  • Zatuchlá voda v mělkém rybníku je nebezpečné. Data shromážděná z nespolehlivého zdroje, která nejsou ani očištěna, ani normalizována a ponechána stagnovat, mohou snadno vést k chybným závěrům.
  • A stálý pramínek vody může stačit k naplnění jídelny nebo udržení lesního ekosystému. Pouze tři datové body (počet odeslaných e-mailů, versus otevřených a klikaných) mohou udržet marketingový program.
  • A zdravější tok ke koupání lze použít data ve formě malého potoka. Kontinuální tok dat umožňuje srovnávání a historické srovnání. Optimalizace cílové stránky lze dosáhnout pomocí stabilních údajů o převodu.
    A skromná řeka může pohánět mlýn na řezání dřeva nebo drcení pšenice. Motor doporučení potřebuje spolehlivý příspěvek od několika přítoků, aby zajistil zvýšení hodnoty nákupních vozíků.
  • A vodopád může pohánět obrovské vodní kolo a dostatečný příliv informací může řídit systém s dynamickým obsahem v reálném čase.
  • A řeka dostatečně široká a hluboká může podporovat celý dopravní průmysl. Dostatek dat může plavit čluny a nákladní lodě ve tvaru kolekce cookies z reklamních sítí, agregátorů dat věrnostních karet a zprostředkovatelů dat.

Když data dorazí v očekávaném množství v očekávaných časech, mohou být zachycena, směrována a uvedena do provozu. Zavlažovací systémy, přehrady a nádrže poskytují pocit kontroly a umožňují stavbu stále se rozšiřující infrastruktury s kanály, plavebními komorami a přehradami. Datové sklady byly postaveny na méně důvěryhodných tocích.

Čistota je vedle zbožnosti

Čistá voda je zásadní pro úspěch života, zavlažování, provozování elektráren atd. Definice „čisté“ se může pro daný účel změnit; je v pořádku, pokud jsou ve vodě řasy, které ochlazují elektrárnu, a je nepřijatelné, pokud je v pitné vodě více než 10 dílů na miliardu arsenu.

Data jsou stejná. V aplikaci pro přímou poštu je to, zda máte titul osoby (pan, paní, paní), bezvýznamné ... pokud neposíláte poštu lékařům. Špinavá data vás ale pokaždé potopí.

Jako hlavní vědecký pracovník v USA DJ Patilna summitu ČTÚ prvního kola: „Pokud nepřemýšlíte o tom, jak udržet svá data čistá od samého začátku, jste f ^ ¢ & ed. Zaručuji to. Pokusit se to uklidit poté, co to bude trvat nejméně měsíce. “

Pokud ohříváte vodu na teplotu varu, může pohánět celou průmyslovou revoluci. Zdá se, že Data dělají totéž. Od okamžiku, kdy počítače mohly ukládat i počítat, byla data shromažďována tak rychle, jak bylo možné k tomu vytvořit úložné zařízení.

Datové jezero

Jak data z těchto přítoků stékají motorem mlýnů, vše končí v jezeře za přehradou. Jak jsou data vypouštěna kontrolovaným způsobem, napájí turbíny datového průmyslu; ty obrovské motory zpracování dat se jmény jako Google a Facebook. Nebude tu žádné sucho.

A nakonec je tu hluboká kaluž vody, která čeká, až se analytik ponoří dovnitř. Potápěčská výbava a kopí v ruce, analytik zkoumá hloubku, mapuje novou půdu a objevuje nové druhy. Je velmi vzrušující být průzkumníkem dat.

Proto se tolik z nich objevilo pro Summit eMetrics od roku 2002. Další příležitost je v Bostonu od 27. září do 1. října 2015.

Registrace eMetrics Summit

Příliš vzdálený most

A co síla dat k vyřezávání dalšího Grand Canyonu? A co ledové tání strukturovaných dat? Jak zacházíme s odpadními vodami ve světě, který si stále více uvědomuje soukromí?

To jsou otázky na jindy a voda pod mostem.

Co si myslíte?

Tyto stránky používají Akismet k omezení spamu. Zjistěte, jak jsou vaše údaje komentářů zpracovávány.