15 vizualizací dat, které vám vyrazí dech
Zjistěte více
Jestliže obrázek vydá za tisíc slov, vizualizace dat vydá minimálně za milion.
Jedním z nejpůsobivějších způsobů, jak mohou datoví analytici a vědci sdělovat svá zjištění, jsou stále populárnější vizualizace dat. Celé webové stránky, podcasty a kanály na Twitteru jsou věnovány sdílení těchto bohatých, pohlcujících datových zážitků. Infografiky to nejsou: datové vizualizace manipulují s komplexními soubory dat, aby vizuálně zobrazily jejich vzorce, trendy a korelace.
Jako inspiraci pro vlastní práci s daty si prohlédněte těchto 15 datových vizualizací, které vás ohromí. Dohromady je tento přehled přehlednou ukázkou široké škály využití analýzy dat, od popkultury až po veřejné blaho. Jak říká Erik Berger, senior manažer webových technologií, který pracuje v oblasti analýzy dat již 11 let: „Existuje více veřejných zdrojů pro vyhledávání dat než kdykoli předtím. K dispozici je vše od volebních modelů až po údaje o počasí, které lze interpretovat. S rozmachem sociálních médií můžete dokonce dělat takové věci, jako je porovnávání nálady na Twitteru s akciovým trhem, a vytvářet tak předpovědi. Dokonce i profesionální sportovní týmy si najímají datové analytiky, kteří jim pomáhají vyhrávat.“
Nejlepší vizualizace dat jsou nástroji pro vyprávění příběhů, které vyvolávají diskusi a vyzývají k akci. Považujte tuto rukavici za hozenou – zkuste, zda dokážete být ještě lepší než tyto.
Každá družice obíhající kolem Země
Tento interaktivní graf, vytvořený na základě databáze organizace Union of Concerned Scientists, zobrazuje trajektorie 1 300 aktivních družic obíhajících kolem Země v době, kdy čtete tento článek. Každý satelit je znázorněn kruhovou ikonou, barevně označen podle země a velikosti podle startovací hmotnosti. Procházejte vizualizací a prozkoumejte dráhu každé družice jednotlivě i souhrnně. Dozvíte se také, jaké druhy satelitů poskytují širokopásmový internet, GPS a Sirius XM.
Simpsonův paradox
Snímek obrazovky prostřednictvím VUDlab
Vizualizing Urban Data Idealab (VUDlab) z University of California-Berkeley sestavil tento vizuální pohled na data, která vyvracejí tvrzení v žalobě z roku 1973, která školu obviňovala z diskriminace na základě pohlaví. Ačkoli postgraduální školy přijaly 44 % mužských uchazečů, ale pouze 35 % ženských uchazeček, výzkumníci později odhalili, že pokud se data správně shromáždila, ve skutečnosti existovala malá, ale statisticky významná tendence ve prospěch žen. Tomu se říká Simpsonův paradox. Interaktivní grafy ve vizualizaci dat umožňují kombinovat a oddělovat různé segmenty dat a zjistit, co přesně se stalo v roce 1973.
Vizualizace Napoleonova pochodu v roce 1812 od Charlese Minarda
Obrázek prostřednictvím Edwarda Tufteho
Tato klasická litografie pochází z roku 1869 a zobrazuje počet mužů v Napoleonově ruské armádě v roce 1812, jejich pohyby a teploty, na které cestou narazili. Byla označena za jednu z „nejlepších statistických kreseb, které kdy byly vytvořeny“. Toto dílo je důležitou připomínkou toho, že základy vizualizace dat spočívají v jemném pochopení mnoha rozměrů dat. Nástroje jako D3.js a HTML jsou k ničemu bez pevného uchopení datové sady a ostrých komunikačních dovedností.“
Hans Rosling’s 200 Countries, 200 Years, 4 Minutes
Screenshot via YouTube/BBC
Slavný statistický dokument The Joy of Stats (Radost ze statistik) globálního experta na zdravotní data Hanse Roslinga byl odvysílán na BBC v roce 2010, ale stále vyvolává pozornost. Zejména jeden segment je docela ohromující. Ve filmu „200 zemí, 200 let, 4 minuty“ Rosling pomocí rozšířené reality zkoumá údaje o veřejném zdraví ve 200 zemích za 200 let s využitím 120 000 čísel, a to během pouhých čtyř minut. Jeho práce vykresluje průměrnou délku života v závislosti na příjmech v každé zemi od roku 1810 a poukazuje na zmenšující se rozdíly mezi západními a nezápadními zeměmi. Celý videoklip si prohlédněte zde.
Nájem vs. koupě
Snímek obrazovky prostřednictvím NYTimes
Mike Bostock, redaktor grafického oddělení New York Times a vynálezce D3.js, vytvořil komplexní interaktivní datovou kalkulačku, která nabízí analýzu nákladů a přínosů pro potenciální zájemce o bydlení. Spolu se svými kolegy Shanem Charterem a Archiem Tse Bostock využil vše od ceny domu a odpočtu daně z úroků z hypotéky až po míru daně z nemovitosti a inflaci, aby vám pomohl rozhodnout, zda si dům pronajmout, nebo koupit.
Hudební časová osa
Snímek obrazovky prostřednictvím služby Google
Hudební časová osa společnosti Google znázorňuje různé hudební žánry, jejichž popularita od roku 2010 do současnosti klesala a klesá, a to na základě toho, kolik uživatelů služby Google Play Music má daného interpreta nebo album ve své knihovně, a dalších údajů, jako jsou data vydání alb. Každý pruh na grafu představuje žánr, od reggae nebo blues po folk a soul. Tloušťka každého pruhu odpovídá popularitě hudby vydávané v daném roce v daném žánru. Všechny pruhy jsou klikací, takže se můžete ponořit hlouběji do jakéhokoli žánru a prozkoumat subžánry.
State of the Union 2014 Minute by Minute on Twitter
Screenshot via GitHub/Twitter
Přísun dat z Twitteru poskytuje bohatý a robustní fond, ze kterého mohou datoví analytici a vědci čerpat a analyzovat reakce na aktuální události v reálném čase. Jako jeden z příkladů uveďme, že datový tým Twitteru sestavil působivé interaktivní datové centrum, které zobrazuje, jak uživatelé Twitteru po celém světě reagovali na jednotlivé odstavce projevu prezidenta Obamy o stavu Unie v roce 2014. Data můžete rozdělit podle tematických hashtagů (například #budget, #defense nebo #education) a států. Docela síla.
NYC Street Trees
Snímek obrazovky přes Cloudred
Tato interaktivní vizualizace využívá data z NYC Open Data a ukazuje rozmanitost a množství vysázených pouličních stromů v pěti obvodech New Yorku. Druhy jsou barevně odlišeny a vzájemně porovnány podle městských částí. Projekt odhaluje některá překvapivá zjištění, například skutečnost, že v Queensu roste téměř dvakrát více stromů než v Brooklynu (A Tree Grows in Brooklyn aside).
Rozmanitost generace mileniálů
Snímek obrazovky prostřednictvím CNNMoney
Interaktivní graf společnosti CNNMoney, který ukazuje velikost a rozmanitost generace mileniálů ve srovnání s generací baby boomers, byl vytvořen na základě údajů ze sčítání lidu USA. Ze suchých čísel dělá zajímavý příběh, který ilustruje rasové složení různých věkových skupin od roku 1913 do současnosti. Pohybem myši po grafu můžete prozkoumat statistiky jednotlivých let.
Zlaté exoplanety
Snímek obrazovky prostřednictvím National Geographic
Věříte v mimozemský život? Možná poté, co si prohlédnete tuto vizualizaci dat National Geographic, která vypočítává, které planety v naší sluneční soustavě i mimo ni mají ty správné podmínky (odtud odkaz na Zlatovlásku) pro život. Interaktivní graf využívá data z Planetary Habitability Laboratory na University of Puerto Rico a vykresluje hmotnost, atmosférický tlak a teplotu planet, aby určil, na kterých exoplanetách by mohly žít nebo někdy žily živé bytosti.
Střelecké hvězdy Washington Wizards
Screenshot via Washington Post
Tato podrobná vizualizace dat ukazuje střeleckou úspěšnost basketbalového týmu D.C. v sezóně 2013. Vizualizace využívá statistiky zveřejněné NBA a umožňuje prozkoumat údaje o každém z 15 hráčů. Podívejte se, jak byl každý z nich úspěšný v různých typech střel z různých míst na hřišti ve srovnání s ostatními hráči ligy.
Migrační vzorce USA
Screenshot via NYTimes
Žijete stále ve státě, ve kterém jste se narodili? Datový tým deníku New York Times zmapoval vzorce stěhování Američanů od roku 1900 do současnosti a výsledky jsou fascinující. Můžete se podívat, kde se lidé žijící v jednotlivých státech narodili a do jakých států se stěhují lidé z jiných. Pásky dat, které byly převzaty ze sčítání lidu v USA, jsou barevně odlišeny podle regionů a přehledně zobrazují migrační vzorce v průběhu času.
Selfie City
Snímek obrazovky prostřednictvím Selfie City
Slovem roku 2013 se podle Oxford Dictionaries stalo „selfie“, a to z dobrého důvodu: jen od roku 2012 do roku 2013 se používání tohoto slova v angličtině zvýšilo o 17 000 %. Nyní, když se tento termín a pojem staly nedílnou součástí moderního diskurzu, je zajímavé zkoumat tento fenomén z pohledu dat. Selfie City, podrobný vícesložkový vizuální průzkum 3 200 selfies z pěti velkých měst po celém světě, nabízí detailní pohled na demografické údaje a trendy v oblasti selfies. Tým, který za projektem stojí, shromažďoval a filtroval data pomocí Instagramu a Mechanical Turku. Prozkoumejte rozdíly mezi selfies pořízenými například v New Yorku a Berlíně, stejně jako rozdíly mezi muži a ženami po celém světě.
Americký pracovní den
Screenshot via NPR
Chcete zjistit, jaká je délka vašeho průměrného pracovního dne ve srovnání s pracovními dny ostatních? NPR sáhla po údajích z American Time Use Survey a zjistila, jaký podíl pracovníků v nejrůznějších odvětvích je v danou dobu v práci. Graf překrývá tradiční normu od 9:00 do 17:00 pro referenční bod, což vám pomůže vyvodit zajímavé závěry.
Globální emise uhlíku
Screenshot via The Guardian
Tato vizualizace dat založená na údajích z nástroje World Resource Institute’s Climate Analysis Indicators Tool a Mezivládního panelu pro změnu klimatu ukazuje, jak se národní emise CO₂ proměnily za posledních 150 let a jaká může být budoucnost. Prozkoumejte emise podle jednotlivých zemí pro řadu různých scénářů.
Znalost je moc, ale aby vaše znalost dat byla skutečně mocná, musíte umět svá zjištění zobrazit uceleným a přesvědčivým způsobem. A právě zde přichází ke slovu vizualizace dat. Vzhledem k tomu, že je k dispozici více dat než kdykoli předtím, nabízí se vám bohaté a nepřeberné možnosti, jak efektivně zprostředkovat myšlenky skryté za daty.
Zajímá vás více informací? Podívejte se na program Data Visualization Nanodegree!
Zjistěte více