15 Visualisations de données qui vont vous époustoufler

En savoir plus

Si une image vaut mille mots, une visualisation de données en vaut au moins un million.

L’une des façons les plus percutantes pour les analystes de données et les scientifiques de communiquer leurs résultats est le média de plus en plus populaire des visualisations de données. Des sites web entiers, des podcasts et des flux Twitter sont consacrés au partage de ces expériences riches et immersives basées sur les données. Ce ne sont pas des infographies : les visualisations de données manipulent des pools de données complexes pour afficher visuellement les modèles, les tendances et les corrélations des données.

Pour vous inspirer dans votre propre travail sur les données, découvrez ces 15 visualisations de données qui vont vous épater. Dans l’ensemble, ce tour d’horizon est une représentation en un coup d’œil de l’éventail des utilisations de l’analyse des données, de la culture pop au bien public. Comme l’explique Erik Berger, responsable principal des technologies web, qui travaille dans le domaine de l’analyse des données depuis 11 ans, « les sources publiques de données sont plus nombreuses que jamais. Tout est disponible pour être interprété, des habitudes de vote aux données météorologiques. Avec l’essor des médias sociaux, il est même possible de faire des choses comme comparer l’humeur de Twitter à la bourse pour faire des prédictions. Même les équipes sportives professionnelles embauchent des analystes de données pour les aider à gagner. »

Les meilleures visualisations de données sont des outils de narration qui suscitent la discussion et incitent à l’action. Considérez le gant lancé – voyez si vous pouvez faire encore mieux que ceux-ci.

Chaque satellite en orbite autour de la Terre

Ce graphique interactif, construit à l’aide d’une base de données de l’Union of Concerned Scientists, affiche les trajectoires des 1 300 satellites actifs en orbite autour de la Terre au moment où vous lisez ceci. Chaque satellite est représenté par une icône circulaire, avec un code couleur par pays et une taille correspondant à la masse de lancement. Faites défiler la visualisation pour explorer la trajectoire de chaque satellite, individuellement et dans son ensemble. Vous apprendrez également quels types de satellites fournissent l’Internet haut débit, le GPS et Sirius XM.

Paradoxe de Simpson

Capture d’écran via VUDlab

Le Visualizing Urban Data Idealab (VUDlab) de l’Université de Californie-Berkeley a mis au point ce regard visuel sur des données qui réfutent l’affirmation d’un procès de 1973 qui accusait l’école de discrimination sexuelle. Bien que les écoles d’études supérieures aient accepté 44 % des candidats masculins et seulement 35 % des candidates féminines, les chercheurs ont découvert par la suite que si les données étaient correctement regroupées, il existait en fait un biais faible mais statistiquement significatif en faveur des femmes. C’est ce qu’on appelle le paradoxe de Simpson. Les graphiques interactifs de la visualisation des données vous permettent de combiner et de séparer différents segments de données pour voir ce qui s’est passé exactement en 1973.

Visualisation de la marche de Napoléon en 1812 par Charles Minard

Image via Edward Tufte

Cette lithographie classique date de 1869 et affiche le nombre d’hommes de l’armée russe de Napoléon en 1812, leurs mouvements et les températures qu’ils ont rencontrées sur leur chemin. Elle a été qualifiée de « meilleur dessin statistique jamais créé ». Cette œuvre est un rappel important que les fondements de la visualisation des données résident dans une compréhension nuancée des nombreuses dimensions des données. Des outils comme D3.js et HTML ne servent à rien sans une bonne maîtrise de votre ensemble de données et des compétences pointues en communication.

Les 200 pays, 200 ans, 4 minutes de Hans Rosling

Capture d’écran via YouTube/BBC

Le célèbre documentaire statistique The Joy of Stats de l’expert mondial en données de santé Hans Rosling a été diffusé sur la BBC en 2010, mais il fait encore tourner les têtes. Un segment en particulier est assez époustouflant. Dans « 200 pays, 200 ans, 4 minutes », Rosling utilise la réalité augmentée pour explorer les données de santé publique de 200 pays sur 200 ans à l’aide de 120 000 chiffres, en quatre minutes seulement. Son travail établit un graphique de l’espérance de vie en fonction du revenu pour chaque pays depuis 1810, et montre que l’écart entre les pays occidentaux et non occidentaux se resserre. Découvrez le clip vidéo complet ici.

La location contre l’achat

Capture d’écran via NYTimes

Mike Bostock, rédacteur du département graphique du New York Times et inventeur de D3.js, a construit une calculatrice de données interactive complexe qui offre une analyse coûts/avantages pour les acheteurs potentiels. Avec ses collègues Shan Charter et Archie Tse, Bostock a puisé dans tous les éléments, du prix de la maison à la déduction fiscale des intérêts hypothécaires, en passant par le taux de taxe foncière et l’inflation, pour vous aider à déterminer si vous devez louer ou acheter une maison.

La Timeline musicale

Capture d’écran via Google

La Timeline musicale de Google illustre une variété de genres musicaux dont la popularité croît et décroît de 2010 à aujourd’hui, en fonction du nombre d’utilisateurs de Google Play Music ayant un artiste ou un album dans leur bibliothèque, et d’autres données comme les dates de sortie des albums. Chaque bande du graphique représente un genre, du reggae ou du blues au folk et à la soul. L’épaisseur de chaque bande est en corrélation avec la popularité de la musique publiée au cours d’une année donnée dans ce genre. Toutes les bandes sont cliquables, ce qui vous permet de plonger plus profondément dans n’importe quel genre pour explorer les sous-genres.

État de l’Union 2014 minute par minute sur Twitter

Capture d’écran via GitHub/Twitter

Le flux de données de Twitter constitue un réservoir riche et robuste dans lequel les analystes de données et les scientifiques peuvent puiser pour analyser les réactions en temps réel aux événements actuels. Pour prendre un exemple, l’équipe chargée des données de Twitter a assemblé un impressionnant hub de données interactif qui décrit comment les utilisateurs de Twitter à travers le monde ont réagi à chaque paragraphe du discours sur l’état de l’Union prononcé par le président Obama en 2014. Vous pouvez découper les données par hashtag thématique (par exemple, #budget, #défense ou #éducation) et par État. Plutôt puissant.

NYC Street Trees

Screenshot via Cloudred

Utilisant les données de NYC Open Data, cette visualisation interactive montre la variété et la quantité d’arbres de rue plantés dans les cinq arrondissements de la ville de New York. Les espèces sont codées par couleur et croisées par arrondissement. Le projet révèle des résultats surprenants, comme le fait que le Queens abrite presque deux fois plus d’arbres que Brooklyn (A Tree Grows in Brooklyn à part).

Diversité de la génération du millénaire

Screenshot via CNNMoney

Le graphique interactif de CNNMoney montrant la taille et la diversité de la génération du millénaire par rapport aux baby-boomers a été construit à partir des données du recensement américain. Il transforme des chiffres secs en une histoire intrigante, illustrant la composition raciale de différents groupes d’âge de 1913 à aujourd’hui. Déplacez votre souris sur le graphique pour explorer les statistiques de chaque année.

Exoplanètes Boucles d’Or

Capture d’écran via National Geographic

Croyez-vous à la vie extraterrestre ? Vous le pourriez après avoir consulté cette visualisation de données de National Geographic, qui calcule quelles planètes à travers notre système solaire et au-delà ont juste les bonnes conditions (d’où la référence à Boucles d’or) pour accueillir la vie. En utilisant les données du Planetary Habitability Laboratory de l’Université de Porto Rico, le graphique interactif trace la masse planétaire, la pression atmosphérique et la température pour déterminer quelles exoplanètes pourraient abriter, ou ont abrité à un moment donné, des êtres vivants.

Washington Wizards’ Shooting Stars

Screenshot via Washington Post

Cette visualisation de données détaillée démontre le succès des tirs de l’équipe de basket de D.C. au cours de la saison 2013. En utilisant les statistiques publiées par la NBA, la visualisation vous permet d’examiner les données pour chacun des 15 joueurs. Voyez dans quelle mesure chaque personne a réussi divers types de tirs à partir d’un éventail d’endroits sur le terrain, par rapport aux autres joueurs de la ligue.

Modèles de migration aux États-Unis

Screenshot via NYTimes

Vivez-vous toujours dans l’État dans lequel vous êtes né ? L’équipe de données du New York Times a cartographié les habitudes de déménagement des Américains de 1900 à nos jours, et les résultats sont fascinants à manipuler. Vous pouvez voir où sont nés les habitants de chaque État, et vers quels États ils se déplacent. Les rubans de données, tirés du recensement américain, sont codés en couleur par région et affichent clairement les modèles de migration au fil du temps.

Selfie City

Screenshot via Selfie City

Le mot de l’année 2013 des dictionnaires Oxford était « selfie », et pour une bonne raison : l’utilisation du mot dans la langue anglaise a augmenté de 17 000% de 2012 à 2013 seulement. Maintenant que le terme et le concept font partie intégrante du discours moderne, il est intéressant d’examiner le phénomène sous l’angle des données. Selfie City, une exploration visuelle détaillée à plusieurs composantes de 3 200 selfies provenant de cinq grandes villes du monde, offre un regard attentif sur la démographie et les tendances des selfies. L’équipe à l’origine du projet a collecté et filtré les données en utilisant Instagram et Mechanical Turk. Explorez les différences entre les selfies pris, par exemple, à New York et à Berlin, ainsi que celles entre les hommes et les femmes à travers le monde.

La journée de travail américaine

Capture d’écran via NPR

Vous voulez voir comment la durée de votre journée de travail moyenne se compare à celle des autres ? NPR a exploité les données de l’American Time Use Survey pour déterminer la part des travailleurs d’un large éventail de secteurs qui sont au travail à un moment donné. Le graphique superpose la norme traditionnelle de 9 heures à 17 heures pour servir de point de référence, ce qui vous aide à tirer des conclusions intéressantes.

Émissions mondiales de carbone

Capture d’écran via The Guardian

Cette visualisation de données, basée sur les données de l’outil d’indicateurs d’analyse climatique du World Resource Institute et du Groupe d’experts intergouvernemental sur l’évolution du climat, montre comment les émissions nationales de CO₂ se sont transformées au cours des 150 dernières années et ce que l’avenir pourrait réserver. Explorez les émissions par pays pour une série de scénarios différents.

La connaissance est un pouvoir, mais pour que votre connaissance des données soit réellement puissante, vous devez être capable d’afficher vos résultats de manière cohérente et convaincante. C’est là que la visualisation des données entre en jeu. Avec plus de données disponibles que jamais, les opportunités sont à la fois riches et abondantes pour vous permettre d’explorer comment transmettre efficacement les idées derrière les données.

Intéressé pour en savoir plus ? Consultez le programme de nanodiplôme en visualisation de données!

En savoir plus

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.