17-17 déc. 2024 En ligne (France)

Présentation

Bienvenue dans ce premier webinaire de l'année 2024/2025 proposé par le GTSO Données de Couperin.

La datavisualisation, ou visualisation des données, consiste à mettre en scène les données graphiquement pour obtenir une compréhension instantanée, simple, fonctionnelle et esthétique de phénomènes complexes ou ayant nécessité une étape préalable de fouille. Née au sein de la recherche en mathématique statistique et en informatique, elle s’est depuis appliquée à la recherche en sciences sociales.

La fouille de données, c'est être cyber-archéologue, extraire dans la foule d'informations disponibles les plus pertinentes pour un sujet, opérer des rapprochements et des choix qui rendent cette masse d'informations intelligible par l’humain. La visualisation de données, c'est être cyber-peintre, raconter une histoire, sélectionner les couleurs pour que l'essentiel de la fouille d'informations devienne plus clair en un regard. Mais gare aux spectacles magnifiques qui ne font rien comprendre.

Les 3 interventions, issues d’univers disciplinaires et méthodologiques différents, visent à clarifier les concepts et les outils. Des parcours, des projets, des solutions pratiques à des problèmes concrets seront proposés. La place de l’image comme vecteur d’information sera également questionnée.

Ce webinaire est préparé par Laetitia Bracco (Université de Lorraine), Delphine Du Pasquier (École des Ponts ParisTech), Cyril Heude (Sciences Po Paris), Caroline-Sophie Donati (MSH SUD / Université Paul Valéry Montpellier 3), Ling Li (Université Lyon 2), Cynthia Pedroja (Campus Condorcet), Céline Rousselot (Université Gustave Eiffel) et Jozefina Sadowska (INRIA).

 Mardi 17 décembre de 10h à 12h

 INSCRIPTION

 Ce webinaire sera enregistré puis diffusé sur la chaine Youtube du GTSO Données de Couperin.

Programme

Datavisualisation et utilisateurs non experts : enjeux et perspectives [titre à confirmer], Béatrice Arruabarrena

Cette présentation explorera l’essor de la datavisualisation auprès des utilisateurs non experts, impulsé par le Big Data et l’Open Data. Nous aborderons les compétences nécessaires pour concevoir, utiliser et interpréter ces outils, ainsi que les enjeux qu’ils posent. Enfin, nous proposerons des pistes de recherche interdisciplinaires pour repenser les pratiques de datavisualisation dans les systèmes de connaissances de demain. [résumé à confirmer]

Des données à l'image : quelques retours d'expériences de 10 années de datavisualisation, Etienne Côme

Après une rapide présentation de son parcours et de son point de vue sur le travail de datavisualisation, il présentera certains des projets de visualisation de données massives qu’il a réalisés ces 10 dernières années. Il s’intéressera en particulier aux questions de diffusion de données statistiques massives sous forme cartographique. Il abordera enfin des questions liées à la médiation algorithmique dans l'aide à l'exploration de données massives.

Visualisation et exploration de grands corpus à partir de projections multidimensionnelles, Jean-Daniel Fekete

Depuis une dizaine d'années, les algorithmes d'apprentissage automatique permettent de visualiser des corpus textuels de grande taille selon la similarité des concepts entre documents. Deux documents similaires sont plus proches sur l'écran que de deux document moins similaires. À partir de cette règle simple, il est possible d'explorer de large corpus documentaires, à condition d'y ajouter quelques améliorations. Je décrirai l'évolution des techniques d'apprentissage statistique qui permettent de comparer le contenu sémantique des documents, les avancées en interaction et en visualisation permettant leur représentation à l'écran, et les avancées permettant de naviguer dans ces nouveaux espaces documentaires avec des indications sur les domaines thématiques par zone.

En mettant bout à bout toutes ces technique, on arrive à une cartographie documentaire très semblable à des cartes topographiques qu'il faut apprendre à lire pour éviter certains écueils que je décrirai aussi (les artefacts topologiques liés aux projections). Je montrerai nos résultats avec le site cartolabe.fr entre autres. Avec un peu d'habitude, il est maintenant possible d'explorer de large corpus documentaires avec un cartographie thématique automatiquement calculée.

Intervenants

Béatrice Arruabarrena est maître de conférences en Sciences de l’Information et de la Communication au CNAM, Laboratoire DICEN. Elle est responsable du Master 2 Mégadonnées et analyse sociale (MEDAS) à l’INTD CNAM. Elle enseigne l’épistémologie des sciences et des techniques, l’éthique des algorithmes et des données.

Étienne Côme, chargé de recherche à l'université Gustave Eiffel, travaille principalement sur l'application d'outils tels que la reconnaissance de formes et l'apprentissage automatique dans le domaine des transports. Il est passionné par la visualisation des données et la cartographie, et a créé plusieurs outils d'exploration de jeux de données massifs. Vous pouvez découvrir certains de ses travaux sur son portfolio en visitant le lien suivant : https://www.comeetie.fr/#portf

Jean-Daniel Fekete est un chercheur en informatique français dans les domaines de la visualisation d'information et de l'interaction homme-machine. Il est directeur de recherche à l'INRIA au sein de l'équipe AVIZ qu'il a créée en 2007 et dont il est le directeur.

Personnes connectées : 2 Vie privée
Chargement...