CompaSciences est un outil d’analyse sémantique, computationnelle et qualitative des contenus médiatiques, développé pour aider les journalistes à naviguer dans le flot constant d’informations qui les submerge et pour identifier des expert.e.s scientifiques pertinent.e.s pour la réalisation de sujets.
Le projet de recherche “CompaSciences”
Memoways a été le partenaire “Industrie” de ce projet de recherche qui a duré 4 ans.
Voici une vidéo qui présente le projet, réalisée en septembre 2020 lors de la rencontre annuelle de l’IMI:
Pour en savoir plus sur le contexte institutionnel du projet, voici la page informative sur le site de l’IMI, qui était le financeur de ce projet.
Que propose CompaSciences, en substance ?
Une exploration interactive de la médiatisation du savoir scientifique
CompaSciences est un outil d’analyse sémantique, computationnelle et qualitative des contenus médiatiques, développé pour aider les journalistes à naviguer dans le flot constant d’informations qui les submerge et pour identifier des expert.e.s scientifiques pertinent.e.s pour la réalisation de sujets. Extrait du dossier pour l’IMI
Cet outil s’adresse donc en premier lieu aux journalistes, mais aussi plus largement aux personnes qui veulent produire des contenus basés sur une expertise scientifique. Grâce à ses cartes sémantiques interactives qui présentent des clusters de termes associés, le dispositif est également intéressant pour explorer et analyser la production médiatique: une sorte de vue « d’en haut » – comme une carte géographique – qui permet une compréhension complémentaire aux méthodes traditionnelles.
Voici une vidéo qui explique le projet:
En utilisant CompaSciences, on a la sensation de redécouvrir le monde connu depuis une multiplicité d’autres angles, impossible à appréhender sans les derniers développements de l’informatique (algorithmes & intelligence artificielle).
Plus qu’un nouvel angle de regard, c’est un voyage fait de surprises et de sérendipité qui est l’une des promesses qui est la plus intéressante dans cet outil: par les associations de termes et grâce aux ramifications des d’enjeux, on a vite fait de prendre des chemins de traverse…
L’architecture du dispositif
Le projet repose sur les sets de données suivants:
- Les contenus du site Avis d’Experts
- Une partie des émissions de la RTS
- Les articles du journal Le Temps (entre 2020 et 2022)
- Un subset d’articles de Wikipedia
Les données utilisées pour l’analyse computationnelle sont:
- Les métadonnées et le Speech-to-text en provenance de la RTS et d’Avis d’Experts, reliées aux émissions (audio & vidéo);
- Les articles du Temps et de Wikipedia
Toutes ces données sont traitées automatiquement par du NLP (Natural Language Processing), de la réduction de dimension par UMAP et de la visualisation de graphes. En aval, une vérification par analyse qualitative permet de s’assurer de la robustesse des résultats.
Voici le schéma qui présente la « mécanique » du projet, ainsi que les partenaires:
Comme on peut le voir sur ce schéma, c’est le « tandem » expert – journaliste qui s’allie pour produire la connaissance pour le public, tout en travaillant, grâce au dispositif CompaScience, en vue d’une optimisation de la robustesse de sa propre production (de savoir, de contenus).
Les enjeux et les objectifs du projet
Les enjeux, dont traite directement et indirectement ce projet, ont été les suivants:
- Analyse de la médiatisation du savoir scientifique, pour mieux comprendre comment la production scientifique peut être au service des besoins de la société;
- Recherche des experts, pour contribuer à la production médiatique robuste;
- Exploration par sujets, notions ou domaines d’expertise, pour visualiser les relations avec une vue d’ensemble propice à la sérendipité;
- Améliorer les recommandations, pour faciliter la découverte et donner envie à s’immerger dans une thématique donnée.
Ce dernier point, qui n’est pas « utile » pour le dispositif lui-même, est potentiellement d’une grande importance pour proposer une logique de recommandation complémentaire aux algorithmes existants.
Le premier « client » qui va utiliser cette mécanique de recommandation est le site web d’Avis d’Experts, qui va pouvoir profiter des développements réalisés dans le cadre du projet CompaSciences.
Le générique
Agathe Chevalier (Avis d’Experts – RTS)
Prof. Boris Beaude (UNIL)
Olivier Glassey (UNIL)
Ogier Maitre (UNIL)
Philippe Gonzalez (UNIL)
Marine Kneubühler (UNIL)
Matthieu Devaux (UNIL)
Mon propre rôle dans ce projet institutionnel, en tant que partenaire industriel, était de:
- faire fonctionner et optimiser la mécanique de récupération des données en provenance de la RTS;
- être « l’interface » entre les développeurs et les responsables de projet (entre autre avec des schémas, comme celui plus haut dans cette page), pour assurer la bonne réalisation des objectifs énoncés;
- collaborer au niveau des fonctionnalités, de l’interface et de l’expérience utilisateur avec l’équipe de l’UNIL;
- contribuer à la réflexion sur la pérennisation du dispositif, une fois le financement de l’IMI terminé.