Synapses met l'IA au service du journalisme signé Ouest-France
Avec plus d’un siècle d’archives composées de plus de cent millions d’articles, photos et vidéos, Ouest-France dispose d’un patrimoine éditorial d’une richesse inégalée. Le valoriser pleinement à l’ère de l’intelligence artificielle, telle est la raison d’être du laboratoire commun Synapses.
Synapses fait figure de pionnier. C’est en effet le premier laboratoire commun qui conjugue science et journalisme. Conclu entre Ouest-France, le CNRS et l’Université de Rennes, et soutenu par l’Agence nationale de la recherche à hauteur d’un financement de 363 000 euros, il vise à développer sur cinq ans des outils d’intelligence artificielle capables de sonder, analyser et valoriser le patrimoine d’un titre de presse, dans une démarche de souveraineté des outils et données, et de respect de l’éthique journalistique.
Il y a 10 ans déjà, l’IA chez Ouest-France
En 2014, Michel Le Nouy, aujourd’hui responsable du pôle recherche appliquée et IA de Ouest-France, se voit confier une mission aussi ambitieuse que délicate : créer une banque de contenus pour pérenniser et valoriser le patrimoine éditorial du journal. Ce trésor, qui remonte à 1899, comprend quelque 48 millions d’articles, 38 millions de photos, 17 millions de pages et 116 000 vidéos.
« Il ne s’agissait pas seulement de préserver des archives poussiéreuses, mais de leur redonner une seconde vie en les rendant accessibles, exploitables et intelligibles pour les journalistes et les documentalistes », explique celui qui travaille chez Ouest-France depuis trente ans. Il fallait donc inventer une nouvelle façon de naviguer dans cette masse d’informations. Une quête qui, inévitablement, a conduit Ouest-France vers la recherche académique pour mettre au point des outils d’intelligence artificielle. Il n’était pas encore question de ChatGPT.
La collaboration entre Ouest-France et le CNRS ne date pas d’hier. Depuis trois décennies, les chercheurs de l’Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA - CNRS/Université de Rennes) collaborent avec le groupe de presse sur divers projets de numérisation et d’analyse des contenus. Laurent Amsaleg, directeur de recherche au CNRS, expert de l'analyse automatique de grandes collections de documents multimédia et responsable de l’équipe de recherche Linkmedia1 revient sur cette histoire commune : « notre relation avec Ouest-France repose sur une compréhension mutuelle des défis et des besoins. Les journalistes et les documentalistes fixent le cap. Nous apportons notre expertise en IA ». Le chercheur précise : « au CNRS, nous sommes sensibles à l’impact sociétal de nos recherches. C’est un véritable enjeu pour nous de poser des questions de recherche fondamentale sur le terrain du journalisme ». Deux ingénieurs de recherche, l’une spécialisée dans le traitement de la langue, l’autre dans la vision par ordinateur, ont rejoint pour trente mois le laboratoire commun afin de réaliser un travail de transfert de technologies et de connaissances vers les équipes de Ouest-France.
Trois défis technologiques qui riment avec innovation
Laurent Amsaleg pose le cadre éthique de Synapses : « notre démarche commune ne cherche en aucun cas à remplacer les journalistes, mais à fabriquer des prototypes technologiques puissants qui vont améliorer l’analyse des archives et la production éditoriale quotidienne ». Et d’expliciter les trois axes stratégiques de Synapses.
Premier axe, analyser les archives photographiques. Le groupe de presse possède 38 millions de photos, aujourd’hui indexées à la main par des documentalistes. Un travail titanesque où l’erreur humaine est possible. Le défi consiste à repérer des détails dans les photos pour rassembler celles qui se ressemblent, ou pour par exemple leur associer des mots clé. « À terme, retrouver toutes les images prises durant les 50 dernières années de cette très discrète fontaine de village malgré les évolutions du paysage urbain l'entourant deviendra possible », projette Laurent Amsaleg.
Deuxième axe, mettre au point des modèles langagiers capables de traiter des textes spécifiques, en l’occurrence les articles signés par les journalistes de Ouest-France. « L’un de nos défis majeurs consiste à analyser la diachronie du langage, soit l’évolution sémantique des mots au fil du temps », explique le scientifique. Il est certain qu’un terme comme « famille » en 1930 ne portait pas la même charge culturelle qu’en 2025.
Troisième axe, développer des outils de visualisation d’informations complexes et interconnectées, facilitant le travail des journalistes. Dans l’affaire des Panama Papers, les journalistes ont dû exploiter des centaines de milliers de données interdépendantes sans pouvoir les visualiser toutes sur un même écran. Synapses travaille à la construction d’outils de Dataviz dédiés.
L’IA oui, mais souveraine
À l’heure où certains journaux s’allient avec des entreprises comme OpenAI, Ouest-France fait le choix du CNRS. « Nous refusons que notre patrimoine éditorial serve à entraîner des IA dont nous ne maîtrisons ni les usages ni les biais », insiste Michel Le Nouy qui encadre, chez Ouest France pour le laboratoire commun, une équipe de quatre data scientists, des ingénieurs systèmes et des chefs de projets IA. Synapses garantit que toutes les solutions restent sous le contrôle du groupe de presse qui s’appuie sur l’excellence française en matière d’IA. Michel Le Nouy poursuit : « Grâce au regard et aux pratiques éditoriales des rédactions de nos titres, et sous leur contrôle, nous mettons au point des modèles d’apprentissage pour classifier et valoriser nos contenus afin de proposer de nouvelles offres numériques ».
Le monde de l’information est face à de nombreux défis liés aux progrès et aux usages de l’IA. Le laboratoire commun Synapses entreprend d’en éclairer quelques-uns. Par sa démarche éthique, il répond à la charte des valeurs de l’Association pour le soutien des principes de la Démocratie humaniste signée par le groupe Sipa Ouest-France : « les dirigeants se relaient, la mission demeure : éclairer, informer, relier les citoyens pour faire progresser le bien commun dans le respect de la dignité de chacun. Expliquer l’actualité, de la commune au monde ». CQFD.
Notes
- Equipe dédiée au traitement de très grandes collections de documents multimédia, elle comporte des personnels du CNRS, l’Inria, l’INSA Rennes et l’Université de Rennes 1