Science ouverte : la plateforme HAL fête 20 ans d’engagement

Institutionnel

Le 24 novembre prochain, l’archive ouverte et plateforme HAL célèbre ses 20 ans. L’occasion de revenir sur son histoire, ses évolutions et ses ambitions pour continuer à donner toute sa place à la science ouverte.

« C’est 20 ans d’histoire et de développements pour proposer des outils et des services en adéquation avec les besoins des chercheurs et chercheuses », résume Nathalie Fargier, directrice du Centre pour la communication scientifique directe1  (CCSD), structure où a été créée et est administrée l’archive ouverte HAL et les plateformes associées. Pour fêter cet anniversaire, « rendre hommage aux chercheurs et ingénieurs qui ont créé HAL et se projeter vers l’avenir », un événement est organisé au Musée des confluences à Lyon le 24 novembre.

Graphe montrant l'interaction entre les plateformes du CCSD

Aujourd’hui, HAL contient plus de 2,7 millions de documents scientifiques dont 950 000 en texte intégral (plutôt qu’une notice), et se décline en 139 portails institutionnels – des sites web ne montrant que la partie de la base qui concerne l’institution – qui couvrent toutes les communautés scientifiques et une grande partie des institutions de recherche françaises. La plateforme a été lancée par le CNRS en 2001 à l’initiative du physicien Franck Laloë et de l’ingénieur de recherche Daniel Charnay. Très vite, Inria rejoint le projet. « À une époque où l’on ne parlait pas encore de science ouverte », il s’agissait alors d’un serveur technique permettant aux scientifiques de déposer leurs productions – articles, ouvrages, comptes rendus de congrès, etc. – en « accès ouvert ». Contrairement à une publication dans une revue d’éditeur scientifique, un dépôt sur un tel serveur rend accessibles les résultats scientifiques gratuitement et rapidement à tous, scientifiques comme grand public, souvent sans relecture par les pairs, les articles pouvant être publiés avant ou dans un second temps chez des éditeurs plus classiques. Hébergée au Centre de calcul de l’IN2P32 , cette archive ouverte suivait le modèle du serveur de prépublication américain ArXiv, lancé dès 1991, qui permet aux physiciens de communiquer rapidement leurs résultats à leurs pairs. En s’adressant à toutes les disciplines, HAL mettait un point d’honneur à laisser la communauté scientifique contrôler la qualité du contenu avant publication. « HAL a porté dès le départ un discours militant en faveur de l’accès ouvert auprès des scientifiques et des éditeurs, ces derniers étant contraints d’intégrer le paradigme de la science ouverte qui s’est imposé progressivement », témoigne Nathalie Fargier.

Des services en évolution constante

Ces éléments clés qui ont fait HAL restent en application aujourd’hui, même si la plateforme a beaucoup évolué. Une vérification de nature technique et réglementaire – notamment au niveau des métadonnées des articles – garantit l’accessibilité et l’utilisation par tout utilisateur, un travail important est effectué régulièrement pour rendre l’interface plus intuitive et faciliter les dépôts d’articles, la plateforme s’est interfacée avec d’autres bases de données, et des portails dédiés aux thèses ou aux sciences humaines et sociales ont été développés… ​​« Objet complexe », HAL s’articule aussi avec les plateformes Episciences qui héberge des revues scientifiques en libre accès et SciencesConf qui facilite l'organisation de rencontres scientifiques (voir encadré).

  • 1CNRS/Inria/INRAE.
  • 2Centre de calcul de l'Institut national de physique nucléaire et de physique des particules (CNRS).

L’écosystème de HAL

Outre HAL, le CCSD héberge deux plateformes au service des chercheurs et chercheuses. SciencesConf facilite l'organisation de colloques, workshops ou réunions scientifiques, de la création du site web de l’événement à l’édition automatique des actes du colloque (à déposer sur HAL), en passant par la gestion des contributions et des inscriptions. Plus de 9000 conférences ont déjà bénéficié de ce service.

Episciences propose un modèle original de revues scientifiques : gratuits pour les lecteurs comme pour les auteurs, les épi-journaux rassemblent des articles déposés en archive ouverte d’abord puis évalués par les pairs, toutes les versions restant accessibles par la communauté scientifique sur HAL, arXiv, Zenodo, etc. « Cela confère un contrôle total aux scientifiques avec des publications librement accessibles et un coût de publication très faible », explique Nathalie Fargier. Pour améliorer encore le système, le CCSD travaille avec des services de peer-review extérieurs comme Peer community in et renforce sa participation à des projets internationaux comme OpenAireNexus qui intègre Episciences dans le catalogue de services EOSC. « Le chemin vers un accès ouvert global passe par les archives ouvertes telles que HAL mais aussi par d’autres voies : les initiatives d’édition en accès ouvert, comme Episciences ou encore le Centre Mersenne et OpenEdition, sont ainsi également soutenues par le CNRS », précise Sylvie Rousset.

« Un travail constant est de plus effectué sur l'affiliation institutionnelle, une notion à laquelle les fondateurs étaient très attachés », ajoute la directrice du CCSD. Il s’agit de rattacher un nom de scientifique à la bonne institution mais aussi de gérer les acronymes ou les différentes appellations d’un même organisme dans le temps, un suivi « indispensable avec les réorganisations régulières des structures de l’ESR ». Un service de CV automatisé peut ensuite être proposé aux chercheurs et chercheuses qui déposent leurs articles dans HAL, ces derniers étant alors préservés sur le long terme grâce à un accord avec le Centre informatique national de l’Enseignement supérieur (CINES) à Montpellier.

Un enjeu national et international

Car, comme la recherche, la science ouverte se construit dans la durée. Depuis 2006, un protocole puis une convention engagent 25 partenaires institutionnels français3  à mettre en œuvre une politique incitant leurs scientifiques à déposer leurs documents en texte intégral dans les archives ouvertes, notamment dans HAL. L’archive est aussi identifiée comme un acteur majeur dans les deux plans nationaux en faveur de la science ouverte de 2018 et 2021, suites de la loi pour une République numérique de 2016, favorisant la dissémination de la question du libre accès aux résultats de la recherche. Depuis 20194 , le compte rendu annuel d'activité des scientifiques du CNRS (CRAC) est ainsi alimenté automatiquement et uniquement par les dépôts dans HAL. « Depuis 2018, le CNRS a lancé une politique de science ouverte offensive, avec un objectif de 100 % des publications disponibles en accès ouvert. », éclaire Sylvie Rousset, directrice des données ouvertes de la recherche au CNRS : « Pour y parvenir, il ne suffit pas de convaincre, il faut aussi mettre en place de fortes incitations, voire des obligations, avec un accompagnement suffisant. Le dépôt des publications dans HAL, sous forme de notices d’abord et aujourd’hui de texte intégral, a pour but de partager au mieux les connaissances scientifiques et offre au CNRS une vision globale de l’ensemble des productions scientifiques de ses chercheurs et chercheuses. »

HAL, service aux scientifiques, devient donc petit à petit l’archive ouverte nationale. Un modèle atypique dans le monde, mais reconnu dans la feuille de route des infrastructures de recherche françaises et confédérée au niveau mondial dans la confédération internationale des archives ouvertes (COAR) qui regroupe 154 membres et partenaires.

  • 3L’Agence de mutualisation des universités et établissements (AMUE), la Conférence des présidents d’université (CPU), la Conférence des grandes écoles (CGE), ainsi que 22 établissements.
  • 4Les prépublications sont prises en compte depuis 2020.

Une gouvernance partagée pour un enjeu global

Face au développement de la science ouverte, un enjeu majeur concernant tous les acteurs de la recherche, le Comité pour la Science Ouverte a souhaité ouvrir la gouvernance du CCSD à d’autres institutions que les tutelles historiques, et aux chercheurs et chercheuses. En complément de comités de travail regroupant des représentants d’utilisateurs comme CasuHAL, quatre instances ont ainsi été mises en place.

Gouvernance de HAL

L’année 2020-21 aura été une « année charnière », selon Nathalie Fargier. Répondant au souhait des partenaires d’être mieux reconnus comme parties prenantes de ce levier de la science ouverte, le CCSD a présenté son nouveau modèle de gouvernance et de financement de HAL, un véritable « changement d’échelle » et la dernière étape en date pour rendre la recherche française plus ouverte et davantage visible à l’international. Une gouvernance et un pilotage plus partagés, avec la création de quatre conseils et comités (voir encadré), devraient notamment permettre de relayer les attentes de tous, au-delà des tutelles et jusqu’aux scientifiques mêmes. « Il n’y a aucun désengagement de la part des tutelles historiques dont le CNRS, mais nous mettons en plus en place une cotisation forfaitaire annuelle pour les établissements dotés d’un portail institutionnel », explique Nathalie Fargier. Le dépôt restant gratuit pour les scientifiques, ces nouvelles conditions doivent assurer à la plateforme un support pérenne et une vision des ressources à plus long terme, tout en restant avantageux pour les établissements qui mutualisent les coûts d’une telle archive ouverte et de ses différents services. « Nous proposons ainsi aux établissements qui possèdent des portails de devenir de véritables partenaires et de participer à l’évolution de la plateforme, plutôt que d’être de simples utilisateurs », résume Sylvie Rousset. Une « décision collective » du Comité pour la Science Ouverte (CoSO). Rattaché directement à la Directrice générale de la Recherche et de l’Innovation, le CoSO est l'instance décisionnelle dont la mission est de définir une politique de science ouverte et d’en assurer le développement à l’échelle nationale et internationale. En soutien à l'ouverture des publications et au partage des données de la recherche, elle doit permettre de « développer les archives ouvertes pour le bien commun tous les acteurs ».

S’ouvrir au-delà des publications

D’autres sources de financement complètent les investissements des tutelles, du Ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation, et les cotisations des établissements, comme les appels à projet du Fonds national pour la science ouverte ou l’appel à manifestation d’intérêt EquipEx+ du Programme d’investissements d’avenir (PIA). Lauréat de ce dernier, le projet HALiance vise une refonte des services de la plateforme qui s’alignera sur les bonnes pratiques internationales, notamment au niveau de l'interfaçage avec d’autres plateformes. Il pourra automatiser la collecte ciblée de contenus en texte intégral pour proposer au scientifique leur intégration dans HAL. Une meilleure articulation avec les services fournissant des identifiants numériques uniques et pérennes aux chercheurs et chercheuses, comme ORCID, sera nécessaire.

« Nous avons deux priorités pour les années à venir, conclut Nathalie Fargier : augmenter le taux de documents disponibles en texte intégral sur HAL, et consolider les liens entre les publications et d’autres produits de la recherche comme les données et les logiciels. » En somme, s’inscrire dans la dynamique actuelle de l’ouverture des données de la recherche au sens large, pour mieux répondre comme toujours aux attentes des utilisateurs.