Le programme Huma-Num Science Ouverte (HNSO) a démarré il y a maintenant un an. Dans ce billet, nous rendons compte, au nom de l’équipe qui a œuvré sur le projet au sein d’Huma-Num de sa progression à l’issue de cette première année.

Rappel des objectifs du programme HNSO

Le projet HNSO a démarré officiellement en février 2021. Il est financé par le Fond National pour la Science Ouverte du ministère de la recherche de l’enseignement supérieur et de l’innovation pour une durée de 36 mois. Il a pour objectif de réaliser une mise à niveau rapide des services de stockage et publication des données scientifiques NAKALA et ISIDORE.

Le projet est découpé en 4 chantiers principaux, menés parallèlement.

Chantiers 2021

Les 4 chantiers du programme HNSO

Constitution et organisation de l’équipe projet

La gouvernance du projet est assurée par la direction de la TGIR Huma-Num sous la surveillance de son conseil scientifique et de son comité de pilotage. La coordination du projet a été assurée en 2021 par l’équipe du HN Lab pilotée par Stéphane Pouyllau, avec le soutien de l’équipe projet qui regroupe les différents responsables de pôles d’Huma-Num.

Composition de l’équipe projet :

  • Gouvernance et pilotage du projet : Olivier Baude, Directeur de la TGIR Huma-Num
  • Suivi administratif & budgétaire, RH : Ariane Allet, Responsable du Pôle PAC
  • Chef de projet MOA : Stéphane Pouyllau, Ingénieur de recherche, Responsable du HN Lab
  • Cheffe de projet MOE en charge des données et des usages : Hélène Jouguet, Ingénieure d’études, Responsable du Pôle Données
  • Chef de projet MOE en charge des développements informatiques et numériques : Laurent Capelli, Ingénieur de recherche, Responsable du Pôle Accès, Chef de projet sur ISIDORE et NAKALA.
  • Ingénieur d’études : Adrien Desseigne, développeur informatique, Pôle Accès.
  • Ingénieure d’études : Mélanie Bunel, chargée des systèmes d’information documentaire, HN Lab.
  • Ingénieur-chercheur : Nicolas Sauret, HNLab.
  • Consultant spécialisé en systèmes d’information et TAL : Jean-Luc Minel, Professeur Emerite & Président du Conseil Scientifique d’Huma-Num

Avec la participation de Nicolas Larousse (Chef de projet MOE en charge de la dissémination nationale et internationale, Ingénieur de recherche, Pôle CONIC), Antoine de Sacy (Ingénieur d’études, Pôle Données, BNF Data Lab) et Adeline Joffres (Ingénieure de recherche, Responsable de la coopération internationale, Pôle CONIC).

Retroplanning de l’année 2021

Retroplanning 2021

Rétroplanning des étapes de travail de la première année du programme HNSO.

Méthodologie mise en œuvre

Depuis son démarrage en février 2021, l’équipe projet a progressivement installé une méthodologie spécifique et un environnement de travail informatique flexible permettant d’optimiser l’accessibilité et la circulation de l’information, pour favoriser les échanges au sein de l’équipe, et pour produire en continue les éléments de connaissances et de documentation.

De décembre 2020 à avril 2021, 3 séminaires de travail ont été réalisés avec l’ensemble de l’équipe projet. Les séminaires HNSO sont des réunions de travail et d’information régulières dont le but est de réunir l’ensemble des collaborateurs du projet afin de faire un point d’avancement du projet et de brainstormer sur la stratégie du projet.

Après la définition des grandes lignes de travail lors de ces séminaires, l’équipe projet a mis en place des ateliers de travail collectif, hebdomadaires, dans le but d’établir un Cahier des Clauses Techniques Particulières (CCTP) prospectif traduisant les principales orientations en fonctionnalités documentaires, techniques et informatiques. Nommés « ateliers CCTP », ce travail a mobilisé une partie1 de l’équipe projet de juin à la octobre 2021. Ils ont pour objectifs d’identifier des fonctionnalités à mettre à niveau ou à ajouter dans les plateformes NAKALA et ISIDORE.

Productions documentaires

En parallèle des séminaires et ateliers techniques, dès février 2021, l’équipe a initié la rédaction de rapports scientifiques qui ont pour objectifs de :

  • Réaliser une revue de littérature sur les thématiques abordées dans le cadre ce projet, c’est-à-dire la Science Ouverte et les principes FAIR, les pratiques des chercheurs en SHS sur leur gestion des données, ou encore l’étude des infrastructures numériques offrant des services similaires à NAKALA et ISIDORE ;
  • Établir un état de l’art technique des plateformes NAKALA et ISIDORE incluant l’exploration de leur atouts et faiblesses, sur les aspects documentaires, scientifiques et informatiques ;
  • Présenter la méthodologie mise en place pour définir et réaliser le projet HNSO.

Dès la fin avril 2021, l’équipe a choisi d’agréger l’ensemble de ces rapports scientifiques dans un document qui prend la forme d’un ouvrage de type handbook.

En complémentarité de cet ouvrage, le CCTP a été rédigé à partir des discussions et travaux, prenant la forme d’issues GitLab, créés lors d’ateliers pour accueillir la description des fonctionnalités qu’il serait intéressant de réaliser pendant le projet à la fois pour les développements back-end et front-end.

La réalisation technique de ces fonctionnalités suivra un planning prévisionnel en cours d’élaboration par le Pôle ACCES.

Perspective pour l’année 2022

En parallèle du ce travail conséquent de réalisation technique confiée à l’équipe de développeurs d’Huma-Num, les actions de l’année 2022 seront centrées sur trois principaux items :

  • La question des référentiels dans ISIDORE et NAKALA
  • La question des sources de données dans ISIDORE
  • La question de la formation des utilisateurs et utilisatrices des plateformes ISIDORE et NAKALA

Les référentiels

Sur la thématique des référentiels, plusieurs interrogations vont venir alimenter la réflexion et l’orientation du travail pendant lesquelles nous aborderons les problématiques suivantes :

  • Quels cycle de vie pour des référentiels d’enrichissement et de liage des données dans un moteur de recherche ?
  • Doit-on choisir des référentiels généralistes et/ou disciplinaires et comment les associer ?
  • Qu’apporte les référentiels actuellement présents dans ISIDORE/NAKALA aux utilisateurs ?
  • Les concepts associés aux documents sont-ils pertinents ? Quelles en sont les limites ?
  • Comment gérer les référentiels dans un moteur de recherche?

La réflexion sur l’évolution des chaînes de traitement pourra s’appuyer sur les expertises du pôle Accès et sur le travail réalisé dans le cadre du projet Revue 2.0

  • Doit-on ajouter ou supprimer certaines référentiels ?
  • Comment tirer profit des référentiels élaborés dans les grandes bibliothèques internationales ?
  • Quelles places donner aux méthodes en apprentissage profond (Deep Learning) sur les plans étiques, documentaires et scientifique?

referentiel-lcsh

Utilisation du terme statues provenant du référentiels LCSH en tant que concept de la chaîne d’enrichissement sémantique d’ISIDORE

Les sources de données

Sur la thématique des sources de données ISIDORE, nous envisageons un travail de cartographie approfondie des sources de données d’ISIDORE, associé à une exploration d’ajout de nouvelles sources. Ce travail vient compléter le travail du pôle Accès qui a développé une application Web de gestion des sources en 2021 et qui est en cours de mise en production.

liste-sources

Page d’accueil de la liste des sources alimentant la base de données ISIDORE. Il y a 9779 sources disponibles au 25 janvier 2022.

schema-identification-sources

Processus de sélection des sources pour la plateforme ISIDORE

La formation et l’accompagnement utilisateurs et utilisatrices

La création ou l’amélioration des fonctionnalités dans les plateformes ISIDORE et NAKALA implique une évolution des formations auprès de leurs utilisateurs et utilisatrices. Avec ses ANF et ses guides documentaires, la TGIR Huma-Num propose déjà un panel d’outils pour la formation. Par ailleurs, les groupes de travail internes Co-Tech et Co-Grid constituent également un accompagnement et un soutien important de la communauté utilisant les services Huma-Num.

Le programme HNSO participe au renforcement de ces actions de formation par la réalisation de nouvelles formations coordonnées par le pôle ACCES et le groupe de travail formation d’Huma-Num par le biais des correspondant MSH et des Consortiums.

  1. Ces ateliers ont réuni les pôles HN Lab, Accès, Données ainsi que Jean-Luc Minel en tant que consultant pour le programme HNSO.