La chronologie de la création de l’ouvrage du programme HNSO

Dès le début du programme Huma-Num Science Ouverte (HNSO), et dans la lignée de la méthode utilisée par le groupe de travail GLIST1 de la TGIR Huma-Num, l’équipe du HN Lab a initié un travail de productions documentaires important avec la réalisation de 3 rapports scientifiques&nsp;:

  • Un guide de pratiques documentaires au sein du projet HNSO ;
  • Les spécificités du couple ISIDORE et NAKALA ;
  • Les référentiels ISIDORE et NAKALA.

Cette production documentaire s’inscrit dans une volonté de mettre en place un cadre de travail structuré, permettant de valoriser les savoir-faire dans un collectif et de bien en documenter les productions. En effet, depuis sa création, l’équipe du HN Lab met un accent important sur la documentation dans l’ensemble de ses projets, qui se concrétise notamment par une prise de notes systématique et exhaustive lors des réunions de travail et ateliers, par des compte-rendus structurés ou encore par des billets de blog explicatifs.

Sur les conseils de Jean-Luc Minel, présent sur le projet HNSO, est venue l’idée de réunir ces 3 rapports scientifiques dans un document global s’inscrivant dans une volonté d’aggrégation des savoirs et des connaissances à diffusion externe. L’équipe a fait le choix de la rédaction d’un ouvrage de type handbook, l’objectif étant de construire une réflexion globale participant à la création de nouvelles fonctionnalités pour les plateformes ISIDORE et NAKALA pouvant être partagée au delà de ces outils comme un exemple de méthodologie pour d’autres dispositifs socio-techniques.

Environnement du travail de rédaction

Le choix du support de rédaction s’est porté sur un environnement LaTeX (via la plateforme Overleaf) utilisant le modèle Cleanthesis, spécifiquement adapté à notre intention et permettant un rendu respectant les critères scientifiques.

Ouvrage

L’équipe du programme HNSO a adopté pour cet ouvrage une identité propre sous le titre : Propositions méthodologiques pour ISIDORE et NAKALA.

Il est important de rappeler que le programme HNSO avait été créé à l’origine pour « proposer une importante mise à niveau des services de publication et d’interopérabilité des données de la TGIR Huma-Num »2. Il a ensuite été recentré sur les plateformes ISIDORE et NAKALA. Par extension, cet ouvrage est proposé aussi comme une feuille de route générique pour :

  • Une vision d’un écosystème des données pour la science ouverte, basée sur un état de l’art approfondi du paysage disciplinaire ;
  • Une méthodologie explicite et reproductible (un protocole collaboratif de recherche) ;
  • Des recommandations fonctionnelles pour un écosystème des données générique, recommandations que nous avons implémentées en spécifications techniques pour ISIDORE et NAKALA.

La mise en œuvre de l’ouvrage suit le découpage en 4 “chantiers” prévus pour le programme dès le départ. Tous les chantiers ont été initiés au lancement du projet et sont menés en parallèle :

  1. Interconnexion entre les plateformes ISIDORE et NAKALA
  2. Évolution des plateformes ISIDORE et NAKALA
  3. Exploitation de ISIDORE et NAKALA
  4. Formation et accompagnement

La diffusion

L’ouvrage est d’ors-et-déjà accessible en édition continue sur le Web (hnlab.huma-num.fr/hnso/ouvrage-in/) et sera édité en PDF en version française et anglaise dès qu’une version 1 aura été finalisée.

siteweb

Page d’accueil du site Web de l’ouvrage

Édition single source publishing et intégration continue

La chaîne d’édition et de publication reprend les principes du single source publishing et de l’intégration continue. La source de l’ouvrage est au format LaTex, éditée sur la plateforme Overleaf et synchronisée sur un répertoire de l’instance Gitlab d’Huma-Num. Un script bash effectue une double conversion Pandoc, 1) des sources LaTeX vers le format intermédiaire Markdown, puis 2) du Markdown vers le HTML. Le script effectue quelques adaptations sur les .md et assure la cohésion de l’ensemble et de sa navigation selon un modèle HTML d’ouvrage web.

Accompagnement d’une base de références sous ZOTERO

L’ouvrage contient de nombreuses références. L’équipe projet a donc décidé de mettre à disposition de la communauté une bibliothèque ZOTERO contenant les références bibliographiques du l’ouvrage, taggées et classées par chapitres.

Le contenu de l’ouvrage

L’ouvrage présente un travail scientifique 1) d’état de l’art, 2) de comparaison avec d’autres initiatives internationales, et 3) de justification des choix proposés pour le programme HNSO.

Dans sa première version, l’ouvrage contient 11 chapitres répartis dans les 4 chantiers du programme.

  1. Introduction

    Ce premier chapitre contient une description du programme HNSO avec un rappel des objectifs dans le contexte de la Science Ouverte et des principes FAIR. Elle présente également une description des 4 chantiers du projet ainsi qu’un rappel de quelques notions théoriques autour des données de la recherche.

  2. Méthodes et outils de gestion documentaires

    Ce chapitre contient une description complète de l’écosystème de travail dans lequel l’équipe évolue. Il propose un processus de travail permettant de pouvoir gérer et de préserver l’ensemble des données en respectant le cycle de vie des données dans le projet. Cela inclut les outils numériques à utiliser pour écrire les rapports, communiquer et travailler de façon collaborative.

  3. Les pratiques de recherche et de dépôt des données

    Cette partie établit un état de l’art sur la gestion des données par les chercheurs en SHS avec un focus sur leurs pratiques en termes de stockage et de partage des données. Elle se base sur des études et enquêtes réalisées auprès de déposants et de chercheurs en France, dans d’autres pays de l’UE et aux USA. Cette partie apporte une vision ‘utilisateurs’ de plateformes de données de la recherche à prendre en considération dans l’évolution des services proposés par NAKALA et ISIDORE.

  4. Caractéristiques de quelques infrastructures de dépôt de données de la recherche

    Cette section établit un panorama de 3 types infrastructures de dépôts de données de la recherche: locale (e!DAL), nationales (DANS/EASY, UKData service) et européennes (CLARIN, CESSDA, ZENODO, Europeana). Chaque paragraphe décrit les fonctionnalités et services proposés par ces infrastructures aux chercheurs en SHS. Cette section permet de positionner les dispositifs NAKALA et ISIDORE dans le paysage d’infrastructures similaires existantes, sur les aspects fonctionnels, scientifiques et documentaires.

  5. Les plateformes ISIDORE et NAKALA

    Ce chapitre contient une description de l’architecture fonctionnelle de NAKALA et ISIDORE. Il s’agit d’un état des lieux technico-scientifique des services proposés par ces 2 dispositifs. On y retrouve une description des IHM et du fonctionnement de ces plateformes en lien avec le cycle de vie des données. Ces informations permettent de mettre en exergue les interconnexions existantes entre ces 2 plateformes, qui en font un écosystème de découverte des données unique au regard des autres infrastructures précédemment décrites.

  6. Réflexion pour l’exploration des usages de NAKALA et ISIDORE au sein des communautés SHS

    Ce chapitre n’est pas encore rédigé. Il est prévu d’y engager une réflexion sur la mise en place d’outils ou de méthodes d’investigation sur les plans quantitatifs et qualitatifs des usages des plateformes ISIDORE et NAKALA par la communauté d’utilisateurs ainsi que sur la mise en œuvre d’études des demandes et besoins principaux qui émergent de ces communautés, en vue d’établir une politique d’évolution des plateformes plus en adéquation avec ces communautés.

  7. Propositions de nouvelles fonctionnalités

    Cette section décrit la méthodologie et l’écosystème de travail mise en place pour proposer de nouvelles fonctionnalités dans les plateformes NAKALA et ISIDORE.

  8. Études des sources de données dans ISIDORE et NAKALA

    Ce chapitre n’est pas encore rédigé. Il proposera une étude des sources moissonnées par ISIDORE et un panorama descriptif des collections de NAKALA dans l’optique d’envisager une meilleure interaction entre les deux plateformes, en vue d’élaborer une politique de choix de sources.

  9. Référentiels, concepts, définition et administration

    Ce chapitre présente les principaux types de référentiels et les principes d’administration qui les régissent.

  10. Les référentiels utilisés par ISIDORE et NAKALA

    Ce chapitre décrit les référentiels exploités par ISIDORE et NAKALA. Il fait un état des lieux des référentiels utilisés dans ISIDORE avec une description généraliste de chaque référentiel et une analyse de leurs usages dans la plateforme ISIDORE.

  11. Administration des référentiels utilisés par ISIDORE et NAKALA

    Ce chapitre décrit les différentes procédures d’administration et d’utilisation des référentiels ISIDORE et NAKALA. Il contient notamment une description de la chaîne de traitement actuelle.

Cet ouvrage est toujours en progression, certaines sections doivent être complétées et de nouvelles sections pourront être intégrées.

  1. Groupe de travail au sein d’Huma-Num dit « cellule GLIST », génie logiciel et information scientifique et technique pour alimenter en réflexions et propositions le projet européen TRIPLE (European Commission n°863420) (voir les productions de GLIST telle que Building an Ontology to Specify the TRIPLE Data Model : Proposal for a Beta Version ou “We”: a Proposal for the TRIPLE platform sur Zenodo). 

  2. Baude, O. & Pouyllau, S. (2019). Projet HNSO, Réponse à l’AAP Fonds National pour la science ouverte