Les Acolytes de recherche pour utiliser l'IA dans ISIDORE
ISIDORE est une plateforme dédiée à la recherche en sciences humaines et sociales (SHS) permettant d’explorer une vaste collection de documents scientifiques. En utilisant ISIDORE, les chercheurs et les étudiants peuvent accéder à des articles, des thèses, des rapports, des livres, et bien d’autres types de documents.
La plateforme ISIDORE offre depuis 14 ans maintenant des fonctionnalités avancées de recherche, telles que la possibilité de filtrer les résultats par type de document, par date de publication ou par discipline, tout en permettant la recherche en texte intégral à travers les plusieurs millions de ressources qu’elle contient. De plus, ISIDORE propose des outils de visualisation et d’analyse des données, ce qui permet de mieux comprendre les tendances et les évolutions dans le domaine des SHS. En intégrant ISIDORE dans leur processus de recherche, les utilisateurs peuvent non seulement enrichir leurs travaux avec des sources fiables et pertinentes, mais aussi contribuer à la diffusion et à la valorisation de la recherche en SHS.
À l’heure de la généralisation des intelligences artificielles (IA), l’enjeu principal pour les chercheurs en SHS qui utilisent ces technologies réside dans le contrôle et la compréhension qu’ils peuvent - et doivent - en avoir. Dans cette perspective, l’assimilation systématique entre grand modèle de langue et société commerciale, par un phénomène d’antonomase classique dans les services des GAFAM, est particulièrement inquiétante : “Chat-GPT” vient désigner l’IA. Or, cette assimilation pose des problèmes éthiques profonds : partage des données et problèmes juridiques, méconnaissance des enjeux techniques sous-jacents, perte d’autonomie de l’individu, coût écologique, etc.
Le programme ISIDORE 2030 vise à la refonte du moteur de recherche par l’intégration de briques d’IA en son sein. Cependant, contrairement aux services développés par les GAFAM, Isidore 2030 entend remettre le chercheur au coeur du système de pilotage des IA grâce à trois concepts clefs : explicabilité des IA, interprétabilité des générations, adaptabilité des IA.
- Explicabilité : par l’articulation de méthodes de text-mining “classiques” (RI, classifications, régressions, clustering…) avec des méthodes d’IA, par la mise en évidence des paramètres, métriques, corpus.
- Interprétabilité : par le développement d’outils permettant de récupérer les sources sur lesquelles s’appuient les IA pour générer leurs réponses (RAG, notamment) et par l’usage de modèles frugaux et open-source.
- Adaptabilité : par le règlage fin (fine-tuning) de modèles d’IA à des tâches ou disciplines spécifiques. Ce fine-tuning peut également s’appuyer sur le profil du chercheur, à condition qu’il soit transparent et paramètrable par le chercheur.
Ainsi, à l’opposé de l’invisibilisation des processus socio-techniques qui sont à l’oeuvre dans les IA que nous côtoyons chaque jour, notre poster, présenté dans le cadre du colloque Humanitisca 2025 de Dakar (Sénégal), entend montrer l’évolution de notre réflexion sur le développement d’Acolytes de recherche adaptés et co-créés par les chercheurs en SHS.
Bibliographie
- POUYLLAU, S. (2024, octobre 4). ISIDORE 2030 : adapter les IA aux besoins de la recherche de documents et de données en SHS. Conférence au GF2i (GF2i), PARIS. HN LAB. https://doi.org/10.5281/zenodo.13892964
- POUYLLAU, S., FACI, A., SILVESTRE DE SACY, A., & MARONET, L. (2024). ISIDORE 2030 : de l’IA de traitement au Retrieval Augmented Generation pour les SHS (1.0). HN Lab. https://doi.org/10.5281/zenodo.14019295
- POUYLLAU, S. (2022). Refonder ISIDORE (2.0). Zenodo. https://doi.org/10.5281/zenodo.8086278
- SILVESTRE DE SACY, A., FACI, A., MARONET, L., & POUYLLAU, S. (2024). Note sur l’expérience de l’IA au sein de l’Huma-Num Lab (huma-num version) (1.1). ACFAS 2024 (ACFAS), Ottawa. HN Lab. https://doi.org/10.5281/zenodo.10846773
- POUYLLAU, S., MINEL, J.-L., CAPELLI, L., SAURET, N., BUNEL, M., BAUDE, O., JOUGUET, H., BUSONERA, P., & DESSEIGNE, A. (2021). ISIDORE celebrates its 10th anniversary. Zenodo. https://doi.org/10.5281/zenodo.5700008
- Silvestre de Sacy, A., Faci, A., Pouyllau, S., & Maronet, L. (2024, octobre 18). Pre-targeted-RAG - Retrieval Augmented Generation sur des groupes pré-ciblés de communautés d’articles de recherche. ColDoc, Université Paris-Nanterre. Zenodo. https://doi.org/10.5281/zenodo.13950650