Le premier atelier de discussion sur les bots du HN Lab a rassemblé l’équipe du HN Lab et six chercheurs·euses en sciences humaines et sociales, qui ont pour point commun d’avoir créé un ou plusieurs bots.

Pour rendre compte des riches conversations qui ont eu lieu, il faut commencer par un bref portrait de groupe de ces robots et de leurs collaborateurs humains. À quels genre de bots avons-nous affaire ? Dans ce billet, je vous propose une esquisse de typologie, et un premier tour d’horizon des bots dont nous avons discuté.

Robots-assembleurs

D’abord, on a les robots-assembleurs. Ceux-là prennent des pièces détachées et les combinent dans de nouveaux assemblages qui nous surprennent par leurs combinaisons aléatoires. Taquins, ils mettent en évidence le caractère répétitif, quasi mécanique de certaines de nos façons de penser.

Le Bot Injonction est né à l’occasion d’un colloque intitulé “Les injonctions dans les institutions culturelles”. Actif sur Twitter, il parodie les titres des journées d’étude, colloques et autres rapports sur le numérique et nous fait réfléchir à l’omniprésence des injonctions sur le numérique dans le monde culturel et les médias. Il assemble aléatoirement des bouts de phrases usés jusqu’à la corde, pour créer des titres qui sonnent plus vrais que nature aux oreilles de celles et ceux qui connaissent le monde culturel : vous vous souvenez du colloque “L’application mobile gamifiée au service des touristes 2.0 : pour une institution culturelle partagée” ? Et cette fameuse journée d’étude “L’exposition virtuelle ludique au service de la génération Z : vers une institution culturelle tiers lieu”, c’était révolutionnaire, n’est-ce pas? Les créateurs du BotInjonctions sont Eva Sandri, maitresse de conférence en science de l’information et de la communication à l’université Paul-Valéry Montpellier, et Sébastien Appiotti, maître de conférence en communications au CELSA, Sorbonne Université.

Quelques tweets du @botinjonctions

Quelques tweets du @botinjonctions

Tous deux avouent avec plaisir s’être inspiré du BotInfocom, créé par Antoine Courtin. Antoine Courtin est chargé de développement des ressources numériques du Centre de Ressources et de Recherches du musée d’Orsay et du musée de l’Orangerie Valérie Giscard d’Estaing, et maitre de conférence associé à l’Université Paris Nanterre. Le BotInfocom, également actif sur Twitter, parodie des titres d’articles ou de conférence en information et communication en combinant noms de philosophes, mots-clés à la mode et concepts passe-partout. L’idée est venue en lisant des programmes de conférence dans le domaine de l’information et de la communication. Antoine Courtin raconte le moment de création :

“On s’est rendu compte que tous les titres avaient la même structure, c’était un verbe, un philosophe que je n’ai jamais lu, deux points, et une structure. C’est très caricatural, mais ce côté systématique m’a fait rire.”

Pour composer ses titres, le bot — qui a été désactivé par son auteur après plusieurs années de loyaux services — se servait dans une liste de variables qui sont les pièces détachées à assembler (noms, verbes, adjectifs, …). La liste était elle-même alimentée par plusieurs chercheur·e·s, dans une logique collaborative. On se délecte des “Redécouvrir Simondon à l’heure du web 3.0 : pour une archéologie numérique des principes de l’hypertexte” et autres “Explorer Stiegler à l’aube du web 3.0 : pour une archéologie numérique des affordances” parce qu’ils sonnent vrai, mais c’est dans la répétition que le BotInfocom devient troublant : tous les titres sonnent vrai et sont interchangeables, la créativité des chercheurs·euses en Infocom est-elle réellement si limitée?

Robots-vitrines

Ensuite, il y a les robots-vitrines. Ils mettent en valeur des matériaux qui existent déjà ailleurs (par exemple, des collections patrimoniales, des bases de données, des corpus). Comme une vitrine, ils mettent en valeur un élément sorti de sa collection, et attirent l’œil du public en y pointant un éclairage particulier — et éphémère. Le bot @memo_guerra_bot, par Alix Chagué, publie les noms des victimes de la guerre d’Espagne et du franquisme. Il remédie ainsi, sur Twitter, la liste de victimes compilée par l’Associación pra la recuperación de la memoria histórica. De la même manière, le bot Envois de Rome tweete des travaux envoyés chaque année à Paris par les pensionnaires de l’Académie de France à Rome, peintres et sculpteurs entre 1804 et 1914, recensés dans la base de données AGORHA. Antoine Courtin souligne que ce genre de bot prolifère dans le monde culturel, où ils apparaissent notamment au gré de la création d’API pour les bases de collection de musées. “Dès qu’un musée a une API, il y a un bot aléatoire qui va piocher dans ces œuvres.” Comme pour @BotInjonctions, ces bots ont été créés lors d’événements spécifiques — une conférence, un hackathon — qui deviennent alors l’occasion pour les chercheur·es d’explorer, de s’approprier et/ou de mettre en valeur ces bases de données.

Quelques tweets du @memo_guerra_bot

Quelques tweets du @memoguerrabot

Parfois, les bots-vitrines ne mettent pas en valeur une base de données qui existe déjà, mais sont l’occasion pour les chercheur·es d’explorer leurs propres données de manière différente. Mon propre bot, le premier d’une série de trois bots autour de l’œuvre de Franklin Ford, un journaliste et théoricien américain des médias de la fin du 19ème siècle, s’inscrit dans ce genre. Avec mon collègue Dominique Trudel, nous étions en train de rassembler les écrits dispersés de Ford dans une archive, quand nous avons créé en 2017 @franklinfordbot. Dans sa première version, le bot (qui a depuis été mis à jour pour privilégier un autre fonctionnement), allait piocher, dans l’ensemble du corpus que nous avions rassemblé, des phrases qui contenaient des mots-clés qui nous semblaient intéressants, parce qu’ils représentaient les thématiques susceptibles de faire résonner l’œuvre de Ford avec des enjeux de recherche et des enjeux historiographiques contemporains. Il les publiait ensuite à un rythme aléatoire.

Les mots-clés utilisés pour aller piocher des phrases dans le corpus des oeuvres de Franklin Ford, dans la première version du bot

Les mots-clés utilisés pour aller piocher des phrases dans le corpus des oeuvres de Franklin Ford, dans la première version du bot

Dans la logique de la vitrine, il s’agissait de mettre en valeur l’œuvre de Ford et notre travail (avec seulement une poignée d’abonnés à ses débuts, nous ne nous faisions toutefois pas énormément d’illusions à ce sujet), mais aussi de confronter deux modes de lecture : notre lecture rapprochée et linéaire des textes de Ford, et la lecture distante, aléatoire et automatique permises par le bot. L’éclairage permis par le bot-vitrine peut donc parfois prendre une valeur heuristique et contribuer à la (re)découverte : les bots-vitrines sont aussi des agents de sérendipité, qui viennent nous faire voir des choses que nous n’aurions pas vues autrement.

Robots-carrefours

Les robots-carrefours, quant à eux, font se croiser des choses dont les trajectoires seraient autrement restées séparées. Ils vont piocher dans des bases de données, des œuvres ou des corpus, et ils recombinent de manière surprenante. C’est le cas, par exemple, du @datavizBot d’Alix Chagué, qui est doctorante en humanités numériques à l’EPHE et à l’Université de Montréal. Ce bot vient titiller notre appétit pour les visualisations, et crée de manière aléatoire des graphiques qui font se croiser des jeux de données qui n’ont rien à voir les uns avec les autres. Un exemple ? La couverture de glace en Amérique du Nord et au Groenland (mesurée en millions de km carrés) rapportée à la taille du Président des États-Unis au moment de son élection (mesurée en centimètres).

Une création du @datavizBot

Une création du @datavizBot

Tout aussi délicieusement absurde, le bot de 7 lieux crée automatiquement des cartes avec… sept lieux. Ceux-ci sont des instances extraites de Wikidata, que le bot jette sur la carte après les avoir sélectionné de manière aléatoire. On se retrouve donc, par exemple, avec une carte de 7 cinémas ou de 7 musées du transport.

Le bot de 7 lieux

Le bot de 7 lieux

Avec ses bot, Alix Chagué revendique une certaine “impertinence” : ils ne sont pas nécessaires, ils ne répondent pas à un besoin, et c’est justement ce qui fait leur intérêt. Avec ces croisements absurdes, on n’apprend rien sur les données mais on assiste à une collision frontale des échelles, des contextes et du sens qui nous fait réfléchir au fait que les chiffres ou les cartes ne mentent pas, certes, mais qu’ils ne veulent pas toujours dire quelque chose. Résolument inutiles sur leur avant-scène, sur Twitter, ces bots ont toutefois des vertus pédagogiques en coulisses : le code des deux bots, publié sur Github, permet de comprendre, de manière assez simple et imagée, comment on construit un bot.

Le croisement de choses qui n’ont rien à voir les unes avec les autres est également présent dans mon deuxième bot incarnant Franklin Ford, qui œuvre quant à lui sur Reddit. Il s’agit d’une mise en abîme du pan de l’œuvre de Franklin Ford consacré à la circulation de savoirs spécialisés : pour Ford, à la fin du 19ème siècle, cela passait par l’existence de publications consacrées à certains secteurs d’activités économiques (publications aux titres évocateurs comme Grain ou Cotton). Remédiatisé au 21ème siècle, le savoir ultra-spécialisé circule dans la multitude de forums de discussions qui fleurissent sur Reddit, sorte de catalogue infini d’intérêts de niche. Pour faire s’entrechoquer les deux univers, notre bot a d’abord passé à la moulinette d’un algorithme de topic modeling toute l’œuvre de Ford, pour ensuite trouver quel topic (sous forme de cinq mots-clés) représente le mieux chaque paragraphe. Le vaillant robot cherche ensuite ces mots-clés sur Reddit, et publie le paragraphe correspondant en réponse au post jugé le plus pertinent sur le sujet. Est-ce pertinent ? Pas toujours de manière évidente, au sens que le bot n’offre pas nécessairement une contribution significative à la conversation. En revanche, il réussit à mettre en évidence la diversité des thématiques contemporaines avec lesquelles l’œuvre de Ford entre en résonance.

Un utilisateur de Reddit perplexe face à l'intervention de franklinfordbot, dans un fil de discussion intitulé "The search for truth in a post-truth society"

Un utilisateur de Reddit perplexe face à l’intervention de franklinfordbot, dans un fil de discussion intitulé “The search for truth in a post-truth society”

Robots-auteurs

Enfin, nous avons les robots-auteurs, ceux qui écrivent, parlent ou répondent. Si tous les autres bots mentionnés jusqu’ici travaillent à partir de matériaux, de textes ou de données existants — en les découpant et en les recomposant de manière originale — les robots-auteurs quant à eux vont produire du nouveau, souvent du nouveau texte. La dénomination de robot-auteur a été proposée durant l’atelier par Pierre-Carl Langlais, qui est chercheur post-doctorant pour le projet Numapresse. Par contraste avec les robots-lecteurs, terme par lequel il désigne les outils qu’il développe pour assister la lecture et la consultation de grands corpus (corpus de presse, les robots-auteurs vont générer du texte, et ce notamment grâce à la popularisation de certains outils de deep learning et d’intelligence artificielle. Ainsi, et toujours avec un côté ludique, Pierre-Carl Langlais a utilisé un modèle GPT-2 pour entraîner un bot à raconter des blagues, et en a entraîné un autre sur des fiches de Télérama pour créer un répertoire de films imaginaires. Décrites par leurs auteurs comme une expérimentation des limites de l’intelligence artificielle, et donc aussi une critique des discours suggérant que les robots vont tous nous remplacer, les créations de ces bots sont pour le moins fantaisistes.

Une blague générée par BlagueIA

Une blague générée par BlagueIA

Toujours avec GPT-2, le troisième bot du trio franklinfordbot est un agent conversationnel — ou chatbot — dont le modèle a été entraîné pour parler comme Franklin Ford. Sur le site du projet, une fenêtre en bas à droite invite les usagers à parler à Franklin Ford, et propose des réponses, chaque fois générées de manière unique, en réaction à ce que l’usager y inscrit. Ici aussi, il s’agit moins de faire un outil réellement efficace (les réponses sont parfois intéressantes, souvent absurdes) que de proposer une traduction incarnée dans des outils d’aujourd’hui des réflexions de Franklin Ford sur l’information personnalisée.

Fenêtre de chat pour parler à Franklin Ford

Fenêtre de chat pour parler à Franklin Ford

Alors, qu’est-ce qui rassemble les robots-assembleurs, les robots-vitrines, les robots-carrefours et les robots-auteurs ? Comment interagissent-ils avec leurs créateurs et avec leur public ? Dans des prochains billets, nous vous proposerons quelques réflexions sur le rôle que jouent tous ces bots dans les recherches en SHS.

Merci encore aux participant.es à l’atelier pour les discussions riches et stimulantes. Vous pouvez retrouver leurs travaux en ligne via tous les liens dans ce billet, et aussi ici sur Twitter, le terrain de jeu favoris des bots :