Bibliothèques : ancrer la préservation des logiciels. Entretien avec Julien Roche (président de Liber) sur le rôle des bibliothèques
Les bibliothèques font progresser l’enseignement, la recherche et l’apprentissage en fournissant des ressources, en facilitant la découverte et en offrant des conseils spécialisés. Le code source des logiciels devenant de plus en plus central dans la recherche contemporaine, les bibliothèques doivent soutenir les chercheurs et chercheuses qui travaillent avec ces codes. Dans cette série d’entretiens, des professionnels partagent leur approche des logiciels de recherche.
Imaginez une tour de Babel, mais au lieu du chaos et de la confusion, elle symbolise la collaboration et la compréhension. Cette image apparemment paradoxale résume parfaitement la mission de la Ligue des Bibliothèques Européennes de Recherche (Liber).
L’association rassemble ainsi plus de 400 bibliothèques nationales, spécialisées et universitaires provenant de 40 pays différents. En juillet 2022, Julien Roche devient président de Liber, après en avoir été vice-président pendant quatre ans. Conservateur des bibliothèques, J. Roche est le premier professionnel français à occuper cette fonction. Il est également directeur des bibliothèques universitaires et Learning center de l’Université de Lille, où il occupe aussi les fonctions d’administrateur des données, algorithmes et codes de la recherche (ADAC). Julien Roche nous fournit des éclairages sur les axes de travail de Liber ainsi que sur les évolutions que connaît aujourd’hui le métier de bibliothécaire.
“ Si les initiatives nouvelles et émergentes ont besoin de compétences singulières et de pionniers motivés, les bibliothèques inscrivent leur action à une autre échelle de temps, plus pérenne, dépassant ainsi la question des personnes pour ancrer la pratique dans un fonctionnement institutionnel. ”
“ Les bibliothécaires sont de fait les professionnels les mieux placés pour s’emparer du sujet des codes et logiciels sous l’angle du signalement, de la diffusion, de la préservation et de la curation. ”
“ Codes sources et logiciels constituent assurément des collections comme les autres, qu’il s’agit de conserver, de rendre accessibles et de partager sur le long terme avec les « lecteurs » du monde entier. Un vrai travail de bibliothécaire en somme ! «
Quelles sont les priorités de votre mandat à Liber ?
Tout d’abord, rappelons que le champ d’action de la Ligue des bibliothèques européennes de recherche (Liber) ne concerne pas uniquement les bibliothèques de recherche : il s’étend aux bibliothèques publiques dotées d’une dimension recherche comme aux bibliothèques nationales. Les membres de Liber appartiennent aux pays du conseil de l’Europe. La France et l’Allemagne fournissent les plus gros contingents d’adhérents.
Un enjeu particulier de ma mandature est de prendre en compte la pluralité des pays représentés au sein de Liber, et partant leur diversité : tous les pays ne bénéficient pas des mêmes moyens et ne connaissent pas le même état d’avancement en matière de bibliothèques, de documentation ou encore de science ouverte. Or, mon rôle est de m’assurer que l’ensemble des membres puissent trouver leur place dans une approche européenne sinon intégrée, du moins articulée. Cette dimension se traduit dans la composition même du conseil d’administration de Liber qui réunit des établissements de grande comme de petite taille. L’un des enjeux de cette mandature est également de “digérer” notre stratégie 2023-2027, qui se déploie selon trois axes principaux : engaged and trusted hubs, state-of-the-art services et advancing open science. Au-delà de cette stratégie, Liber a fortement élargi son portefeuille d’activités ces dernières années, via notamment la programmation d’événements : il y a une quinzaine d’années, le congrès annuel rassemblait environ 200 personnes. Désormais, c’est plus du double. Liber propose aussi des master classes, un événement de mi-année (Winter event), des séminaires filés sur une durée de deux ans à destination des cadres aspirant à prendre une direction de bibliothèque, des « journées » pour les directeurs, ou encore des webinaires en collaboration avec des acteurs variés comme LA Referencia ou encore l’UNESCO.Enfin, la notoriété de Liber est forte et nous amène à travailler régulièrement avec d’autres acteurs, en Europe, à travers par exemple des dispositifs comme l’EOSC (European Open Science Cloud) ou la plateforme ORE (Open Research Europe), et au-delà.
Quels sont les atouts des bibliothèques pour faire évoluer la place du logiciel dans l’écosystème académique ?
C’est assurément la science ouverte, et notamment le 2e plan national pour la science ouverte (PNSO2), qui, en France, a permis de faire connaître le sujet au-delà des communautés averties, qui pratiquent le logiciel depuis longtemps (en sciences informatiques bien sûr, mais aussi dans les autres disciplines scientifiques, je pense à l’histoire notamment). C’est par ce biais qu’il est arrivé aux oreilles des bibliothèques, qui y sont encore peu sensibilisées, contrairement aux données de la recherche, qui nous occupent beaucoup actuellement.
Les atouts des bibliothèques sont les mêmes que pour les autres sujets émergents en matière de soutien à la recherche et de science ouverte. Tout d’abord les bibliothèques inscrivent les enjeux de science ouverte sur le temps long, elles “institutionnalisent” les sujets. Si les initiatives nouvelles et émergentes ont besoin de compétences singulières et de pionniers motivés, les bibliothèques inscrivent leur action à une autre échelle de temps, plus pérenne, dépassant ainsi la question des personnes pour ancrer la pratique dans un fonctionnement institutionnel. Et c’est ce dont les codes et logiciels ont aujourd’hui besoin : après une phase principalement militante, élargissement et pérennisation passent par la mobilisation durable des acteurs clefs de la science ouverte, dont font partie les bibliothèques.
De plus, logiciels et données présentent une forme de parenté. D’ailleurs les logiciels ont longtemps été confondus – à tort – par les non-spécialistes avec les données. Or, les bibliothèques sont positionnées comme des services clés de l’accompagnement autour des données. Les professionnels de l’information interviennent en effet à de nombreux niveaux : si certains sont administrateurs des données, algorithmes et codes, si d’autres coordonnent des ateliers de la donnée, toutes les structures documentaires de l’enseignement supérieur et de la recherche hébergent des services de soutien à la recherche. Enfin, et c’est peut-être le point le plus important : les bibliothécaires ont une culture forte dans le domaine de la création et de la curation des métadonnées et des identifiants. Or, les sujets actuels en matière de codes et logiciels gravitent justement autour de ces questions. Les bibliothécaires sont de fait les professionnels les mieux placés pour s’emparer du sujet des codes et logiciels sous l’angle du signalement, de la diffusion, de la préservation et de la curation. C’est d’ailleurs sous cet angle du signalement qu’on peut aujourd’hui intéresser l’ensemble de la communauté des bibliothèques au code. En ce sens, le travail mené par Software Heritage auprès du CCSD et de HAL est très heureux, car ce sont les bibliothécaires qui animent et font vivre HAL aujourd’hui.
La question de la légitimité des bibliothécaires revient souvent dès lors qu’on évoque les services aux chercheurs et a fortiori lorsqu’il s’agit d’un sujet comme le logiciel. Quel positionnement les professionnels de l’information peuvent-ils adopter?
La légitimité arrive après coup, elle ne se décrète pas. Il faut avoir fait la démonstration de son utilité. Aux débuts de l’accès ouvert, les bibliothèques n’étaient pas perçues comme des services pivots alors qu’aujourd’hui c’est le cas. Cette légitimité est en cours de construction dans le domaine des données. Par exemple, les Ateliers de la donnée intègrent ou reposent en grande partie sur des services documentaires. Les bibliothécaires sont aussi en bonne position pour accompagner l’appropriation par les chercheurs de l’entrepôt pluridisciplinaire de données Recherche Data Gouv.
Le logiciel et les codes sont apparus plus récemment dans les préoccupations des décideurs de la recherche. En France, il faut attendre le PNSO 2 ; et encore, le sujet reste largement à défricher. Actuellement, le logiciel n’est de fait pas encore pleinement pris en charge au niveau institutionnel par les établissements. A Lille, le schéma directeur du numérique et le travail sur les identifiants sont en cours d’écriture. Un travail a été mené par ailleurs pour poser les principes de gouvernance des données, algorithmes, codes de la recherche, qui est en cours de validation. Au-delà de mon investissement comme ADAC en pilotage de ce travail, les bibliothèques sont très présentes dans les actions menées. Or un axe du schéma est dédié aux codes source et logiciels. Le sujet tend donc à être institutionnellement identifié et les acteurs commencent à s’en emparer.
Dans le domaine du logiciel, les bibliothèques n’ont pas forcément vocation à devenir systématiquement les services porteurs de ces problématiques, mais même dans cette configuration, elles ont un rôle majeur à jouer compte tenu de leur capacité à institutionnaliser les sujets dont elles se saisissent. Ainsi, à l’Université de Lille, une cellule opérationnelle ADAC a été créée, qui s’appuie fortement sur les compétences des bibliothèques et de notre Atelier de la donnée LORD. Le schéma lillois n’est certainement pas universel, mais il est vertueux et pertinent en ce sens qu’il met en dynamique tous les acteurs, ici autour des bibliothèques qui se saisissent aujourd’hui du sujet, comme cela a été le cas pour les données il y a quelques années.
Le travail de sensibilisation au logiciel appelle une approche différente de celle adoptée pour les données dans la mesure où si quasiment tous les acteurs de la recherche sont conscients de produire des données, il n’en va pas de même des logiciels. Actuellement, les spécialistes que sont les chercheurs en informatique sont les plus mobilisés, mais la prise de conscience est faible si l’on s’éloigne des cercles les plus informés. Le logiciel est encore trop assimilé à un enjeu disciplinaire, sujet limité aux chercheurs en informatique. Les forges logicielles sont peu connues des non-développeurs et les outils de l’ingénierie logicielle ne sont pas bien identifiés. Or l’une des forces des bibliothécaires est de pouvoir comprendre et donc faire comprendre les enjeux du code et le rôle des outils associés auprès des autres disciplines, qui utilisent du code sans le savoir. Sans doute une raison supplémentaire de mobiliser les bibliothèques sur le sujet.
Comment faire évoluer les perceptions des différents acteurs avec lesquels les bibliothèques universitaires doivent collaborer quand il s’agit du logiciel ?
Il appartient à chaque université et à chaque organisme national de recherche, autonome, de déterminer l’organisation optimale pour ses besoins. Au sein des universités, il existe assurément des territoires vierges à occuper pour les bibliothèques. Par « vierges », j’entends non pris en charge de manière raisonnée au niveau de l’établissement. C’est le cas je pense en matière d’algorithmes, codes et logiciels. Il y a un travail important de sensibilisation des décideurs qui nécessite une attitude proactive. Il s’agit d’identifier des besoins non comblés et de démontrer comment la bibliothèque, si elle décide de s’en saisir, peut contribuer à y répondre.
Les services documentaires bénéficient de moyens budgétaires et humains importants, qui leur permettent de faire évoluer leur offre de service au gré des mouvements de personnels, des opportunités de financement, et de l’évolution de l’offre de formation des professionnels. Dans un monde de l’enseignement supérieur et de la recherche en mutation permanente et rapide, l’enjeu est de réorganiser en continu les missions des bibliothèques et donc les profils des bibliothécaires pour nous permettre de faire évoluer notre activité vers d’autres secteurs. Les grandes bibliothèques de recherche européennes ont su repositionner leurs moyens pour mettre l’accent sur les données ces dernières années. Ce travail est à venir pour le logiciel, pour les bibliothèques qui voudront bien s’en saisir. Cette priorisation des activités est essentielle pour développer des services de manière soutenable, dans un monde où l’évolution des missions des bibliothèques est quant à elle inéluctable.
Reproductibilité de la recherche, intelligence artificielle: les bibliothèques sont confrontées à des thématiques qui nécessitent un panel de compétences très spécialisées. Face à la diversité des options possibles en termes d’offres de services, comment conserver une offre de services lisible pour sa gouvernance comme pour ses usagers ?
Sur le plan de l’offre de services, les bibliothèques sont passées en quelques décennies d’un champ d’intervention limité aux collections matérielles et aux espaces à une offre de services couvrant des secteurs très divers. Aujourd’hui, l’offre de services est en effet large et se déploie tant en matière d’espaces physiques que dans le domaine du numérique. Et c’est bien là le défi auquel nous devons faire face en bibliothèques universitaires : si les statistiques de fréquentation des bibliothèques universitaires rivalisent chaque année, même après la crise COVID, avec celles de grandes institutions culturelles, les services en ligne sont également de plus en plus plébiscités et absorbent quantité de ressources : les bibliothèques doivent donc continuer leurs efforts en matière de services tant physiques que numériques.
Lorsque l’on étend le spectre des activités d’un service, la question de sa légitimité dans son nouveau domaine d’intervention vient toujours dans la discussion à un moment ou à un autre, et c’est une bonne chose. Il y a une dizaine d’années, les bibliothèques n’étaient pas vues comme légitimes en matière de données ou encore de pédagogie. Aujourd’hui, la question se pose en matière de codes et logiciels, ou encore dans le domaine de l’appui au pilotage de la recherche. Sur tous ces sujets, notamment sur les plus émergents pour les services documentaires, il faut en permanence, à toute occasion et à tous les niveaux, rendre la plus-value des bibliothèques compréhensible par les acteurs de la recherche et par les décideurs universitaires : par exemple, les bibliothécaires sont bien placés pour alimenter et exploiter des outils d’aide à la décision compte tenu de leur expertise en matière de standardisation des données, de métadonnées ou encore de gestion des identifiants. Or les décideurs ont besoin de base de données régulièrement alimentées, propres, documentées, requêtables et interopérables. Présenter la bibliométrie sous cet angle permet de rendre l’apport du bibliothécaire compréhensible hors du seul cercle professionnel et ainsi de légitimer le rôle des bibliothèques dans son nouveau champ de compétence. Ce sera j’en suis sûr la même chose pour les codes et logiciels, pour les bibliothèques qui voudront s’en saisir.
Dernier point notable. Les bibliothécaires se forment et s’auto-forment, beaucoup et régulièrement. Dans un environnement professionnel en mutation rapide, c’est un atout indéniable, qui alimente la mise à jour régulière de l’offre de service, accompagnant et parfois même devançant les besoins de la communauté scientifique, dans une démarche pertinente car prospective.
Si vous deviez parler à un.e autre directeur.rice de bibliothèque, comment lui décririez-vous l’apport de Software Heritage pour son service?
Je ferais le lien avec un sujet au cœur de notre identité de bibliothécaire : les collections. Qu’est-ce qu’une collection documentaire ? C’est un ensemble organisé de contenus, constitué de manière raisonnée et sur le long terme, ancrée dans un héritage, appuyée sur des usages et inscrite dans une dynamique prospective. Software Heritage ne fait pas autre chose avec sa bibliothèque universelle de logiciels. Codes sources et logiciels constituent assurément des collections comme les autres, qu’il s’agit de conserver, de rendre accessibles et de partager sur le long terme avec les « lecteurs » du monde entier. Un vrai travail de bibliothécaire en somme !
S’appuyer sur Software Heritage, une infrastructure dédiée au logiciel
Au même titre que les publications, le logiciel constitue un produit de recherche essentiel, et il est donc indispensable d’assurer sa préservation et son référencement, ce qui fait partie des missions fondatrices des bibliothèques de recherche et des archives.
• En vous appuyant sur l’offre de services développée par Software Heritage, mettez à la disposition de votre communauté académique des services conçus spécifiquement pour le logiciel. Préserver te référencer les codes sources des logiciels, qui sont de la connaissance exécutable, est une tâche complexe. Software Heritage est une infrastructure pilotée par des spécialistes.
• Vous pouvez aussi soutenir financièrement Software Heritage et contribuer ainsi au développement d’une infrastructure unique car spécialement conçue pour cette mission. Software Heritage est pleinement intégrée dans l’écosystème européen de la science ouverte. En rejoignant l’Archives & Libraries Interest Group, bénéficiez d’un accompagnement pour étendre le domaine d’action de la bibliothèque.
À venir
Restez connecté pour découvrir la suite de notre série d’interviews avec des bibliothécaires.
• Comprendre le rôle des bibliothèques dans la construction du pilier logiciel de la charte institutionnelle pour la science ouverte à l’Université Sorbonne Paris Nord.
• Découvrir comment les bibliothécaires de l’Université Grenoble Alpes collaborent avec les ingénieurs en développement logiciel et les chercheurs autour de la préservation des logiciels.
• Apprendre comment et pourquoi les bibliothèques doivent soutenir les infrastructures de science ouverte, avec Cécile Swiatek Cassafieres de l’Université Paris Nanterre.