Global ID, c'est quoi ?
Un répertoire qui contient des données pour à peu près 20 000 universités ou équivalents dans le monde, c'est bien. Malgré ses défauts, corrigeables, le WHED représente une masse importante d'informations. Mais l'idée derrière la création d'un identifiant global pour ces institutions a commencé à émerger justement parce que cela ne suffisait pas. Je le sais, j'ai fait partie du groupe qui a imaginé cet identifiant à son démarrage. Cela a donné, bon an mal an, le Global WHED ID que gère également l'AIU.
Un point de langage avant de continuer : comment appeler les établissements d'enseignement supérieur (HEI en anglais) qu'on pourrait acronymiser par EESR en français ? Je les appellerai ici des universités pour simplifier, en m'appuyant sur une approche universaliste incluant tout ce qui est lié à l'enseignement supérieur et à la recherche, quels que soient les statuts. Les universitaires purs et durs me pardonneront, si c'est possible, cet écart de langage. Je ne suis pas moi-même un sorcier de sang pur refusant les moldus ou les sang-mêlés. N'oubliez quand même pas ce point de langage, car il a de l'importance, aussi pour le Global ID qui a tendance, lui, à se focaliser sur les vraies universités.
Un identifiant - global ou pas - c'est un moyen simple pour identifier de manière unique une entité (individu ou organisation), ou une partie d'entité, ou même un regroupement d'entités. Avec un identifiant on établit une bijection ou une relation 1 pour 1 entre une population et une table d'identifiants. La population, d'une part, est composée d'entités décrites par des données multiples et variées (comme leur nom ou leur localisation) mais doivent partager au moins une caractéristique commune pour éviter de mélanger des choux et des carottes : Par exemple des produits accessibles dans un magasin (choux, carottes et ordinateurs par exemple), un entrepôt ou une bibliothèque ; ou des flashcodes qui renvoient sur une URL, une adresse sur l'Internet, à visiter. Les identifiants sont codés et analysables : Les codes-barres qui ornent les emballages des produits sont codés d'une manière claire, compréhensible et avec les mêmes règles pour tous les produits ; les flashcodes sont identiques (mais une petite partie est personnalisable) et les URL obéissent à des règles définies depuis des lustres par les autorités qui gouvernent l'Internet.
Inventer un identifiant - global - pour les universités, au sens où je les ai nommées, c'est une affaire plus complexe, pour plusieurs raisons :
- les universités sont vivantes : elles naissent, s'agrandissent, se scindent, se regroupent, changent de statut, développent des composantes qui deviennent autonomes, gagnent ou perdent des accréditations globales ou partielles. Elles changent aussi de nom, de lieu principal, voire même de pays ou d'entité régionale. Un identifiant doit donc capter ces différentes situations et leur historique, la mémoire de leur vie passée, ne serait-ce que pour accompagner les étudiants et les enseignants qui sont passés par là auparavant. La durée de vie d'un tel identifiant doit être longue entre un étudiant, un alumni et un prix Nobel des dizaines d'années plus tard.
- les universités sont de tailles et d'importances très diverses et difficilement comparables sans avoir plus de critères : entre une "petite" école supérieure à une centaine d'étudiants et une "grande" université indienne ou chinoise à plusieurs centaines de milliers, les écarts sont énormes. Un seul identifiant codé de la même manière offre à la fois l'avantage de traiter à égalité toutes les universités, dans une louable notion de solidarité, et l'inconvénient d'être mal perçu par les établissements qui se perçoivent comme plus importants que les autres. Cela joue encore plus quand il s'agit de réputations ou de classements, avec l'éternel débat entre solidarité et excellence qui affaiblit encore de nos jours la communauté universitaire dans son ensemble.
- les universités sont des entreprises humaines particulières, souvent comparées à des villes ou à des consortiums, et en tant que telles elles tiennent beaucoup à leur image, dans la vraie vie ou sur l'Internet, pour le grand public, les politiques/bailleurs, les entreprises, les universitaires et les étudiants. L'image est très étroitement liée au nom de l'université, à son sigle, même s'ils changent de temps en temps pour des raisons diverses : je note par exemple le cas des universités parisiennes qui se battent autour des mots Sorbonne et Paris, ou le cas de l'université de Cergy-Pontoise devenur CY Cergy Paris Université, sans parler des multiples noms de domaines sur l'Internet... Alors, introduire un identifiant neutre en plus est un pari risqué s'il est mal présenté, s'il parait entrer en concurrence avec les noms et marques de l'université, ou s'il n'est pas accompagné d'une valeur ajoutée évidente.
- enfin, les questions liées à l'université ne peuvent se concevoir sans parler du public et du privé, ou du "public, not for profit, and for profit". Les tensions sont vives dans beaucoup de pays, dans un contexte malheureusement de rétraction des crédits publics pour le secteur. Mettre sur le même plan ces différents "états" choque plus d'un universitaire, même lorsque des conditions préalables d'admissibilité sont mises en place autour notamment des accréditations nationales. Un identifiant dans lequel il suffit de changer un chiffre pour passer du coq à l'âne n'est pas un identifiant crédible à ce titre. Trop d'enjeux sont présents.
Et pourtant,
Je pense que la création d'un Global ID est une bonne idée, si elle est gérée de manière proactive et accompagnée de services utiles. Ce n'est pas encore le cas du WHED Global ID qui a des progrès à faire dans plusieurs dimensions.
L'idée d'identifiants globaux pour cette communauté universitaire n'est pas neuve. De multiples acteurs y ont pensé et y pensent toujours. Leurs intérêts bien compris peuvent être très divers.
Quelques exemples :
- À tout seigneur tout honneur, l'AIU/IAU qui gère le WHED présente le Global WHED ID comme une fonctionnalité du WHED, ce qui est logique puisque cet identifiant est basé sur la clé interne d'une entité déjà présente dans la base de données du WHED. Il s'agit donc aussi d'un moyen pour promouvoir le WHED. Il s'agit également d'un moyen pour valoriser les membres de l'association AIU qui sont les seuls à pouvoir bénéficier d'un lien permanent (permalink) sous forme d'une URL liée à leur identifiant, en sus de leur site web habituel. Un avantage compétitif compréhensible du point de vue d'une association pour ses membes. On notera quand même que l'identifiant proposé comporte est numérique après les caractères IAU, par exemple IAU-026954 pour Cergy (voir plus haut), et ce pour toutes universités, même celles qui ne sont pas membres de l'AIU. Étonnant, non ? Comme si l'AIU avait 20 000 membres au lieu de 500 et quelques. Imaginez le code ISO de la France étant ISO-FR au lieu de FR...
- Des organisations internationales, comme l'UNESCO ou comme ENIC/NARIC ont intérêt à promouvoir leurs rôles et leurs périmètres en construisant des outils qui démontrent leur expertise et qui renforcent leur image. On pense évidemment à la convention sur la reconnaissance dans l'enseignement supérieur de l'UNESCO ou à la protection de l'espace européen élargi par ENIC/NARIC. Encore faut-il que ces organisations aient une légitimité acceptée par la communauté universitaire, et qu'elles aient les moyens de proposer des solutions non redondantes.
- Des acteurs privés ont bien compris l'intérêt de contrôler un tel identifiant pour poséder un avantage compétitif sur leurs concurrents, pour mieux vendre leurs produits et service et pour exploiter au mieux les données "privées" liées à ces entités, notamment par de la publicité ciblée ou pour croiser les données facilement avec leurs propres systèmes et augmenter ainsi leur puissance. On peut penser à des grands éditeurs scientifiques déjà très présents dans le secteur académique autour des classements par exemple ou du monopole sur les données et articles "non ouverts", ou à des moteurs de recherche ou à des agences privées vendant des services personnalisés.
- Des communautés et collectifs de développeurs, de type open source et open data, pour ne pas parler ici d'open science, sont également potentiellement capables de gérer de tels identifiants, surtout si l'on introduit même à petite dose un peu d'intelligence artificielle pour résoudre les conflits de nommage ou pour aller chercher les informations pertinentes sur l'Internet. La technicité requise pour aller "moissonner" de telles informations est en effet d'un niveau très faible. Même moi, avec mon bagage limité de développeur, j'y arriverais si je le voulais, je crois.
- Des groupements thématiques ou géographiques d'universités ont déjà inventé de tels identifiants, au sein de leur groupement, et ne serait-ce que pour gérer leurs "membres". Des passerelles entre différents systèmes sont souvent réalisées lorsque le besoin s'en fait sentir et la solution habituelle consiste à créer des tables de correspondance entre identifiants, ce qui suffit souvent à résoudre la plupart des problèmes. C'est une logique de simple gestion efficace de ses propres membres et de rekations avec d'autres entités qui prévaut alors. Pas forcément une vraie stratégie, plutôt des tactiques opportunistes.
- Je citerai enfin les gTLD - acronyme barbare untilisé pour l'Internet par l'ICANN - qui sont une manière de catégorier les URL des sites Internet que nous visitons tous régulièrement. Autrefois limité à quelques noms de domaine supérieurs comme .com .org .edu ou .fr par exemple, ces domaines se sont multipliés depuis 2012 avec un appel public à la cration de nouveau noms. Il y en a aujourd'hui plus de 1200 : par exemple, ce blog est hébergé sur le site caen.one et tout le monde peut créer un domaine en .one pour une somme très modique. Parmi les vainqueurs de l'appel de 2012, il y a une société qui en a obtenu des dizaines, dont le domaine .university : n'importe qui peut y créer un nom de domaine, pour une somme plus importante et sans avoir de lien avec le monde universitaire (aucune vérification). Imaginez ce blog sur le site Malamoud.university ??? Ridicule, non ? Possible, pourtant. Rappelons qu'il existe depuis des lustes les domaines en .edu, mais qui sont réservés à des entités basées aux USA ou adoubées, au-delà de quelques exceptions historiques. Un projet de création d'un gTLD .univ avait été pensé et a échoué au dernier moment. Je vous raconterai cette histoire si vous voulez, un jour, puisque j'en étais l'un des promoteurs.
La problématique d'un identifiant global unique rejoint quelques principes fondateurs auxquels de nombreux acteurs croient, au-delà de leurs intérêts privés, souvent commerciaux, même dans le secteur public. Je me risquerai à en étaler certains sous vos yeux dans un prochain billet :
On en est où ? Le WHED global ID de l'AIU est-il le bon choix ? Doit-il évoluer ? Qui doit le contrôler/gérer ? À quoi peut-il servir ? À quoi ne devrait-il pas servir ? Cette question mérite un débat sérieux. Débat qui n'a pas encore eu lieu et je le regrette. Vos réactions m'intéressent.