Billet – Faire de l’historiographie avec les méthodes numériques : perspectives de recherche au départ de l’histoire médiévale

Accès : ici

L’historiographie, c’est-à-dire l’histoire de l’histoire, est traditionnellement dominée par une logique exemplaire dans laquelle les figures des « grands maîtres » servent de mètre étalon à l’ensemble de la discipline. Pourtant, la révolution numérique offre aujourd’hui des outils qui permettent de transcender cette logique indiciaire et de doubler l’approche « ego-historique » classique d’une analyse globale de la production historiographique, c’est-à-dire tenant compte des centaines de milliers d’ouvrages et d’articles historiques publiés depuis le début du XIXe siècle, qu’ils aient été écrits par des auteurs « majeurs » ou « mineurs ». Préfigurant un article programmatique en cours de rédaction dédié à l’historiographie de la période médiévale, cette brève note souhaite présenter quelques-unes des perspectives ouvertes par les approches computationnelles de l’historiographie.

Le corpus exploité se compose de deux ensembles accessibles en licence creative commons, et donc librement téléchargeables. D’une part, nous mobilisons l’intégralité des références étiquetées comme « francophones » dans la base de données bibliographique des Regesta Imperii Opac (désormais RI Opac). Cela représente un total de 418 285 références, qui se composent principalement des noms d’auteurs, des titres de leurs contributions ou livres et, dans le cas d’articles scientifiques, des intitulés des revues et des volumes collectifs dans lesquels ces travaux ont été publiés. Les médiévistes le savent, le texte en lui-même des articles ou des volumes n’est pas accessible via RI Opac. Pour y avoir accès, il est nécessaire de se tourner vers d’autres plateformes. Dans le cadre de notre projet, nous avons ainsi téléchargé, à l’aide de techniques automatisées de récupération de données en ligne (web scraping), 13 869 articles complets parus dans cinq revues francophones aux profils différents (généralistes, érudites, etc.) et disponibles sur le portail Persée (les Annales, la Bibliothèque de l’École des Chartes, les Cahiers de Civilisation médiévale, la Revue belge de Philologie et d’Histoire, et Scriptorium). Pour cette note de blog, tous les exemples présentés se fonderont cependant sur l’exploitation du premier corpus.

Suite sur SocMed

About RMBLF

Réseau des médiévistes belges de langue française
Cet article a été publié dans News. Ajoutez ce permalien à vos favoris.