Offre d’emploi – Contrat post-doctoral dans le cadre du projet « Rescapé ». L’approche numérique face au défi du temps

CONTRAT POST-DOCTORAL PROJET RESCAPÉ : L’APPROCHE NUMERIQUE FACE AU DEFI DU TEMPS – UN GRAND RECUEIL DU XIVE SIECLE ENDOMMAGE PAR LE FEU : LE MS. BNU L.II.14 DE TURIN (F/H)

L’École nationale des chartes est un grand établissement d’enseignement et de recherche en sciences historiques,  philologiques et sociales. Elle recrute et forme des chercheurs expérimentés, ainsi que des futurs conservateurs du patrimoine et des bibliothèques.

Notre établissement fait partie de l’Université PSL. Située au cœur de Paris, celle-ci fait dialoguer tous les domaines du savoir, de l’innovation et de la création. Classée parmi les 50 premières universités mondiales, elle forme au plus près de la recherche des chercheurs, artistes, ingénieurs, entrepreneurs ou dirigeants conscients de leur responsabilité sociale, individuelle et collective.

Structure d’accueil

L’environnement de travail sera partagé entre le Centre Jean-Mabillon (École nationale des chartes) et l’Equipex Biblissima+ (Campus Condorcet, Aubervilliers).

Le centre Jean-Mabillon (Équipe d’Accueil n° 3624) incarne la dimension collective, interdisciplinaire et internationale des activités de recherche dans le domaine des sciences historiques telles qu’elles sont enseignées à l’École nationale des chartes, établissement de rattachement du centre.

L’École nationale des chartes est un grand établissement d’enseignement et de recherche en sciences historiques, philologiques et sociales. Elle est membre de l’université PSL et du Campus Condorcet. Elle entretient des relations privilégiées avec la Bibliothèque nationale de France et l’Institut National d’Histoire de l’Art dans le cadre de l’espace Richelieu – bibliothèques, musée, galeries.

Mission de recherche

L’environnement de travail sera partagé entre le Centre Jean-Mabillon (École nationale des chartes) et l’Equipex Biblissima+ (Campus Condorcet, Aubervilliers).

Soutenu par Biblissima+, le projet RESCAPE vise à se pencher sur les manuscrits de la Bibliothèque de Turin, endommagés et en partie détruits par l’incendie de 1904. En particulier, il se concentrera sur le manuscrit BNU L.II.14, dans le but de restituer d’un côté son unité physique originelle, affaiblie par suite de l’incendie et d’une subdivision précédente en quatre volumes et, de l’autre, son canon composé de textes sacrés « sanctifiant » des cycles épiques. Ce défi, rendu particulièrement ardu en raison des conditions matérielles de certaines parties du codex et de sa taille de 586 feuillets, sera relevé par le biais du traitement automatique

Le travail du post-doc sur ce projet mêlera notamment reconnaissance automatique des écritures « classique » (quoique compliquées par l’état de conservation de la source) et de possibles extensions vers l’utilisation plus avancée de la vision par ordinateur pour la restauration artificielle des documents et le traitement automatique de la langue ainsi que des analyses computationnelles des textes. L’un des buts essentiels du travail sera la transcription automatique d’une partie ou de l’ensemble du ms., avec l’intégration des parties lacunaires avec le recours à d’autres sources (éditions antécédentes l’incendie de 1904, archive Stengel etc.). Jean-Baptiste Camps jean-baptiste.Camps@chartes.psl.eu

Compétences attendues

Compétences requises :

  • Expérience en édition des textes médiévaux ;
  • Expérience en XML-TEI

Plus en particulier, la personne engagée devra être à même de manipuler, voire d’enrichir des jeux de données à partir de corpus sélectionné pour améliorer des modèles de segmentation et de reconnaissance automatique d’écriture manuscrite pour l’ancien français.

La personne recrutée devra également être capable :

    • d’entraîner un modèle Kraken directement en ligne de commande ;

    • d’alimenter un dépôt gitHub avec des données d’entraînement ;

    • de faire de l’intégration continue pour vérifier la qualité des données et le respect du vocabulaire contrôlé SegmOnto ;

    • de lire et transcrire en ancien français, en utilisant notamment l’interface e-Scriptorium ;

    • d’annoter et éventuellement de lemmatiser le corpus en utilisant les outils de traitement automatique des langues fournis par l’École des chartes (Deucalion, Pyrrha) ;

    • de collaborer avec des spécialistes d’intelligence artificielle et de traitement d’image pour la ‘restauration artificielle’ du manuscrit.

Le cas échéant, la personne recrutée sera tenue à se former à l’utilisation de Git, à la transcription automatique et à l’utilisation de Escriptorium. La formation aura lieu au sein du master Humanités numériques de Paris Sciences & Lettres.

La disponibilité à participer à des congrès et séminaires dans le but de divulguer les résultats acquis sera également requise.

Profil Recherché

Au choix,

  • doctorat en études médiévales avec spécialisation de préférence en linguistique, philologie romane, humanités numériques, ou paléographie computationnelle ;
  • doctorat en vision par ordinateur et intelligence artificielle, avec une appétence pour le travail interdisciplinaire et les périodes anciennes.
  • Une double compétence en philologie et en humanités numériques est souhaitée.

L’ensemble du projet sera mené à l’aide de eScriptorium et Kraken pour l’HTR. L’ensemble des données devra respecter les normes de transcription définies à l’École des chartes lors du séminaire « Création de modèle(s) HTR pour les documents médiévaux en ancien français et moyen français entre le Xe et le XIVe siècle » qui s’est tenu en 2021-2022, (https://cremmalab.hypotheses.org/seminaire-creation-de-modeles-htr).

Source : PSL – Université

A propos RMBLF

Réseau des médiévistes belges de langue française
Cet article a été publié dans Offre d'emploi. Ajoutez ce permalien à vos favoris.