Offre d’emploi – Ingénieur d’étude en analyses des sources historiques et culturelles (CRISCO, Caen)

Projet HIGH-TECH, High-level text annotation across historical texts: improving semi- automatisation of big data management (Projet émergent RIN 2021-2023)


Fiche de poste

1) Intitulé du poste :
Ingénieur d’étude en analyses des sources historiques et culturelles

Ce poste d’ingénieur d’étude offre une excellente opportunité de développer ses compétences à la recherche scientifique dans un domaine à la croisée des sciences humaines et des humanités numériques. Intégrant un environnement stimulant réunissant jeunes chercheurs et partenaires institutionnels, le candidat retenu contribuera à faire progresser les outils, les ressources, les aptitudes et l’accessibilité de l’annotation textuelle de haut niveau. Il participera au développement d’un corpus de chroniques patrimoniales échelonnées sur six siècles, et élaborera et rendra disponible les procédures et outils permettant d’automatiser l’annotation syntaxique de textes historiques du français, en synergie avec les autres projets de l’environnement d’accueil.

3) Cadre statutaire du poste : IE
Catégorie : A
Corps / Grade : IE
BAP : D Sciences Humaines et sociales

CDD 24 mois
Dates : 1 / 11 / 2021 au 31 / 10 / 2023

4) Renseignements relatifs au service :

Lieu de travail : Laboratoire CRISCO (Université de Caen) Missions principales du service :

Le CRISCO (Centre de Recherches Interlangues sur la Signification en Contexte), fondé en 1999, est le laboratoire de linguistique française, anglaise et générale de l’université de Caen Normandie. Il rassemble une trentaine d’enseignants-chercheurs, une quinzaine de doctorants, un ingénieur de recherche et une secrétaire. Les thèmes de recherche incluent l’analyse des relations entre syntaxe et interprétation, et le traitement automatique du langage.

Le projet HIGH-TECH, porté par le CRISCO (EA4255, Université de Caen), est financé par le programme RIN émergent de la Région Normandie. Dirigé par Pierre Larrivée, il s’intéresse à l’importante tradition des chroniques normandes s’étendant sur six siècles. L’établissement d’une version numérique de ces textes est l’occasion d’optimiser la chaîne de traitement XML- TEI et d’annotation développée pour d’autres projets. En particulier, on entend faire avancer l’automatisation de l’annotation syntaxique et diffuser le protocole ainsi affiné pour accélérer son adoption par la communauté scientifique.

Positionnement hiérarchique :

Sous le rapport des missions et des tâches, le candidat est encadré par le responsable du projet. Concernant les dimensions administratives, le candidat se réfère aux instances administratives du laboratoire CRISCO.

Le laboratoire et l’établissement soutiennent activement les personnels dans leurs aspirations de formation.

5) Missions principales du poste :

Les livrables sous la responsabilité directe du candidat sont les suivants :
– édition numérique d’un corpus calibré de matériaux historiques français d’intérêt patrimonial
– élaboration de protocoles et d’outils permettant de faire progresser l’automatisation de l’annotation textuelles de haut niveau à l’aide de scripts (par ex. en Python) spécialement conçus à cet effet
– une banque d’arbres syntaxiques librement disponible dans un modèle international bien reconnu, éventuellement par l’entraînement d’un modèle d’analyse de l’ancienne langue française
– une mise à disposition du matériel numérique sur le portail txm du laboratoire CRISCO et sur le GitLab d’Unicaen
– la contribution à la diffusion scientifique (au moins un rapport technique dans une publication internationale à forte visibilité, l’animation de 3 ateliers de formation en France et à l’étranger pour diffuser l’expertise développée) et auprès du grand public (via un blog, les médias sociaux et au moins une vidéo diffusée sur YouTube).

8) Compétences requises :

Master 2, dans un domaine pertinent, comprenant une solide formation en humanités numériques

Des compétences techniques liées aux langages de programmation et à l’interface WEB, ainsi qu’une connaissance des enjeux des Très Grands Corpus et de la linguistique historique sont essentielles.

Savoirs
– Compétences avancées en Humanités numérique : connaissance opérationnelle du standard XML-TEI et des outils et langages XML (XPath, XQuery, XSL…), connaissance d’au moins un langage de programmation pour le traitement automatique des données (par ex. Python), connaissances voire expérience en modélisation des données textuelles, familiarité avec les principes FAIR
– Connaissances en histoire médiévale, en analyse syntaxique, et en traitement informatique des texte
– Niveau B1-B2 en anglais

Savoirs-faire
– Autonomie, auto-réflexivité, et capacité à acquérir de nouveaux savoir
– Capacité à travailler dans le cadre d’un contexte interdisciplinaire, à prioriser les tâches, et à répondre de façon constructive aux demandes pouvant émerger du suivi opérationnel ou de l’interaction avec les différents interlocuteurs
– Capacité démontrée d’interagir avec des interlocuteurs institutionnels et des chercheurs de différents horizons, de créer de nouvelles relations et de mettre en valeur les avancées du projet auprès de différentes communautés, y compris le grand public

A propos RMBLF

Réseau des médiévistes belges de langue française
Cet article a été publié dans Offre d'emploi. Ajoutez ce permalien à vos favoris.