Appel à candidature : Hackathon Alexandre – nov. 2022-mai 2023

Iskandar visits a hermit Detached album folio
Iskandar visits a hermit,  Iran, ca. 1580-1600, domaine public. National Museum of Asian Art : https://asia.si.edu/object/S1986.168/

!! ATTENTION !! changement de dates

Dans le cadre du programme ANR Littératures Populaires du Levant (LiPoL) et du chantier prioritaire « Horizons de Renouvellement des Études Arabes » (HoRÉA) du GIS MOMM, avec le soutien du consortium Huma-Num Distam et de l’UMR 8167 Orient et Méditerranée, la Médiathèque SHS de la Maison Méditerranéenne des Sciences de l’Homme(MMSH) d’Aix-en-Provence accueillera prochainement douze étudiantes et étudiants pour un hackathon qui portera sur la transcription de manuscrits du Roman d’Alexandre (Sīrat al-Iskandar) en moyen-arabe. Le Hackathon Alexandre sera lancé par deux journées de formation qui auront lieu à la Médiathèque SHS de la MMSH les 29 et 30 novembre prochains, et la durée des travaux s’étendra de fin novembre 2022 à mai 2023.

Traduit et écrit dans une grande variété de langues européennes et orientales, le Roman d’Alexandre mêle légendes et évènements historiques autour de la vie d’Alexandre le Grand et constitue un récit phare de la littérature populaire tant européenne que moyen-orientale. Le corpus qui sera travaillé lors du hackathon est composé de quatre manuscrits écrits en moyen-arabe (appelé aussi « arabe médian » ou « arabe moyen », registre de l’arabe situé entre le standard et le dialectal) en Syrie entre les XVIIe et XIXe siècles.

L’objectif du Hackathon Alexandre est l’élaboration d’un modèle de reconnaissance de l’écriture manuscrite (« HTR », Handwritting Text Recognition) propre à ce corpus, à partir de la transcription manuelle de pages issues des manuscrits. Avec le concours de Calfa, entreprise spécialiste de la détection de texte pour les langues orientales,  les étudiants et étudiantes seront initié·es au HTR et pourront prendre en main l’interface de transcription qui leur sera mise à disposition. Elles et ils seront ensuite appelé·es à transcrire en autonomie une quinzaine de page chacun. Les transcriptions seront attendues début novembre afin de pouvoir les transmettre à Calfa qui les utilisera pour produire le modèle HTR. L’intelligence artificielle développée par Calfa sera aors en mesure d’extraire automatiquement le texte de l’intégralité des manuscrits. La qualité de la transcription automatique sera ensuite contrôlée par le groupe de travail, et le texte obtenu sera prêt pour un travail d’analyse et d’édition. Le Hackathon Alexandre comprend également une formation autour du manuscrit arabe et des humanités numériques.

Inscription et validation de la formation

Le Hackathon Alexandre est destiné prioritairement aux étudiantes et étudiants inscrits en Master et en Doctorat d’Études Arabes à Aix-Marseille Université, Sorbonne Université et à l’Université de Strasbourg. Il est ouvert aux autres étudiantes et étudiants inscrit·es dans un cursus d’Études arabes dans d’autres universités, sous réserve d’un avis favorable motivé de leur responsable de formation.
Aucune expérience antérieure dans le traitement des manuscrits n’est nécessaire. L’atelier est ouvert aux débutants. La parfaite maîtrise de l’arabe écrit est toutefois indispensable pour participer au hackathon et pour tirer profit de la formation.
Les frais de logement et de déplacement seront pris en charge.
En concertation avec les responsables de formation de chaque université, la participation au hackathon pourra donner lieu à la validation d’un enseignement équivalent.
Un engagement de la part des participantes et participants sera demandé sur l’ensemble du projet, de novembre 2022 à mai 2023, afin de procéder périodiquement au contrôle de la qualité de la transcription issue de l’HTR.

Calendrier

  • 14 octobre : date limite de candidature
  • 29 et 30 novembre 2022 : réunion de l’équipe à Aix-en-Provence ; formation à l’outil et début de la transcription des échantillons
  • Du 1er décembre au 4 janvier 2023 : poursuite de la transcription à distance
  • 4 janvier 2023 : Rendu de l’ensemble des échantillons
  • 18 janvier 2023 : envoi des transcriptions vérifiées à Calfa pour le traitement
  • 3 mars 2023 : réception du texte transcrit par le modèle HTR élaboré par Calfa
  • Du 6 mars au 15 mai 2023 : contrôle de l’ensemble de la transcription automatique par l’équipe

Programme provisoire des journées de lancement

  • Mardi 29 novembre
    • 10h-12h30 : accueil des participants et participantes
      – présentation de LiPoL, introduction au Roman d’Alexandre et au manuscrit arabe
      -brève introduction aux humanités numériques : traitement des données de la recherche,  HTR
    • 12h30 : pause déjeuner
    • 13h30-17h30 : prise en main de Calfa vision et transcription
  • Mercredi 30 novembre
    • 9h-11h30 : transcription
    • 11h30-12h30 : restitution et fin de la formation

Organisatrice : Claire Cialone-Grégoire (Ingénieure d’Études, UMR 8167 Orient et Méditerannée)

Responsables scientifiques : Iyas Hassan (Professeur, Sorbonne Université – Ifpo) ; Jean-Christophe Peyssard (Responsable de la Médiathèque SHS de la MMSH, UAR 3125, AMU, CNRS).

Contact : claire.cialone-gregoire[at]cnrs[point]fr

Image à la une : Iskandar visits a hermit,  Iran, ca. 1580-1600, domaine public. National Museum of Asian Art : https://asia.si.edu/object/S1986.168/

Partenaires

DISATM
Distam : Agora numérique des études aréales – Afrique, Asie, Moyen-Orient et Mondes musulmans
GIS MOMM / HoREA
Programme ANR Lipol

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *