EXOPOPP
Intitulé du projet :
Extraction optique d'entités nommées manuscrites pour les actes de mariage de la population de Paris (1880-1940)
Acronyme : EXO-POPP
Dates : octobre 2021 à octobre 2025
Coordinatrice scientifique : Sandra Brée
Responsables scientifiques : Sandra Brée et Thierry Paquet (Laboratoire LITIS, Rouen)
Membres du projet : Consortium SHS : Fabrice Boudjaaba (CNRS, CRH, EHESS) ; Victor Gay (Toulouse 1, Toulouse School of Economics) ; Vincent Gourdon (CNRS, Centre Roland Mousnier) ; Marion Leturcq (INED) ; Manuela Martini (Lyon 2, LARHRA) ; Jean-Luc Pinol ; Clyde Plumauzille (CNRS, Centre Roland Mousnier) ; Philippe Rygiel (ENS, LARHRA) ; Hilde Bras et Jan Kok (Pays-Bas), Michel Oris (Suisse), Thierry Eggerickx (Belgique), Glenn Sandström (Suède) et Bartosz Ogórek (Pologne) ; Joana Maria Pujadas-Mora et Gabriel Brea-Martínez (Espagne). Equipe informatique : Thierry Paquet (Pr., Université de Rouen Normandie, LITIS) ; Sébastien Adam ; Pierrick Tranouez ; et Clément Chatelain (apprentissage automatique, apprentissage profond, analyse d'images de documents, reconnaissance d'écriture
Partenaires institutionnels : LARHRA ; CNRS ; LITIS ; Université de Rouen
Descriptif :
Le projet EXO-POPP a pour ambition de développer une base de données de 300 000 actes de mariage de Paris et de sa banlieue entre 1880 et 1940. Ces documents fournissent une multitude d'informations sur les mariés, leurs parents et leurs témoins de mariage permettant des analyses sur le mariage, le divorce, les réseaux sociaux et de parenté. Couvrant une période de 60 ans, ces problématiques recouperont également des questions transversales telles que le genre, la classe et l'origine.
La constitution d'une telle base de données à la main nécessiterait au moins 50 000 heures de travail. Mais, grâce aux récents développements du deep learning, il est désormais possible de construire d'immenses bases de données avec des systèmes de lecture automatique comprenant la reconnaissance de l'écriture manuscrite et la compréhension du langage naturel.
En plus de contribuer largement à répondre à des problématiques sur les mariages, les migrations, les réseaux familiaux et amicaux, les divorces et les séparations entre 1880 et 1940, parmi beaucoup d'autres, le projet EXO-POPP permettra une nouvelle étape dans la collaboration entre les informaticiens et les chercheurs en sciences humaines pour améliorer la reconnaissance et l'optique des caractères et de l'écriture manuscrite qui sont maintenant essentiels pour fournir de nouveaux outils précieux pour le traitement des sources, en particulier les sources historiques.
Axe(s) de rattachement : Régulations, Genre
Lien internet : https://exopopp.hypotheses.org/
Légende photo : registre des mariages d'Aubervilliers de 1890 (cote 1E001/102)