Séminaire 2025-2026

English version

Le Web et les archives du Web pour la recherche en SHS : savoirs, méthodes et outils pour la collecte, l’analyse et la pérennisation de corpus en ligne

Octobre 2025 – Juin 2026

Lieu : Salle Michel Seurat – Médiathèque de la MMSH et à distance en visioconférence

Présentation

Que ce soit dans le cadre de nos études, de nos activités de recherche ou d’enseignement, nous mobilisons toutes et tous des documents ou des services accessibles via des sites web ou des réseaux sociaux. Pourtant, la question de la pérennisation des informations tirées du web, à des fins scientifiques ou pédagogiques, demeure encore en retrait. 

Le Web étant devenu incontournable dans l’appréhension des phénomènes récents, le WebLab, l’Humathèque Condorcet et le consortium Huma-Num Distam proposent un séminaire commun qui permettra de s’approprier les connaissances, les méthodes et les outils pour la collecte, l’analyse et la pérennisation de corpus en ligne en SHS. 

Ouvert à toutes et tous sur inscription, ce séminaire s’adresse à l’ensemble des personnes engagées dans la recherche, l’ingénierie, les archives, les bibliothèques, l’enseignement ou l’accompagnement, qu’elles soient déjà expérimentées dans ces domaines ou en phase d’exploration. 

Cette année, les séances se dérouleront à la médiathèque de la MMSH à Aix-en-Provence et pourront être également suivies en distanciel.

Organisation

En 2023,  Sophie Gebeil (laboratoire TELEMME, AMU-CNRS) et Jean-Christophe Peyssard (Responsable de la Médiathèque de la MMSH, CNRS) ont co-fondé le WebLab, un espace de réflexion et de pratique dédié à l’utilisation du web vivant ou archivé comme source et/ou terrain en SHS à la médiathèque de la Maison Méditerranéenne des Sciences de l’Homme, avec le soutien de l’Institut Universitaire de France. Il propose de développer et de partager des connaissances, des méthodologies, ainsi qu’une réflexion critique et éthique sur l’étude du web vivant et archivé dans le champ académique. Après l’organisation des séances préparatoires l’an dernier, le WebLab est heureux de s’associer à l’Humathèque Condorcet pour vous proposer un séminaire commun à la MMSH (Aix-en-Provence) en 2025/2026. 

Maya Anderson-Gonzalez, PhD (Humathèque Condorcet) a mené une étude prospective commanditée par l’Humathèque Condorcet en 2024-2025 visant à évaluer l’opportunité et la faisabilité de mettre en place un service d’exploitation de données du web. Ayant activement contribué à cette étude, l’équipe du WebLab continue de participer avec l’Humathèque à une réflexion sur le développement d’actions conjointes d’acculturation, d’accompagnement et de formation sur la thématique des données du web destinées aux communautés de recherche en SHS. La co-organisation de ce séminaire en est la première concrétisation.

Séances

Séance 3 : Mercredi 3 décembre 14h-16h

« Réflexions et expérimentations autour de l’archivage du Web depuis le Huma-Num Lab« 

Séance 2 : Jeudi 27 novembre 14h-16h

« L’archivage du web français à l’ère de l’IA : institutions patrimoniales et collaborations académiques« 

Séance 1 : Jeudi 9 octobre de 14h à 16h

« Le Web comme source ou terrain en SHS : cadre théorique et méthodologique de l’archivage du web et de son analyse« 

Seminar 2025-2026

The Web and Web Archives for Research in the Social Sciences and Humanities: Knowledge, Methods, and Tools for Collecting, Analyzing, and Preserving Online Corpora

October 2025 – June 2026

Location: Michel Seurat Room – MMSH Media Library and online via videoconference

Overview

Whether in the context of our studies, research activities, or teaching, we all rely on documents or services accessible through websites or social media platforms. Yet, the issue of preserving information sourced from the web for scientific or educational purposes remains somewhat neglected.

With the web now indispensable for understanding recent phenomena, the WebLab, the Condorcet Humathèque, and the Huma-Num Distam consortium are jointly offering a seminar designed to equip participants with the knowledge, methods, and tools for collecting, analyzing, and preserving online corpora in the social sciences and humanities (SSH).

Open to all upon registration, this seminar is aimed at anyone involved in research, engineering, archiving, libraries, teaching, or support roles, whether experienced in these fields or just beginning to explore them.

This year, sessions will take place at the MMSH Media Library in Aix-en-Provence and will also be accessible remotely.

Organization

In 2023, Sophie Gebeil (TELEMME laboratory, AMU-CNRS) and Jean-Christophe Peyssard (Head of the MMSH Media Library, CNRS) co-founded the WebLab, a space for reflection and practice dedicated to using the live or archived web as a source and/or field of study in SSH at the Maison Méditerranéenne des Sciences de l’Homme media library, with support from the Institut Universitaire de France. The WebLab aims to develop and share knowledge, methodologies, as well as critical and ethical reflection on the study of both the live and archived web in academia. Following preparatory sessions organized last year, the WebLab is pleased to partner with the Condorcet Humathèque to offer a joint seminar at the MMSH (Aix-en-Provence) in 2025/2026.

Maya Anderson-Gonzalez, PhD (Condorcet Humathèque), conducted a forward-looking study commissioned by the Condorcet Humathèque in 2024-2025 to assess the opportunity and feasibility of establishing a web data exploitation service. Having actively contributed to this study, the WebLab team continues to work with the Humathèque on developing joint initiatives for awareness-raising, support, and training on web data aimed at SSH research communities. The co-organization of this seminar is the first tangible outcome of this collaboration.

Sessions

Session 3: Wednesday, December 3, 2:00–4:00 PM

“Reflections and Experiments on Web Archiving from the Huma-Num Lab”

Session 2: Thursday, November 27, 2:00–4:00 PM

“French Web Archiving in the Age of AI: Heritage Institutions and Academic Collaborations”

Session 1: Thursday, October 9, 2:00–4:00 PM

“The Web as a Source or Field in the Social Sciences and Humanities: Theoretical and Methodological Frameworks for Web Archiving and Analysis”