Le WebLab accueille la formation doctorale proposée par l’ED 355 « Le Web comme source ou terrain en SHS : apprendre à utiliser le web présent ou archivé dans le cadre de son doctorat » du 27 novembre 2025 au 12 février 2026.
lien d’inscription sur ADUM : https://adum.fr/script/formations.pl?mod=3721468&site=CDAMU
Objectifs :
Cette formation vise à fournir un cadre théorique et méthodologique pour les doctorantes et doctorants en SHS qui envisagent d’explorer le web présent ou passé dans le cadre de leur thèse. Elle apportera des connaissances concernant le web, les réseaux sociaux, mais aussi l’archivage du web, domaine indispensable pour les études en ligne. Cet apport théorique sera associé à des mises en pratique fondées sur les outils et méthodes correspondant aux besoins de chaque doctorante ou doctorant. Enfin, cette formation permettra de connaître les services disponibles sur notre territoire en la matière, depuis la médiathèque de la MMSH (WebLab, poste de consultation INA) jusqu’à l’Alcazar (accès aux archives web de la BNF) et à la délégation régionale de l’INA. Des intervenantes et intervenants des institutions nationales et internationales seront aussi invités à partager leur expertise en visio.
Programme :
Qu’il s’agisse de chercher ponctuellement une information complémentaire, de constituer un corpus, de pallier des difficultés d’accès au terrain, ou bien d’étudier les pratiques numériques des sociétés, le recours à des documents issus du web ou des réseaux socionumériques dans le cadre de la thèse est désormais courant. Pour autant, l’appréhension du web présent, ou du web passé grâce aux archives du web, impose une vigilance accrue dans la constitution du corpus, les méthodes d’analyse et la démarche interprétative. De plus, face au risque de disparition des pages web du fait de l’instabilité de ces environnements complexes, il est indispensable d’avoir la capacité de conserver ces corpus en ligne dans le cadre de sa thèse.
5 jours de formation de 4 h :
Séance 1
* Intérêt, limites et défis du web comme source ou terrain pour les SHS.
* Séminaire du WebLab (2h)
Séance 2
* Palette méthodologique pour l’appréhension du web vivant ou archivé.
* Mise en pratique 1 : définition des besoins, élaboration d’une première feuille de route.
Séance 3
* Constituer un corpus issu du web vivant et ou archivé.
* Mise en pratique 2 : savoir constituer et analyser un corpus issu du web vivant ou archivé pour ma thèse.
Séance 4
* Collecter et conserver un corpus de pages web avec Webrecorder.
* Mise en pratique 3 : savoir pérenniser un corpus issu du web vivant pour ma thèse (constitution d’une collection et restitution collective).
Séance 5
* Mise en pratique 4 : savoir constituer, pérenniser et analyser un corpus issu du web vivant ou archivé pour ma thèse.
Pré-requis :
4h x 5 séances
Matériel nécessaire : venir avec son ordinateur portable
Equipe pédagogique :
Sophie Gebeil (UMR7303 TELEMMe, AMU-CNRS, IUF, WebLab). Intervenantes et intervenants pressenties selon leurs disponibilités : Médiathèque MMSH, INA, BnF, Alcazar, etc.
Méthode pédagogique :
La formation articule des apports théoriques, en lien avec le séminaire du WebLab, et des ateliers pratiques, accompagnés et personnalisés. Chaque doctorante et chaque doctorant pourra constituer un corpus stabilisé et bénéficier d’une première prise en main d’outils d’analyse adaptés à ses besoins.
Compétences acquises à l’issue de la formation :
● connaître les spécificités du web comme source ou terrain pour la thèse (enrichir son état de l’art)
● découvrir le web archivé et prendre en main des ressources et des outils d’archivage du web
● découvrir les méthodes et outils d’analyse du web vivant ou archivé (qualitatives et quantitatives)
● constituer un corpus pour sa thèse et savoir le pérenniser
● expérimenter des outils d’analyse de corpus issu du web vivant ou archivé pour sa thèse
La formation participe à l’objectif suivant :être directement utile pour la réalisation des travaux personnels de recherche
Calendrier
Séance n° 1
Jeudi 27 novembre 13h30-17h30
Séance n° 2
Jeudi 18 décembre 13h30 – 17h30
Séance n° 3
Jeudi 15 janvier 13h30-17h30
Séance n° 4
Jeudi 22 janvier 13h30-17h30
Séance n° 5
Jeudi 12 février 13h30-17h30
Les séances se déroulent principalement en présentiel. Toutefois, une participation à distance peut être envisagée ponctuellement par visioconférence, en fonction des besoins des doctorantes et doctorants, et selon les places disponibles. Les personnes inscrites en présentiel seront prioritaires pour l’accès à la salle et bénéficieront d’un accompagnement personnalisé.
Doctoral Training: The Web as a Source or Field in Social Sciences and Humanities
_________________________________________________________________________
The WebLab is hosting the doctoral training program offered by ED 355, “The Web as a Source or Field in the Social Sciences and Humanities: Learning to Use the Live or Archived Web in Your Doctoral Research,” from November 27, 2025, to February 12, 2026.
Registration link on ADUM: https://adum.fr/script/formations.pl?mod=3721468&site=CDAMU
Objectives:
This training aims to provide a theoretical and methodological framework for doctoral students in social sciences and humanities who plan to explore the live or archived web as part of their dissertation research. It will offer knowledge about the web, social networks, and web archiving, an essential field for online studies. This theoretical foundation will be paired with practical sessions based on tools and methods tailored to the individual needs of each doctoral student.
Additionally, the training will introduce available local services, from the MMSH media library (WebLab, INA consultation station) to the Alcazar library (access to the BnF’s web archives) and the regional office of INA. Experts from national and international institutions will also be invited to share their expertise remotely.
Program:
Whether seeking occasional supplementary information, building a corpus, overcoming difficulties accessing the field, or studying the digital practices of societies, using web or social media documents in doctoral research is now common. However, engaging with the live web, or the past web via archives, requires careful attention when compiling corpora, choosing analysis methods, and adopting interpretive approaches.
Moreover, due to the risk of web pages disappearing because of the unstable nature of these complex environments, it is essential for doctoral candidates to know how to preserve these online corpora within their theses.
Five 4-hour Training Sessions:
Session 1
* Interest, limitations, and challenges of the web as a source or field for Social Science and Humanities.
* WebLab seminar (2 hours)
Session 2
* Methodological toolkit for approaching the live or archived web.
* Practical exercise 1: defining needs and developing a preliminary roadmap.
Session 3
* Building a corpus from the live and/or archived web.
* Practical exercise 2: how to compile and analyze a corpus from the live or archived web for your thesis.
Session 4
* Collecting and preserving a corpus of web pages using Webrecorder.
* Practical exercise 3: how to preserve a corpus from the live web for your thesis (creating a collection and collective restitution).
Session 5
* Practical exercise 4: how to compile, preserve, and analyze a corpus from the live or archived web for your thesis.
Prerequisites
* Five sessions of 4 hours each
* Required equipment: bring your own laptop
Teaching Team
* Sophie Gebeil (UMR7303 TELEMMe, AMU-CNRS, IUF, WebLab)
* Other invited speakers depending on availability: MMSH Media Library, INA, BnF, Alcazar, etc.
Teaching Methodology
The training combines theoretical input linked to the WebLab seminar with guided and personalized practical workshops. Each doctoral student will have the opportunity to build a stable corpus and get hands-on experience with analysis tools adapted to their research needs.
Skills Acquired
By the end of the training, participants will be able to:
-Understand the specificities of the web as a source or field for their thesis (enriching their literature review)
-Discover the archived web and master resources and web archiving tools
-Learn methods and tools for analyzing the live or archived web (qualitative and quantitative)
-Compile and preserve a corpus for their thesis
-Experiment with tools for analyzing corpora drawn from the live or archived web for their research
Training Objective:
To be directly useful for the completion of individual research projects.
Schedule
- Session 1:
Thursday, November 27, 1:30 PM – 5:30 PM - Session 2:
Thursday, December 18, 1:30 PM – 5:30 PM - Session 3:
Thursday, January 15, 1:30 PM – 5:30 PM - Session 4:
Thursday, January 22, 1:30 PM – 5:30 PM - Session 5:
Thursday, February 12, 1:30 PM – 5:30 PM
Sessions will mainly be held in person. However, remote participation via videoconference may be possible occasionally depending on doctoral candidates’ needs and available places. Priority for room access and personalized support will be given to those attending in person.