WARCNet Papers : collecter les traces en ligne de la pandémie

WarcnetPapers.png

Titre

WARCNet Papers : collecter les traces en ligne de la pandémie

Description

Au-delà de l’écran, la fabrique des collectes d’urgence dédiées au coronavirus         

Le 25 avril 2020, au moment où plusieurs pays d’Europe ont imposé un confinement, un collectif de chercheurs de l’Université de Genève diffusait une tribune dans Libération invitant à conserver les traces publiées en ligne afin de permettre l’édification d’une  "mémoire ordinaire de l’extraordinaire". Les signataires appelaient alors à la plus grande vigilance quant au risque de surreprésentation ou d’invisibilisation de groupes sociaux que pouvaient entraîner les choix d’archivage. L’argumentaire de l’appel illustre une prise de conscience du caractère patrimonial des traces nativement numériques publiées en ligne, y compris s’agissant des contenus vernaculaires, le web étant perçu comme l’environnement privilégié pour la prise de parole de groupes sociaux dominés ou marginalisés. Sans pour autant les mentionner, le texte témoigne également du chemin parcouru depuis les premières initiatives confidentielles d’archivage du Web nées à la fin des années 1990. En effet, à la suite de la fondation d’Internet Archive en 1996, plusieurs dispositifs d’archivage du Web ont été déployés dans différents états au début des années 2000, encouragés par l’UNESCO à travers la « Charte pour le patrimoine numérique » de 2003.
En France, la Bibliothèque nationale de France (BNF) et l’Institut National de l’Audiovisuel (INA) ont conduit des expérimentations en ce sens dès 2002, avant de disposer du cadre juridique fixé par le dépôt légal du web créé par la loi DADVSI en 2006. Ces institutions participent à la dynamique internationale structurée autour de l’IIPC - International Internet Preservation Consortium (2006) et travaillent en collaboration avec des chercheurs en SHS comme en sciences de l’informatique.

Le document ici sélectionné est une capture d’écran de la page du site web du projet WARCnet (Web ARChive studies network researching web domains and events) présentant les WARCnet papers, publications rédigées par ses membres est largement dédiée aux conditions de collecte et aux critères de sélection des contenus destinés à être sauvegardés dans l’urgence.
Lancé au début de l’année 2020 par des chercheurs pionniers dans la réflexion sur les archives du web en sciences humaines et sociales, le projet est coordonné par Niels Brügger (Université de Aarhus), Valérie Schafer (Université du Luxembourg) et Jane Winters (Université de Londres). Il regroupe une centaine de personnes, membres de plusieurs universités et de huit institutions d’archive. Le comité de pilotage témoigne de la collaboration étroite tissée entre les archivistes et les chercheurs, puisqu’il rassemble les trois principal investigators ainsi qu’Ulrich Karstoft Have (Aarhus University), Kees Teszelszky (Dutch Web archive) et moi-même.

L’objectif initial est « de promouvoir une recherche internationale afin d’étudier l'histoire des domaines web et des événements transnationaux sur le web, en s'appuyant sur le patrimoine culturel numérique de plus en plus important conservé dans les archives web nationales ». Le projet s’est naturellement orienté vers l’étude des collections archivées autour du coronavirus, glissant ainsi d’une étude du web passé à une réflexion sur la patrimonialisation en train de se faire. Les stratégies de collecte conditionnent en effet les contours de la mémoire nativement numérique nationale de la pandémie. Pour les chercheurs qui mobilisent ou mobiliseront ces collections, il est indispensable de comprendre comment la sélection s’est opérée et d’en évaluer la représentativité. Une série d’enquêtes orales a donc été réalisée dans le cadre du projet WARCnet auprès de plus d’une trentaine d’institutions d’archivage.

Deux d’entre eux ont été réalisés auprès des équipes de l’INA et de la BNF qui se partagent la mission d’archivage du web national. Ils nous renseignent sur les collectes spécifiques mises en place dans l’urgence dès le début de la pandémie, en plus du moissonnage du périmètre propre à chaque institution. Du côté de la BNF, l’équipe du dépôt légal numérique a lancé, en complément des collectes courantes, une collecte ciblée à partir de février 2020 mobilisant, en plus des départements et des services traditionnellement impliqués, 58 correspondants en région, y compris pendant les phases de confinement (Gebeil, Schafer, Benoist, et al. 2020). Du côté de l’INA, outre la collecte systématique du domaine médiatique, l’équipe pilotée par Jérôme Thièvre s’est attelée à archiver les tweets relatifs à la pandémie à partir de février 2020 (Schafer, Thièvre, Blanckemane, 2020). À l’image de la France, les collectes ont été conduites principalement à l’échelle nationale, selon des modalités qui varient selon le cadre juridique, les moyens alloués, et le type de gouvernance.

 

Couverture

Couverture spatiale

France
Europe

Couverture temporelle

Date

Type

Site web

Contributeur

Relation

Le texte proposé est issu de Gebeil, Sophie,  "'Archive-moi si tu peux'. À la recherche du patrimoine nativement numérique de la pandémie en Méditerranée et MENA", Communication, Organisation, Société du Savoir et Information, n°11, 2021,  https://revue-cossi.numerev.com

Schafer V., Thièvre J. and Blanckemane B., Exploring special web archives collections related to COVID-19: The case of INA, 2020, https://cc.au.dk/fileadmin/user_upload/WARCnet/Schafer_et_al_Exploring_special_web_archives.pdf

Gebeil S., Schafer V., Benoist D., Faye A., Tanesie P.,  Exploring special web archive collections related to COVID-19: The case of the French National Library (BnF), 2020,  https://hal.archives-ouvertes.fr/hal-03066879

Webcorpora – Explorer les archives de l’Internet à la BnF, « Dans les coulisses de la collecte COVID-19. Entretien sur les pratiques des correspondants du DLweb », avec Véronique Tranchant, Chantal Puech, Valérie Schafer et Alexandre Faye, 16/11/2020, https://webcorpora.hypotheses.org/953  

La Bnf archive le coronavirus, Bibliothèque nationale de France, https://www.bnf.fr/fr/la-bnf-archive-le-web-du-coronavirus
Au dépôt légal du web, le coronavirus a ses entrées, Institut national de l'audiovisuel, https://www.ina.fr/actualites-ina/etude-coronavirusdl-web

Référence bibliographique

WARCnet Papers,
Web ARChive studies network researching web domains and events. Warcnet, Univ. Aarhus, 2022.09.11. https://cc.au.dk/en/warcnet 

Source

Warcnet, Univ. Aarhus, https://cc.au.dk/en/warcnet 

Droits

Tous droits réservés

Ayants droit

Warcnet Project, INA, BNF