L’histoire en contexte numérique

Frédéric Clavert
ass. prof. @ uni.lu / C2DH
professeur invité (EA Tempora / Rennes 2)

17 septembre 2019

Introduction
Un monde mis en données


«To datafy a phenomenon is to put it in a quantified format so it can be tabulated and analysed.»

Mayer-Schönberger, Viktor, et Kenneth Cukier. Big Data: A Revolution That Will Transform How We Live, Work, and Think. Boston: Houghton Mifflin Harcourt, 2013, p. 72.

Mise en données du monde

Antérieure à l’ère numérique / Accélération

Données de toutes sortes / réutilisables à différentes fins

Données massives: Déluge de données

Exemples de mises en données

Google Books et Google Ngram Viewer

Données

the raw material produced by abstracting the world into categories, measures and other representational forms […] that constitute the building blocks from which information and knowledge are created.

Kitchin Rob, The Data Revolution: Big Data, Open Data, Data Infrastructures and Their Consequences, Thousand Oaks CA, SAGE Publications Ltd, 2014.

Capta is “taken” actively while data is assumed to be a “given” able to be recorded and observed.

Drucker Johanna, « Humanities Approaches to Graphical Display », Digital Humanities Quarterly 005 (1), 10.03.2011.

Le temps long de la mise en données

Le temps long de la mise en données

La mise en données du monde d’aujourd’hui combine plusieurs phénomènes de plus long terme

  • L’informatisation
  • La numérisation (Projet Gutenberg, 1971)
  • La mise en réseau (arpanet, 1969; internet, années 1980; web, 1989-1990)

Chacun de ces éléments a une histoire plus longue que celle de leur création.

Touche tous les aspects de la société, donc toutes les sources primaires, passées ou « futures »

Il y a aussi mise en données de l’histoire

La mise en données de l’histoire

Mise en données de l’histoire (1)

La mise en données de l’histoire suit les étapes de la mise en données du monde

Dès 1959 en France, premiers articles évoquant la nécessité d’utiliser «la mécanographie»:

  • Gestion de l’abondance (actes notariés) (Furet et Daumard, 1959);
  • Croiser les informations pour en faire ressortir de nouvelles (Garelli et Gardin, 1961).

Mise en données de l’histoire (2)

Le quantitativisme des années 1960

  • Le Roy-Ladurie et l’historien programmeur (1969, 1973)

  • L’ordinateur personnel
    • 1978, Programme Kleio (Manfred Thaller), Max Planck Institut
  • Forte orientation base de données des historiens

Mise en données de l’histoire (3)

L’émergence du web permet la mise en réseaux (numériques) des historien.ne.s

  • Edward L. Ayers: The Valley of the Shadow (1994-2007)
  • Création du Center for History and New Media (Université George Mason, CHNM, Roy Rosenzweig, 1994)

Années 2000 et 2010
(«socialisation» du web, multiplication de la dataviz):

Quelle recherche historique dans un monde de données?

Historien face à une mer de données

Méthodologies

Une ère de l’abondance?

Période d’abondance des sources

Le goût de l’archive est-il toujours le même?

  • Sources primaires numérisées
  • Sources primaires nativement numériques
  • Le goût de l’archive est-il toujours le même?

Rendre l’ordinateur plus intelligent

Extrait de l’inventaire général des chartes de l’Abbaye de Saint-Denis

Évolution des pratiques

  • Comment trouver et gérer des sources primaires?
  • Comment les lire?
  • Comment écrire? (pas abordé aujourd’hui)

Image: © JR-ART.NET/ph. Guillaume Ziccarelli, courtesy Galerie Perrotin

Trouver et gérer les sources

En archives!

  • Usage de l’appareil photo numérique

En ligne

  • Trouver l’information

Des logiques qui peuvent se contredire

Logiques de recherche off et on-line ne sont plus les mêmes.

Relation aux documents primaires qui évolue

Conserver son corpus?

Conservation personnelle des documents

Conservation institutionnelle des documents numériques

Lire les sources primaires (1):
lecture proche et lecture machinique

La lecture proche est renouvelée par la lecture machinique

  • Accès aux sources numérisées
  • Les outils informatiques du quotidien (copier/coller, fonctions de recherche)

Exemples

  • L’intelligence artificielle au secours de la lecture proche: (Dominique Stutzmann)
  • L’histoire de l’annotation (Claudine Moulin)
  • Approches collaboratives des sources primaires

Lire les sources primaires (2):
lecture distante

[…] what we really need is a little pact with the devil: we know how to read texts, now let’s learn how not to read them.

Franco Moretti (Distant reading, 2014)

Les échelles de lecture

S’approprier les différents types de lecture

Les adapter aux besoins de sa recherche

Un exemple de recherche fondé sur la lecture distante
Le Centenaire de la Grande Guerre sur Twitter

Outils

Collecter et gérer ses sources

  • Rechercher les sources
    • Être familier avec les interfaces de recherche avancée
    • Connaître les opérateurs booléens
  • Collecter les sources
    • Base de données
    • Gestionnaire de données bibliographiques (zotero)
    • Cas de la collecte massive
  • Organiser les sources
    • Zotero et Tropy
    • Gestion des photos (y compris OCR)

Analyse

Nombreux logiciels.

Ex. de la fouille de texte: IRaMuTeQ / VoyantTools / MALLET

Visualisation

  • Nombreux
  • Souvent intégrés aux logiciels d’analyse
    • IRaMuTeQ ou VoyantTools
  • Gephi comme l’un des plus connus
  • Pas toujours nécessaires

Comment choisir?

Question primordiale des critères de choix.

  • Question dès le début de la recherche
  • Quels types de données?
  • Quels types de traitements et d’analyse?

Conclusion
Une critique de la mise en données de l’histoire

Les ombres de la mise en données

  • L’ordre illusoire (Ian Milligan)
  • Les ombres portées (Lara Putnam)
  • Ce qui n’est pas en ligne n’existe pas (Simone Lässig)
  • Les erreurs de mises en données (Tim Hitchcock)
  • Les choix de la mise en données (William Turkel)

Une histoire sans historiens?

Culturomics

  • Retracer l’histoire des grands mouvements culturels: Google Books Ngram Viewer
  • Lourds problèmes méthodologiques, y compris sur le corpus
  • Question des résultats. Tout ça pour ça?

Michel J.-B., Shen Y. K., Aiden A. P. et al., « Quantitative Analysis of Culture Using Millions of Digitized Books », Science 331 (6014), 12.2010, pp. 176‑182. En ligne: CrossRef, DOI: 10.1126/science.1199644.

Méthodologies critiques: un renforcement
de la méthodologie historienne?

Modifications de l’ordre du savoir: Comment exploiter les données de plus en plus importantes dans nos recherches sans succomber à l’illusion de tout savoir?

  • Replacer les usages numériques au sein d’une méthode d’analyse critique des sources (Droysen).
    • Adapter les principes de l’analyse critique des sources à la fluidité du document numérique
    • Certaines notions sont particulièrement pertinentes: “traces” (Simiand, Langlois/Seignobos)
    • Quelle capacité des historiens à assimiler les nouvelles méthodes, qui apparaîtront dans les années à venir?

Pour aller plus loin

  • Rygiel Philippe, Historien à l’âge numérique: essai, Villeurbanne, Presses de l’Enssib, 2017 (Papiers).
  • Clavert Frédéric et Noiret Serge, L’histoire contemporaine à l’ère numérique / Contemporary History in the Digital Age, Bruxelles, P.I.E.-Peter Lang S.A, 2013.
  • Muller Caroline et Clavert Frédéric, Le goût de l’archive à l’ère numérique, en ligne: http://www.gout-numerique.net/
  • Revue d’histoire moderne et contemporaine, n° 58-4bis, 2011/5.