«To datafy a phenomenon is to put it in a quantified format so it can be tabulated and analysed.»
Mayer-Schönberger, Viktor, et Kenneth Cukier. Big Data: A Revolution That Will Transform How We Live, Work, and Think. Boston: Houghton Mifflin Harcourt, 2013, p. 72.
Antérieure à l’ère numérique / Accélération
Données de toutes sortes / réutilisables à différentes fins
Données massives: Déluge de données
Google Books et Google Ngram Viewer
the raw material produced by abstracting the world into categories, measures and other representational forms […] that constitute the building blocks from which information and knowledge are created.
Kitchin Rob, The Data Revolution: Big Data, Open Data, Data Infrastructures and Their Consequences, Thousand Oaks CA, SAGE Publications Ltd, 2014.
Capta is “taken” actively while data is assumed to be a “given” able to be recorded and observed.Drucker Johanna, « Humanities Approaches to Graphical Display », Digital Humanities Quarterly 005 (1), 10.03.2011.
La mise en données du monde d’aujourd’hui combine plusieurs phénomènes de plus long terme
Chacun de ces éléments a une histoire plus longue que celle de leur création.
Touche tous les aspects de la société, donc toutes les sources primaires, passées ou « futures »
Il y a aussi mise en données de l’histoire
La mise en données de l’histoire suit les étapes de la mise en données du monde
Dès 1959 en France, premiers articles évoquant la nécessité d’utiliser «la mécanographie»:
Le quantitativisme des années 1960
Le Roy-Ladurie et l’historien programmeur (1969, 1973)
Forte orientation base de données des historiens
L’émergence du web permet la mise en réseaux (numériques) des historien.ne.s
Années 2000 et 2010
(«socialisation» du web, multiplication de la dataviz):
Historien face à une mer de données
Période d’abondance des sources
L’évolution des sciences historiques depuis l’entre-deux-guerres
Inflation archivistique depuis 1945
Extrait de l’inventaire général des chartes de l’Abbaye de Saint-Denis
Image: © JR-ART.NET/ph. Guillaume Ziccarelli, courtesy Galerie Perrotin
En archives!
En ligne
Des logiques qui peuvent se contredire
Logiques de recherche off et on-line ne sont plus les mêmes.
Relation aux documents primaires qui évolue
Conservation personnelle des documents
Conservation institutionnelle des documents numériques
La lecture proche est renouvelée par la lecture machinique
Exemples
Franco Moretti (Distant reading, 2014)
S’approprier les différents types de lecture
Les adapter aux besoins de sa recherche
Nombreux logiciels.
Ex. de la fouille de texte: IRaMuTeQ / VoyantTools / MALLET
Culturomics
Michel J.-B., Shen Y. K., Aiden A. P. et al., « Quantitative Analysis of Culture Using Millions of Digitized Books », Science 331 (6014), 12.2010, pp. 176‑182. En ligne: CrossRef, DOI: 10.1126/science.1199644.
Modifications de l’ordre du savoir: Comment exploiter les données de plus en plus importantes dans nos recherches sans succomber à l’illusion de tout savoir?
Comment choisir?
Question primordiale des critères de choix.