Le Big data est le nouveau laboratoire de l’humanité.

La formule m’est venue en lisant dans le Monde daté du 8 janvier 2014 un article de David Larousserie intitulé Les médias dans la moulinette du « big data ». Ce n’est pas la matière médiatique qui retient mon attention dans cet article mais le témoignage des chercheurs qui analysent les masses vertigineuses de données.  Et la question est la même, qu’il s’agisse des médias en ligne, de n’importe quelle page web, des grandes bases de données (publiques ou plus ou moins confidentielles) ou des myriades de données quotidiennes et personnelles moissonnées par les objets connectés, tous gisements  dont le tour de taille enfle chaque jour un peu plus.

Dans l’actualité, le terme laboratoire, eu égard à la pression des questions de santé, désigne le plus souvent un laboratoire pharmaceutique, non pas du reste dans sa fonction de recherche, mais dans la fonction de commercialisation de l’entreprise qui possède le laboratoire de recherche et qui met sur le marché les médicaments issus des recherches. Mais il n’y a pas de laboratoire que pharmaceutique ; il y a aussi le laboratoire de recherche du CNRS, le laboratoire du pâtissier, le laboratoire photographique, le laboratoire de langue, etc.

Qu’est-ce qu’un laboratoire? Le lieu où s’élabore quelque chose, un produit, une solution, un lieu où la manière est travaillée par des chercheurs qui collaborent dans la recherche d’un résultat, réalisent des expériences scientifiques, linguistiques, artistiques, gastronomiques … (pour mémoire : labor = travail en latin). La matière vive de notre siècle est l’information, la donnée, au sens générique comme on dit la terre, l’eau, le minerai. Il s’ensuit que la somme des données mondiales connectées et surtout connectables constitue un vrai laboratoire à l’échelle de l’humanité, une matière immense, un corps informationnel en mouvement permanent, une poudre numérique en perpétuel travail. Les données sont provoquées, accélérées, orientées, détournées par les outils informatiques de fabrication, de diffusion et de traitement des contenus et des traces. Avec, à la clé, des réactions quasi-chimiques qui provoquent des transformations de matières, des mutations et parfois des explosions…

Traditionnellement, le laboratoire est capable du meilleur (cf Fleming et la pénicilline) comme du pire (cf Frankenstein)… Or, avec le Big data, il n’y a pas de chef du laboratoire ; les données ont déjà pris leur autonomie, leur envol…

Dans l’article du Monde cité ci-dessus, l’auteur souligne que l’on a dépassé le stade de la banque d’information et de son moteur de recherche qui permettait (et permet toujours) de recueillir très rapidement les réponses documentaires à une requête précise, comme tant d’internautes le pratiquent avec Wikipédia. Le stade actuel est celui de l’observation et de la transformation de la matière informationnelle mondiale, à la manière d’un gigantesque laboratoire qui dans un premier temps analyse les molécules plus  qu’il ne les exploite dans un but pratique prédéfini. Or, les données sont si nombreuses et si fluctuantes qu’on ne peut les contenir, mesurer vraiment leur périmètre, cataloguer leur production. Il faut faire des expériences, explorer les masses, identifier leur provenance, caractériser leur circulation.

L’article donne une citation Marie-Luce Viaud, chercheuse à l’INA (coordinatrice du projet OTMédia au département Recherche d’Ina Expert) que je reprends ici : « Il est facile de dire des choses fausses avec ces outils » exprimant la prudence que le chercheur doit montrer vis-à-vis des nouveaux outils d’exploitation des images collectées (recherche d’image, détecteur d’événements) dans ce projet d’Observatoire Transmédia, mais la remarque est extensible à l’ensemble du Big data.

Cette réflexion met en évidence la nécessité d’effectuer un travail de veille, le besoin de documenter l’aide à la décision des pouvoirs politiques comme des contre-pouvoirs au moyen d’une analyse rigoureuse de la matière numérique, échantillonnée dans des éprouvettes connectées, testée dans des cornues réseautées, en tenant un « cahier de laboratoire » qui enregistre et trace les gestes et les choix des humains sur ce nouvel élément planétaire. Une démarche scientifique où la sérendipité a toute sa place (sens en éveil pour capter dans le cours des événements les éléments propres à faire avancer la connaissance de l’humanité).

1 Commentaire

Commentaires fermés