Paris, 31 janvier 2020

Ce billet n’est ni un compte rendu ni un résumé ni une synthèse des journées  » Quels outils pour appréhender et analyser les mobilisations de Gilets jaunes et les données issues du Débat national ? » qui se sont déroulées à SciencesPo les 16 et 17 janvier dernier, mais un commentaire personnel.

J’ai assisté aux trois-quarts des interventions, portant sur l’analyse des écrits issus du mouvement, dans le cadre de la consultation gouvernementale et hors de ce cadre, mais aussi de l’expression des Gilets jaunes sur les réseaux sociaux, ou sur ce qui en a été dit dans la presse ou par d’autres acteurs, corrélés parfois à d’autres sources pour creuser les hypothèses.

Et j’ai été ravie de présenter la dernière communication du colloque, en duo avec Edouard Vasseur, professeur à l’école des Chartes; nous avons partagé notre regard diplomatique sur le matériau du Grand débat national, sur ce qu’on lui a fait dire, et sur ce qu’il peut dire encore, notamment en matière de forme de l’information, de contexte d’écriture, de mise en page, de transmission d’information, bref de tout ce qui n’est pas purement textuel dans un écrit.

Certaines communications m’ont particulièrement séduite, d’autres moins, en fonction de mes propres interrogations qui portent davantage sur la méthode d’exploitation des données que sur la teneur de leur contenu. À l’issue des deux journées, il m’est venu quelques réflexions d’ordre général sur le comment et le pourquoi de la recherche en sciences humaines face à l’actualité sociale.

Le moment le plus marquant de ces journées (du moins pour moi)

Ce qui m’a le plus frappé au cours de ces deux jours est le témoignage de Pascal Perrineau, politologue, ancien directeur du Centre de recherches politiques de Sciences Po (CEVIPOF) et surtout un des cinq « garants » désignés pour accompagner le Grand débat. Cela m’intéressait d’écouter Pascal Perrineau dans la mesure où, tout le long du déroulement du grand débat, le collège des garants (« une instance indépendante au service de la confiance des citoyens dans le grand débat national »(1)) m’avait semblé bien effacé et que son rapport à la fin de la période m’avait paru très factuel et somme toute assez peu critique.

Des propos de Pascal Perrineau, à côté d’un témoignage personnel bienveillant sur les nombreuses réunions citoyennes auxquelles il a participé, j’ai retenu une critique amère tant à l’adresse des organiseurs de l’opération que des commentateurs. Il a tout d’abord récusé le terme de garant, lui préférant celui d' »observateur » car il est excessif de parler de garants quand on ne sait pas définir ce que l’on doit garantir et qu’il est difficile de le faire lorsqu’il s’agit d’une expérimentation politique sans précédent en France. Il a tenu à rappeler que les données du Grand débat ont sept sources d’égale valeur démocratique même si leurs volumes sont très différents:

  1. la plateforme en ligne sur site GDN
  2. les réunions d’initiative locale (RIL)
  3. les cahiers citoyens
  4. les contributions libres (mails et courriers)
  5. les contributions stands itinérants (gares, bureaux de poste)
  6. les conférences citoyennes régionales (CCR)
  7. les conférences nationales thématiques

de sorte que beaucoup de commentaires, se focalisant sur une seule des sept composantes (le plus souvent sur la plateforme en ligne) déformaient la réalité des contributions des citoyens. Il a souligné également l’hypermédiatisation du président de la République qui a porté de l’ombre au Grand débat proprement dit. Enfin il a insisté sur la contradiction entre l’activisme des prestataires chargés d’élaborer des synthèses afin d’alimenter les discours du gouvernement mi-avril 2019 et l’immobilisme général face à cet immense matériau démocratique après; après le 15 avril, c’était, je cite, « Waterloo, morne plaine »! Et Pascal Perrineau d’ajouter que si les décideurs s’étaient donné la peine, depuis neuf mois, d’exploiter un peu cette mine d’information sur le pays qu’est le Grand débat, notamment sur le sujet de la retraite, le mouvement social des dernières semaines aurait été autre et tout le monde y aurait gagné.

Donc, cette déception sincère du politologue m’a frappée (je suis volontiers naïve…). Dès lors, m’intéressant au Grand débat, comme citoyenne et comme chercheur, je peux hésiter entre deux options: la première est se dire que tout cela est vain et laisser tomber; la seconde est au contraire d’y trouver un regain d’énergie pour poursuivre l’analyse et promouvoir de meilleures pratiques autour de l’écrit public, même si les politiques dans leur majorité sont sourds et aveugles à cet aspect de la vie en société.

Je veux donc réaffirmer que non seulement le matériau du Grand débat est un « trésor national » mais, au-delà de l’aspect patrimonial évoqué par plusieurs acteurs (y compris le collège des « garants » dans leur rapport), qu’il est surtout un document d’archives publiques, un document d’archives unique, constitué de données provenant de sept sources distinctes (qu’il faudrait entourer des documents d’organisation et les documents exploitation pour constituer le dossier public complet), bref, le document d’archives majeur de l’année 2019 en France. Ce que je n’ai lu ni entendu nulle part.

Quelques constats sur les travaux de recherche

Contrairement à ce qui se passe généralement dans les colloques thématiques, une des caractéristiques de ces journées MetSem sur le mouvement des Gilets Jaunes est le périmètre documentaire à la fois restreint (période de quelques mois, mouvement social et action politique bien délimités) et immense (le matériau septuple du Grand débat, les autres lieux d’expression des citoyens, et les médias au sens large). Et cette matière a suscité de nombreuses initiatives de chercheurs en sciences humaines: des sciences politiques à philosophie, de la sociologie à la littérature, de l’économie à l’histoire.

Dans ce cadre, avec l’histoire et l’activité qui sont les miennes, je retiens cinq constats sur les travaux de recherche tels que j’ai pu les observer, pendant ces journées à SciencesPo, ou depuis un an dans les médias, au fil de mes propres recherches.

Le premier constat est celui d’un cloisonnement relatif de la recherche sur la thématique. Le mouvement des Gilets jaunes et ses traces écrites intéressent, et tant mieux, des laboratoires, observatoires et chercheurs différents, peut-être plus qu’aucun autre sujet jusque-là, et merci encore à MetSem de cette initiative de journées pour fédérer et provoquer l’échange. Ainsi plusieurs équipes universitaires se sont engagées dans des travaux similaires, le plus souvent sans se connaître ou du moins sans avoir connaissance des travaux initiés dans d’autres structures, non moins publiques.  L’exemple le plus révélateur de cette pluralité d’initiatives parallèles est la mise en évidence d’au moins six démarches différentes de collecte de comptes Facebook consacrés au mouvement des GJ, débouchant sur des corpus différents en fonction de la méthode adoptée, du périmètre géographique et de la période étudiée, ce qui appelle à une mutualisation mais est aussi un fait intéressant analyser en soi.

Le second constat concerne la nature très ténue du lien entre la réalité des archives de la nation et le monde de la recherche. Les cahiers citoyens, dit cahiers de doléances (2), sont une des sept composantes du Grand débat et ont été à ce titre étudiés par plusieurs chercheurs et évoqués au cours de ces journées. Or, à la question posée: « Mais où sont les originaux des cahiers de doléances? », on pouvait constater que peu de personnes connaissaient la réponse. Hormis le passage par la Bibliothèque national de France (BnF) qui a surmédiatisé son rôle d’agent numérisateur de papier dans cette affaire, la réalité du cheminement des cahiers est mal connue et, devant ce point d’interrogation, on a vite fait de les qualifier d' »introuvables ». C’est d’ailleurs ce qu’ont fait les journalistes de France2 dans le titre à sensation du sujet diffusé le lundi 13 janvier: « Grand débat national : un an après, le contenu introuvable des cahiers de doléances » tout en expliquant dans la vidéo que les cahiers originaux, avec parfois quelques aléas de parcours, ont été versés aux Archives départementales de chaque département, avec l’interview de la directrice d’un service d’Archives départementales à l’appui. Les cahiers de doléances ne sont donc pas introuvables mais il faut bien avouer que leur confinement dans des boîtes en carton dans cent magasins d’archives répartis sur le territoire national – organisation familière aux seuls initiés – est de nature à alimenter le « on nous cache tout, on nous dit rien » qui m’avait déjà fort irritée dans l’ouvrage de Sonia Combe, Archives interdites, en 1994.

On peut voir là une simple anecdote mais on peut y voir aussi la conséquence d’un effacement singulier de l’administration française des Archives dans la vie démocratique car son excessive discrétion tout au long du Grand débat est assurément plus un défaut qu’une vertu dans notre société fakenewsisante. Car, je me répète, le matériau du Grand débat national, avec ses sept composantes, est le document d’archives par excellence de l’année 2019, celui que la France devrait emporter dans sa valise si elle devait séjourner sur une île déserte…

Les archives et la documentation publiques (la question des données ouvertes de l’administration est très liée à la politique archivistique d’un pays; c’est évident mais il n’est pas inutile de le rappeler) n’ont pas la visibilité qu’elles devraient avoir. Certes les médias parlent comme jamais des archives numérisées, des sources de la connaissance du passé, mais cela ne doit pas empêcher de gérer la connaissance du présent. Ne répète-t-on pas à l’envi cette formule que le présent est le passé du futur? Le repli confortable des institutions archivistiques sur la sympathique matière historique n’est pas en phase avec cette déclaration (3), pas plus que la quasi-absence de conscience archivistique chez nos gouvernants qui témoignent de bien peu de sollicitude que ce soit pour la conservation des traces de l’expression du gouvernement, de ses représentants ou commis, ou pour la conservation des traces de l’expression des citoyens.

Autre remarque: les travaux de recherche font apparaître le recours à une pluralité de méthodes et d’outils appliqués et applicables aux données collectées. En premier lieu, des outils d’analyse textométrique (logiciel TXM) et d’analyse du discours (Iramuteq pour Interface de R pour les Analyses Multidimensionnelles de Textes et de Questionnaires); ensuite, des méthodes d’interprétation des données et les référentiels associés comme le score Epices pour déterminer la précarité des individus; également des outils d’aspiration de contenus sur Internet tels que CrowdTangle et Mediacloud utilisés par le Medialab, et aussi, plus modestement les enquêtes par questionnaires et les outils de traitement automatique des réponses sur support papier avec, par exemple, le logiciel OMR (Optical Mark Recognition). À quoi on pourrait ajouter les méthodes et outils des prestataires officiels du Grand débat national avec le recours à QWAMTextAnalytics pour l’exploitation des données en ligne et la construction d’un référentiel (cartographie lexicologique, identification des propositions et lexicalisation) pour les autres sources, ainsi qu’on peut le lire dans les documents méthodologiques publiés sur le site du Grand débat.

Ce pourrait être l’occasion d’établir une cartographie de ces méthodes et outils. L’idée est de mettre en regard les traitements comparables sur des corpus comparables, d’identifier les atouts et limités des uns et des autres, et peut-être de formuler de nouvelles questions sur la fabrication du corpus et les enjeux sociologiques et démocratiques de ce mouvement.

Le constat qui me concerne le plus, en raison de mes propres recherches sur le sujet, vise le poids des mots dans les analyses des données du Grand débat, dans les travaux présentés lors des journées MetSem et plus encore dans les synthèses officielles réalisées par les prestataires en communication du gouvernement. Le « poids des mots » ne s’oppose pas ici au « choc des photos » du slogan de Paris-Match (encore qu’un travail comparatif entre les mots et les images du mouvement qui ont circulé sur les réseaux sociaux serait tout à fait intéressant). Je veux parler du poids des mots dans les analyses, en opposition aux messages « extra-mots » (« péri-mots » ? « para-mots »?) des écrits du Grand débat. Il s’agit de toute l’information que les écrits véhiculent au-delà des mots du contenu exprimé, de tout ce que la forme de l’écrit dit en plus des mots. La diplomatique s’intéresse au support, à la mise en page, à l’identité du scripteur, à l’écriture, au style, à l’ordre des phrases, aux silences ou aux blancs, aux ratures, aux dates… J’y ajoute tous les éléments de contexte de la production de cet écrit : lien avec des événements qui ont favorisé ou freiné sa production, appartenance à une entité écrite plus large et positionnement au sein de cette entité (une entrée dans un cahier par exemple), provenance des formules le cas échéant, duplication de l’écrit sous la même forme ou sous une autre forme, etc. Ces aspects ont été abordés par certaines équipes mais elles se limitent généralement aux écrits manuscrits (les cahiers) alors que l’étude de la forme des écrits numériques est également prometteuse d’enseignement. Sans doute ce qui est exprimé par les contributeurs au Grand débat, le discours conscientisé, est-il l’essentiel; cependant, l’étude de la forme est non seulement instructive mais aussi garante de certaines déformations ou d’interprétations erronées. Certes, le traitement automatisé des contenus oblige à « nettoyer » le corpus étudié mais je ne peux m’empêcher de penser que ce nettoyage devrait s’accompagner d’étiquettes ou de tags décrivant en mots ou en signes interprétables par la machine ce qui est perdu par le formatage. Surtout, l’étude de la forme n’est pas une fin en soi ; c’est un moyen – parmi d’autres – de dépasser le comptage mécanique de mots pour tirer du matériau non seulement le quoi mais aussi le pourquoi et le comment.

Le cinquième et dernier constat est un constat fait par plusieurs intervenants et notamment l’équipe de chercheurs de l’INRIA, à savoir que la synthèse officielle du Grand débat n’est qu’une interprétation possible du contenu des contributions, parmi beaucoup d’autres. Les contributions de ces deux journées d’étude ont confirmé cette observation. Plutôt que rechercher la synthèse idéale, sans doute faut-il provoquer la production de plusieurs synthèses spécifiques pour faire jaillir la lumière la confrontation, voire de la contradiction, de toutes les facettes.

Le matériau du Grand débat, bien que constituant un document d’archives unique et indissociable en tant que réponse à une consultation du gouvernement, est un objet complexe et tentaculaire qu’il convient de prendre en photos sous différents angles, avec différents éclairages, mais en documentant les matériels utilisés, la localisation et l’heure de la prise de vue!

Pour aller plus loin

Il faut souhaiter que les chercheurs en sciences humaines et sociales poursuivent leurs travaux sur les écrits et données du mouvement des Gilets jaunes et du Grand débat national, afin de pallier la défection du gouvernement dans l’analyse de ce matériau qu’il a su produire mais absolument pas gérer à sa juste valeur. La dimension internationale, à peine esquissée lors des journées MetSem, mérite aussi d’être approfondie.

L’objectif de ces travaux mérite d’être réaffirmé, car il est double: d’un côté, la recherche universitaire qui a ses exigences méthodologiques et déontologiques et qui s’inscrit dans le temps long de la connaissance ; de l’autre côté, une réponse à un mouvement social avec le temps court du calendrier politique et social. Or, les deux ne sont pas totalement incompatibles.

La tâche est difficile, certes, et ce qui est fait est fait. Mais il serait judicieux, comme le suggérait Pascal Perrineau, de capitaliser les compétences pour faire mieux la prochaine fois, à l’occasion d’autres consultations, d’autres débats publics, même s’ils n’ont pas forcément la même ampleur, la même forme, la même pression sociale que le mouvement des Gilets jaunes.

Il est regrettable que le traitement officiel des données du Grand débat ait été exclusivement confié à des prestataires communicants et technologistes même si ces derniers ont réalisé un travail qui a aussi son intérêt. Pour ma part, je souhaiterais que les pouvoirs publics fassent à l’avenir plus grand cas des compétences publiques dans la gestion des archives publiques, qu’ils anticipent les projets en s’appuyant davantage sur le savoir-faire des chercheurs et des professionnels en matière de gestion de l’information, afin de ne pas tâtonner et bricoler dans l’organisation d’un « Grand débat national », afin d’améliorer la production de l’écrit quel qu’en soit le support, pour garantir le respect de sa complétude et de son intégrité, pour optimiser le processus de sa conservation et de sa mise à disposition. Je pense à la diplomatique, évidemment, mais pas uniquement.

J’invite les personnes intéressées par le sujet à poursuivre leur lecture avec l’article que j’ai signé dans le numéro de février de la revue américaine Records management journal: « The Potential for collaboration between AI and archival science in processing data from the French Great National Debate« .

Les sciences de l’information ont quelque chose à dire du Grand débat national!

(1) Voir le rapport du Collège des garants du Grand débat national, en date du 9 avril, https://granddebat.fr/media/default/0001/01/ee2712c96c5035c3c2913174a7b5535fc52642a4.pdf. Le rapport n’est pas si facile à trouver sur le site du Grand débat où tous les documents proposés ont une URL qui commence par https://granddebat.fr/pages, tandis que là, c’est https://granddebat.fr/media

(2) Le terme officiel est « cahiers citoyens » mais l’expression « cahiers de doléances » lancée par les premiers maires à ouvrir des registres dans leur mairie dès novembre 2018 a perduré comme terme « vulgaire ».

(3) Il ne faut pas confondre l’institution et ceux qui y travaillent et je sais bien qu’un nombre non négligeable de personnes qui exercent consciencieusement leurs compétences dans l’administration des Archives partagent ce point de vue d’un rôle accru des archivistes publics dans la vie de la cité et de la nation, autrement au travers d’expositions patrimoniales par ailleurs captivantes. C’est aussi une question de politiques publiques et une question de droit car l’insertion de la loi sur les archives (avec ses défauts et ses qualités) dans le code du patrimoine est de toute évidence un frein à l’inclusion de l’archivistique dans la vie administrative de la France.

Post-scriptum

En discutant de mon billet avec quelques collègues, j’ai noté un étonnement devant ma façon de qualifier de « document d’archives unique » l’ensemble des données du Grand débat national (les cahiers, les contributions en ligne, les comptes rendus, les courriers…); plusieurs personnes proposaient l’expression « fonds du Grand débat », comme on a parlé du « fonds du mémorial du Bataclan ». Je maintiens ma position: c’est UN document dans le sens où je considère cette masse comme une unité intellectuelle constituant, dans sa totalité, la réponse de la population à la question du gouvernement; du reste, Pascal Perrineau, sans le savoir, me donne raison.
Un fonds, c’est autre chose. Du moins, la définition du fonds actuellement autorisée (je parle de celle de Michel Duchein) désigne autre chose. Ça me donne envie d’écrire un billet…