« La data, une nouvelle arme de séduction massive » pouvait-on lire dans Les Echos en 2013.

« La Data, levier pour personnaliser sa présence digitale » titrait le Journaldunet en 2014.

« La data va-t-elle envahir les stades ? » se demandait le site www.frenchweb.fr un peu plus tard.

Ah ! Cette manie de parler anglais en massacrant le latin…

Data est une forme plurielle. Data évoque le collectif, le tout, la masse. Le mot ne vise pas un élément unique qui serait donné (en latin datum, supin du verbe dare), une donnée unitaire, autrement dit un nom, un lieu ou une date. Eh oui ! la date de temps a la même origine que la donnée ; elle s’opposait autrefois à la date de lieu laquelle s’est perdue il y a quelques siècles déjà mais la voici qui revient avec le numérique et la géolocalisation. LA donnée, c’est encore une adresse IP, un objet, un nombre, un prix, une vitesse, une température, un degré, une direction, etc. Ce sont des milliards d’identités, croisés avec des milliards de lieux et agrégés à des milliards de valeurs qui constituent jour après jour LES « data ».

Data est aussi une forme grammaticale neutre, le pluriel latin de datum, ingéré tel que par la langue anglaise. Mais le français ignore le neutre. En France, il faut du sexe, en tout cas du genre, féminin ou masculin, mais pas du neutre ! Laissez-donc le neutre aux Allemands, aux Russes et autres Grecs. No comment, au plutôt si : « Dis-moi comment tu parles, je te dirai comment tu penses… ».

Le mot data féminisé, c’est tout un symbole. Faut-il y déceler une réaction subconsciente à la parité forcée qui obsède la société depuis quelque temps, une manière subreptice de souligner la facette maligne, exubérante, envahissante, virevoltante, et parfois affriolante de la donnée ? On peut noter aussi que la terminaison nous rapproche de la pampa, la mafia, la malaria, la paranoïa et bien évidemment la cata ! Mama mia ! Gageons que l’on va bientôt nous parler de la politique de la quota pour les migrants ou de la physique de la quanta. Tous les espoirs sont permis.

Bref, ça (les données) s’accumule, à chaque seconde, dans chaque lieu, derrière tous les écrans, petits et grands, lumineux et ensommeillés, autour de chaque capteur sur la terre et autour de la terre. Et ça donne ce que trois terminologues et un linguiste appellent, avec pertinence pourtant, les « mégadonnées » mais que le reste de la planète appelle le big data. LE big data ? Forcément, si c’est « big », c’est masculin, non ? Ou alors, on pourrait écrire la bigue data, ce qui n’est pas mal finalement (une petite connotation fruits secs pour atténuer la froideur technologique).

La data s’accumule, plus vite, plus haut, plus fort. La data tient une forme olympique !

La data s’accumule et se sédimente sur les data centers comme la mousse et les lichens sur les tombes mal entretenues.

La data s’accumule et s’agglutine sur les disques comme les mouches sur les bouses de vache par forte chaleur.

La data s’accumule et s’agrippe aux serveurs comme les grattons aux chaussettes dans les sous-bois.

La data s’accumule puis se jette sur l’internaute comme jadis la vérole sur le bas clergé…

« La data c’est GAFA, la datum c’est Badaboum » affirme le manifeste DATADADA d’ Albertine Meunier et Julien Levesque (juin 2014). Ma foi, c’est un bon résumé de la situation.