Culture is future » Innovation et numérique

25.04.2012

Article - « Les sciences culturelles », dernières nées de la société de la connaissance

A l’assertion « vous ne pouvez pas quantifier la culture », les ingénieurs de Harvard – inventeurs des culturomics- répondent que rien n’empêche néanmoins d’utiliser des méthodes quantitatives pour étudier la culture… L’idée est d’associer « n-grammes » à certains événements de nos sociétés. Créé par Claude Shannon, théoricien de l’information, l’objectif de cette modélisation était de déterminer la probabilité de la prochaine lettre après la publication d’un mot. Reprenant le modèle de Markov, les n-grammes sont la réutilisation des n-dernières lettres d’un mot pour prédire la lettre suivante…

Les ingénieurs ont ainsi repris ce modèle afin de caractériser certains stigmates d'une société en un temps et dans un endroit donné. Par exemple, lorsque vous saisissez 'Culture' (ou Rembrandt ou Voltaire ou Martin Luther King ou pétale de rose), vous pouvez visualisez le nombre de fois où ce mot a été utilisé dans les livres référencés dans Google. Produit à partir de la numérisation massive des livres par Google, les culturomics, dont la traduction française n’est pas encore née mais qui pourrait s'apparenter à « sciences culturelles », le logiciel utilise le corpus numérisé de l’entreprise américaine – qui contient environ 4 % de l’ensemble des livres imprimés depuis 200 ans dans le monde.

Dérivé des sciences qui ont une terminologie anglo-saxonne se terminant par « omics », les culturomics seraient donc une science née de l’association des nouvelles technologies, des outils statistiques et de la littérature. Il permet d’assembler des données et de les réorganiser. L’objectif est notamment de proposer aux chercheurs et étudiants un nouveau terrain de jeu : investiguer quantitativement les évolutions culturelles des différentes sociétés à travers le temps. En se focalisant sur le phénomène linguistique et culturel, matérialisé dans les livres, entre 1800 et 2000. Plusieurs phénomènes peuvent être alors étudiés : la grammaire, l’épistémologie, l’adoption de certaines technologies, censure, la perception des événements historiques ou l’adoption de différents courants de pensée.

Dans un article daté du 14 janvier 2011 dans Sciences Magazine, les chercheurs Erez Lieberman, Jean-Baptiste Michel, Joe Jackson, Tina Tang et Martin A. Nowak, ont notamment démontré l’évolution entre l’anglais ancien et l’anglais moderne à travers l’emploi des verbes irréguliers. Nous pouvons ainsi observer une baisse de 51 % de leur utilisation entre l’ancien, tel qu’usité en 1800 et le moderne, celui des années 2000.

Encore un nouveau champ d'investigation qui s'offre à nous pour comprendre toujours et encore mieux notre Histoire, nos cultures, nos langues et leurs influences à travers le temps. Cet embryon ou dernier rejeton de la société de la connaissance, à l'instar du web sémantique, suscite bien sûr de nombreuses interrogations. Gageons que sur ce terrain, la bataille de la propriété intellectuelle ne fait qu'ajouter une ligne de front supplémentaire. Gageons également que le même travail de culturomics sur les milliards de pages que compte le web depuis Internet grand public en 1995 serait également instructif...