Pizza, marteau et limites de la rationalité : critique d'une analyse culturelle via Google Books

Pouvez-vous déduire des données Google Books que nous devenons plus émotifs ? Le linguiste Hendrik De Smet questionne la méthode dite "d'analyse culturelle".

Les conclusions d'un article récent publié dans PNAS, revue prestigieuse de l'Académie nationale des sciences américaine, alimentent le pessimisme culturel. Les auteurs affirment : "[N]os résultats suggèrent qu'au cours des dernières décennies, l'intérêt public est passé du collectif à l'individuel, et de la rationalité à l'émotion." Cette affirmation repose sur une analyse statistique de 5 000 mots anglais fréquents sur 200 ans, via Google Books. Les chercheurs – Marten Scheffer, Ingrid van de Leemput, Els Weinans et Johan Bollen – titrent leur étude La montée et la chute de la rationalité. Mais avant d'adhérer, examinons si les chiffres du big data trompent.

Cet article s'inscrit dans l'"analyse culturelle", qui infère les évolutions sociétales des fréquences de mots dans de vastes corpus historiques. Testez via Google Ngram Viewer : un graphique compare Frankenstein, Sherlock Holmes et Albert Einstein (figure 1).

Pizza, marteau et limites de la rationalité : critique d une analyse culturelle via Google Books

Frankenstein émerge en 1818, Holmes au XIXe siècle, Einstein au XXe. Einstein domine puis décline, Frankenstein remonte, Holmes explose récemment. L'instinct pousse à chercher des causes – typique des ères conspirationnistes. Scheffer et al. scalent cela avec des stats avancées.

Ces approches séduisent par leur objectivité apparente sur une culture complexe. Mais circularité, pièges techniques et linguistiques guettent. Sans tout détailler, soulignons les failles majeures.

Preuves

Scheffer et al. identifient un "bâton de hockey incliné" : hausse parallèle de mots post-1980. Exemple : angry (en colère) stagne jusqu'aux années 1980 puis explose (figure 2, fréquences normalisées).

Ce groupe évoque émotions et individualité (breakfast, by, hang, sky inclus). Inversement, reasonable croît puis chute. Vers 1980, émotion vs raison, individu vs collectif ?

Fréquences des mots

Les changements culturels se reflètent dans le langage, mais pas toujours simplement. Pizza explose mid-XXe, cohérent avec la consommation (figure 3).

Mais hammer et nail (figure 4) intriguent : marteaux dominent 1850-1930 sans clous proportionnels, puis inversion.

Problèmes : 1) Fréquences fluctuent pour raisons obscures. Scheffer agrège mots, mais sous-estime. 2) Polysémie : nail = clou/ongle. Mots comme cry (pleurer/crier) varient contextuellement. Synonymes abondent (120 pour "anger").

Sans lien bijectif mot-concept, interpréter fréquences est risqué. Scheffer ignore cela, central à leur thèse.

Google Books

Google Books est biaisé : composition temporelle instable. Préférez COHA (Corpus of Historical American English), équilibré. Test : top mots Scheffer (angry, look, walk, unexpected, sleep) ne montrent pas le "bâton de hockey" en COHA (figure 5). Seul unexpected s'approche ; autres culminent 1980-90.

Contradiction due à biais Google (sélections, genres). Sans corpus fiable, scepticisme. Autres données Scheffer floues sur 1980 pivot.

Faits vs sentiment

Big data promet, mais sans rigueur, il fausse. Hypothèses douteuses privilégient ressenti sur faits – ironie face à leur thèse. Privilégiez corpus pour ancrer la science.

[]

Santé mentale : un spectre nuancé face aux diagnostics rigides du DSM Les secrets des orgasmes multiples chez les femmes : révélations d'une étude scientifique

10 meilleures alternatives à Windows 7 après sa fin de support en 2020

Une mouche parasite menace l'extinction du pinson de Darwin aux Galápagos

Pourquoi Wikipédia anglais a-t-elle été inaccessible 24 heures ? Le blackout contre SOPA et PIPA

La fin de la science est-elle inévitable ? Une analyse approfondie

Système immunitaire hyperactif : un risque accru de dépression scientifiquement démontré

Vaincre les cauchemars avec une fin heureuse : l'efficacité prouvée de la thérapie IRT