Les sociologues doivent prendre conscience que les données des médias sociaux offrent une image déformée de la réalité, avertissent des informaticiens américains de l'université Carnegie Mellon.

Twitter, Facebook et Instagram sont des objets d'étude prisés par les sociologues. Pourtant, leurs données déforment la réalité, soulignent des experts américains.
Vous avez sans doute entendu parler de sondages d'opinion basés sur Twitter, comme "X % des utilisateurs ont tweeté sur le sujet Y". Ces études ne sont que la partie visible de l'iceberg. Les sociologues exploitent massivement Facebook, Instagram et Twitter pour leurs recherches sur les données. C'est compréhensible : ces plateformes sont bon marché, rapides, accessibles et regorgent d'informations.
Cependant, des informaticiens américains mettent en garde contre un usage trop naïf de ces médias comme sources de recherche. Dans un article publié dans Science, ils insistent sur les biais importants. Par exemple, Instagram compte une surreprésentation de femmes non blanches dans la vingtaine, tandis que Pinterest attire surtout des personnes aisées âgées de 25 à 34 ans. Loin d'un échantillon représentatif de la population, notent les chercheurs de Carnegie Mellon, qui reprochent aux sociologues de négliger souvent ces distorsions.
De surcroît, les utilisateurs peuvent modifier ou supprimer leurs publications, altérant la fiabilité des résultats. Sans oublier les comptes de célébrités ou d'entreprises qui se mettent en valeur, ou les faux comptes. Filtrer ces anomalies dans d'énormes volumes de données est extrêmement complexe. (adw)