Les données de la recherche du célèbre psychologue Dan Ariely ont été inventées, selon une analyse approfondie. Qui a fait cela et pourquoi n'est pas clair.
L'influent professeur israélo-américain de psychologie Dan Ariely est sous le feu des critiques. Les données d'une de ses études semblent avoir été fabriquées. Ariely est connu pour ses enquêtes sur les comportements malhonnêtes et irrationnels.
Il s'agit d'un article de 2012 sur un certain nombre d'expériences. L'une de ces expériences a montré que ceux qui signent à l'avance une déclaration d'équité au début d'un document sont plus honnêtes quant au kilométrage de leur voiture que ceux qui signent cette déclaration au bas du document. Une partie de la recherche a été effectuée en collaboration avec une compagnie d'assurance automobile. Les clients qui ont signé en haut du document ont signalé un kilométrage plus élevé. Parce que les clients paient moins de prime s'ils conduisent moins, ils sont parfois malhonnêtes à ce sujet.
En 2020, Ariely et ses collègues ont mené des expériences similaires montrant que cela ne fait pas vraiment de différence que la déclaration d'équité soit en haut ou en bas du document. Ariely et ses collègues ont alors constaté une divergence dans les données de l'étude :avant même que les clients soient classés dans l'un des deux groupes (signe en haut ou en bas du document), le kilométrage de ces groupes différait. Une telle réplication ratée n'indique pas nécessairement une fraude, mais lorsque les données collectées sont ensuite étudiées de manière encore plus approfondie par des scientifiques indépendants de la plateforme Data Colada, il s'avère que tout est faux avec les données.
Par exemple, statistiquement, vous vous attendriez à ce que la plupart des clients parcourent approximativement le nombre moyen de kilomètres et qu'il y ait moins de clients qui parcourent extrêmement ou extrêmement peu de kilomètres. Cela s'est avéré ne pas être le cas. De plus, les clients ont effectué leur kilométrage moins souvent que prévu et il semble y avoir une duplication dans les données. Les enquêteurs l'ont découvert parce que deux polices différentes ont été utilisées dans le fichier. Il semblait y avoir un certain nombre de « paires » de clients avec quatre voitures assurées, inscrites avec des polices différentes, dont le kilométrage de ces quatre voitures était toujours très similaire. Bien plus que ce à quoi vous pouvez vous attendre en fonction du hasard. Les scientifiques de Data Coloda concluent que les données diffèrent tellement de ce à quoi ressemblent les « vraies données » qu'elles doivent avoir été inventées. Ils peuvent avoir été fabriqués via un générateur de nombres aléatoires.
Cependant, ils disent qu'il est presque impossible de déterminer qui est derrière. Dan Ariely dit qu'il était le seul à avoir eu des contacts avec la compagnie d'assurance automobile, mais nie avoir quoi que ce soit à voir avec les données fabriquées. Il déclare qu'il a reçu les données de la société de cette manière et qu'il n'a pas participé à sa création.
Selon Pedro De Bruyckere, pédagogue et chercheur (Université de Leiden), il est en effet certain à cent pour cent que les données de la recherche sont incorrectes. Mais on ignore encore si la fraude a vraiment eu lieu et qui est derrière, selon lui. "Ça soulève beaucoup de questions. Par exemple, Ariely dit qu'il n'a rien fait avec les données, mais comment peut-il le prouver ? Tous ceux avec qui il était en contact à l'époque avec la compagnie d'assurance n'y travaillent plus non plus. Et quel pourrait être le motif de la compagnie d'assurance pour fournir les données ? '
Si Ariely dit la vérité, n'aurait-il pas dû voir que les données étaient fausses ? Le Bryuckere est assez doux. "La question est de savoir s'il aurait pu voir ça. Une vingtaine de collègues travaillaient également autour de Diederik Stapel (professeur néerlandais de psychologie qui s'est avéré frauduleux, ndlr) qui n'en avait aucune idée. De plus, les motifs indiquant une contrefaçon sont très difficiles à repérer. De vrais détectives ont travaillé ici. En outre, certains écarts dans les données peuvent également être expliqués. Une formule ne peut pas être juste, les ordinateurs peuvent faire des erreurs...'
Les chercheurs de Data Colada proposent que désormais toutes les données de recherche soient rendues publiques afin que la fraude puisse être détectée plus tôt. Cela augmenterait également le seuil de fraude. De Bruyckere estime que nous avons certainement appris quelque chose de l'affaire Diederik Stapel, mais que nous devrions répéter les études plus souvent pour voir si les résultats sont les mêmes. "Parce que ces erreurs sont révélées, la science peut réellement se développer, se réparer, pour ainsi dire. Cela montre aussi qu'il est bon de faire de nombreuses réplications. Il reste à voir ce que cela signifiera exactement pour la carrière d'Ariely. »