Qu'est-ce que trois Allemands d'UAntwerp ont à voir avec l'énorme puissance de calcul des consoles de jeux ? En bref :ils enseignent aux ordinateurs comment fonctionne le comportement humain. "Le langage reflète l'essence de qui nous sommes en tant qu'humains."
Comment l'administrateur d'un forum de chat en ligne peut-il savoir si dans l'une des innombrables conversations qu'il doit superviser, un bavard franchit la ligne et insulte les autres ? Ou comment les parents peuvent-ils remarquer que leur adolescent est fortement intimidé sur les réseaux sociaux, quel fils ou quelle fille les protège soigneusement ? Et dans le prolongement de ce dernier :comment ces parents savent-ils que le comportement de cyberintimidation ne s'intensifie pas au point que leur enfant est aux prises avec des pensées suicidaires, et le montre également en ligne ?
De telles situations deviennent de plus en plus courantes et les parents et les enseignants sont toujours époustouflés par la gravité de la situation. Alors que la réponse aux trois questions est simple :demandez à l'ordinateur. C'est du moins ce que pensent les chercheurs du centre de recherche CLiPS. Ce nom signifie Computational Linguistics and Psycholinguistics, un groupe fondé en 2003. Ils développent actuellement un outil qui cyberbullying reconnaître et même déterminer à partir des publications en ligne de quelqu'un si cette personne présente un comportement dépressif. Une fois opérationnel, l'outil peut servir de filtre pour les boîtes de discussion ou les médias sociaux, par exemple dans le cadre d'un programme anti-virus, et alerter les modérateurs, les parents ou les enseignants en cas de problème.
La recherche fait partie du projet AMiCA, qui est développé en collaboration avec l'UGent et la KULeuven, et qui peut également identifier et signaler les comportements sexuellement transgressifs sur les réseaux sociaux. Non pas parce que l'outil envoie un avertissement aux parents à chaque fois qu'il s'agit de relations sexuelles. Mais en vérifiant que quelqu'un qui dit dans son profil qu'elle est une fille de 15 ans, par exemple, n'est pas vraiment une pédophile de 50 ans. Comment? En analysant ce que cette personne écrit et comment elle utilise sa langue.
Ce dernier indique à quel point la science derrière ces applications est complexe. Et qu'est-ce que la langue a à voir avec les ordinateurs et la recherche de données, comme la linguistique computationnelle indiquer dans CLIPS. Il s'agit d'intelligence artificielle. À propos d'un ordinateur qui comprend que quelqu'un est un homme, d'âge moyen ou un adolescent déprimé.
"Cela commence par toute une série de mots et de textes qui, dans notre projet, peuvent être qualifiés de comportement d'intimidation, et avec lesquels nous alimentons l'ordinateur en quelque sorte », commence Walter Daelemans, responsable de CLiPS. « C'était toute une tâche », poursuit son collègue Guy De Pauw. "Nous sommes nous-mêmes allés dans une douzaine d'écoles, où nous avons fait faire des jeux de rôle à des jeunes sur le harcèlement, pour apprendre les bons gros mots." Avec ces données, un ordinateur peut répondre parfaitement lorsque l'un des mots et expressions saisis est utilisé. Mais ensuite ça devient intéressant.
"Traiter quelqu'un de bâtard peut aussi être synonyme de taquinerie", note Daelemans. "En gros, l'ordinateur doit saisir le contexte d'une conversation particulière, pour déterminer s'il s'agissait d'une insulte ou d'une taquinerie." « Et même plus », acquiesce Mike Kestemont. "L'ordinateur doit également savoir que si 'salope' un terme d'injure c'est, ce qu'on lui a appris, 'salope idiote' est souvent utilisé dans le même contexte et est donc aussi une insulte."
Un ordinateur qui apprend et qui interprète un contexte ? Est-ce que ça existe ? « Absolument », acquiesce un Kestemont remarquablement enthousiaste. "Il y a quelques années, un article a été publié sur une étude dans laquelle un ordinateur a regardé des vidéos YouTube pendant une semaine. Ensuite, il a lui-même généré une image, entre autres, d'une tête de chat. Une créature qu'il ne connaissait pas, mais qu'il avait fini par reconnaître parmi les innombrables vidéos de chats sur YouTube comme quelque chose de similaire. Une étude ultérieure a fait quelque chose de similaire avec Google News. Après une période de numérisation de tous ces messages, un ordinateur qui ne connaissait pas une langue était capable de créer des nuages de mots qui se décomposaient, entre autres, en mois de l'année, pays, villes, prépositions, ... Il le faisait encore ne savait pas ce que ces mots signifiaient, mais à travers le contexte dans lequel ils étaient utilisés, il pouvait dire qu'ils avaient quelque chose à voir l'un avec l'autre. »
"Les ordinateurs ne peuvent y parvenir qu'en faisant un saut majeur dans la puissance de calcul", explique De Pauw. "Et cela s'est produit de manière assez surprenante avec les processeurs graphiques qui sont également utilisés dans les consoles de jeux. Ils calculent des matrices extrêmement compliquées remplies de données en quelques millisecondes, d'une manière comparable au fonctionnement de notre cerveau. Nous savons depuis des décennies que de tels réseaux dits de neurones pourraient théoriquement être possibles, mais ce n'est qu'en raison de la puissance de calcul actuelle que nous pouvons également les appliquer. De cette façon, l'ordinateur peut établir des milliards de connexions, plus que notre cerveau.
Les consoles de jeu calculent des matrices complexes remplies de données en quelques millisecondes, tout comme notre cerveau. Guy De Pauw
Le grand mot a été prononcé :un ordinateur qui fonctionne comme notre cerveau et peut évaluer des situations présente-t-il des caractéristiques humaines ? « Nous modélisons le cerveau, et avec lui l'homme », confirme Daelemans. « Même si cela reste limité. Nous pouvons imiter les impulsions électriques dans un cerveau – dans la mesure où nous les connaissons déjà – mais bien sûr pas les réactions chimiques. Pourtant on peut déjà parler d'une forme d'intuition, de bon sens, avec un ordinateur. Nous avons récemment assisté à une percée majeure dans ce domaine :pour la première fois, un ordinateur a gagné contre un joueur de premier plan dans le jeu de société asiatique Go. Les ordinateurs d'échecs ont été meilleurs que les humains pendant un certain temps, mais Go est un jeu qui nécessite beaucoup plus d'intuition que les échecs. Grâce à la puissance de calcul, les ordinateurs sont de plus en plus capables d'estimer les situations et les interlocuteurs. Par exemple, nous travaillons ici avec des robots, auxquels nous savons que les enfants autistes réagissent bien. Mais cet ordinateur doit bien sûr savoir devant qui il se trouve. Un tel enfant n'est d'aucune utilité pour un robot joyeux."
Ironiquement, il faut un ordinateur pour démontrer l'importance du langage pour notre humanité. Ce n'est qu'à première vue que la combinaison de la langue, de la littérature et des ordinateurs est frappante. « La langue est ce qui nous distingue », sourit Daelemans. « Toutes nos émotions s'y reflètent. Bien qu'il y ait plus de linguistes qui s'en rendent compte et travaillent dans ce secteur que d'informaticiens."
"C'était toujours difficile d'étudier", se souvient Kestemont. « Mais selon tous les grands acteurs, le texte est bel et bien l'avenir. Des entreprises comme Google injectent des milliards dans la recherche en linguistique informatique. Remarquablement, vingt ans après Lernout &Hauspie, la langue et la parole sont à nouveau le principal défi.”