Des fausses vidéos hyperréalistes aux copies numériques de nous-mêmes qui nous survivent :l'intelligence artificielle bouscule notre cadre de vie. "Ce n'est que le début. Des choses étranges se produisent avec l'IA."
"Le président Trump est un connard complet." Les mots semblent sortir de la bouche de Barack Obama. Du son de sa voix aux mouvements de ses lèvres, tout dans la vidéo semble crédible. Quiconque n'a connaissance d'aucun mal attribuerait donc le message ci-dessus, malgré sa formulation vulgaire, à l'ex-président des États-Unis. Mais la vidéo est fausse. C'est une cascade de la société de médias américaine BuzzFeed †
Les techniciens ont réussi à coller les mots de l'acteur et comédien Jordan Peele sur le visage d'Obama. Pour cela, ils ont utilisé les outils librement disponibles Adobe After Effects et FakeApp. Message de la vidéo :ne vous fiez pas uniquement à tout ce que vous rencontrez sur Internet. Les sources d'information établies sont plus importantes que jamais.
En utilisant la même FakeApp, un bricoleur s'est rendu sur le forum en ligne Reddit une vidéo dans laquelle Star Wars le personnage de la princesse Leia apparaît. A peine vingt minutes, c'est le temps qu'il lui a fallu. Il n'est même pas un technicien certifié, mais un amateur enthousiaste.
Tout ce dont vous avez besoin pour de telles opérations est un grand nombre d'images de qualité d'une personne qui peuvent être décomposées image par image. Et un ordinateur suffisamment puissant pour travailler avec les images.
En soi, l'idée n'est pas nouvelle :à Hollywood, des acteurs décédés apparaissent dans des films, grâce aux images générées par ordinateur (CGI). Cette technologie existe depuis longtemps, mais est réservée aux studios fortunés qui l'utilisent pour les blockbusters † Aujourd'hui, une technologie similaire est accessible à tous, grâce aux développements rapides de l'intelligence artificielle.
Non pas que FakeApp produise des résultats qui se rapprochent de CGI coûteux, mais le résultat est néanmoins relativement impressionnant. L'exemple de la princesse Leia n'est plus disponible en ligne - un Reddit modérateur l'a supprimé. Mais quand même :jusqu'à récemment, les experts n'attendaient ce genre de résultats que d'ici quelques années. Donc ça va plus vite que prévu. Beaucoup plus rapide.
Derrière ces fausses vidéos réalistes se cache l'apprentissage automatique , une forme d'intelligence artificielle qui a fait de grands progrès ces dernières années. Le principe est simple :en alimentant un algorithme avancé avec un maximum de données, de nouvelles vidéos peuvent être réalisées. L'algorithme est un réseau de neurones qui traite les données, de la même manière que notre cerveau traite les informations.
L'algorithme est formé pour s'améliorer en s'évaluant après chaque tentative. L'algorithme évalue ses propres créations en les comparant aux informations d'un réseau de millions de connexions. Les images de personnalités publiques – politiciens, personnalités de la télévision et acteurs – en particulier, sont abondamment disponibles. Mais il y en a aussi de plus en plus disponibles auprès des gens ordinaires :en raison de la culture du selfie, nous lançons du nouveau matériel sur Internet presque tous les jours.
Ce n'est pas un hasard si de si grands progrès sont réalisés dans la reconnaissance des visages et des objets et dans la production d'images, pense Tinne Tuytelaars, professeur d'imagerie numérique à la KU Leuven. « Nous voulons que les gens et les ordinateurs interagissent mieux les uns avec les autres. C'est pourquoi la recherche scientifique se concentre sur l'entraînement de modèles pour mieux reconnaître les émotions faciales, entre autres. Depuis 2012, une révolution s'est ensuivie dans ce domaine.”
Avec beaucoup de puissance de calcul et de données, vous créez de nombreuses possibilités. "Auparavant, les visages ne pouvaient être reconnus que de face, maintenant c'est également possible dans des circonstances incontrôlées", poursuit Tuytelaars. «La percée réside principalement dans l'apprentissage non supervisé, où les gens ne sont plus nécessaires pour préciser, par exemple, à quelle classe appartiennent certains visages. Auparavant, vous deviez attribuer vous-même des étiquettes :« Voici la personne A, voici la personne B, voici un visage triste. » Ce travail prenait beaucoup de temps et d'énergie. Désormais, il existe des systèmes capables d'apprendre de manière autonome et d'effectuer eux-mêmes de telles classifications. »
L'une des applications consiste à reconnaître les situations dangereuses pour les voitures autonomes. "Les scénarios de risque ne se produisent pas si souvent, ce qui signifie que nous en avons peu d'images", explique Tuytelaars. "Maintenant, vous pouvez résoudre ce problème avec cette technologie."
Les applications concrètes vont encore plus loin. Aujourd'hui, il existe un algorithme qui peut fabriquer indépendamment une vidéo basée sur rien de plus que quelques morceaux de texte. Pas une vidéo avec laquelle vous pouvez concourir pour un Oscar ou une Palme d'or, mais une percée importante.
La technique peut également être utilisée en dehors de la sphère du divertissement, par exemple pour reconstituer un accident de voiture ou un crime à partir de ce qu'en disent des témoins. "C'est la première application texte-vidéo qui donne un si bon résultat. Ce n'est pas encore parfait, mais ça commence déjà à ressembler à une vraie vidéo", explique Tuytelaars. Les chercheurs ont réussi à entraîner l'algorithme sur dix types de scènes, du golf sur herbe au kite surf en mer. Les scènes ont été rendues très rugueuses et granuleuses. Un algorithme de classification très simple indiquait l'action correcte basée sur six possibilités la moitié du temps. Le réseau de neurones a également pu réaliser des vidéos d'actions inexistantes, comme la voile sur la neige ou le kite surf sur l'herbe, ce qui élargit les possibilités d'application.
Cela ne s'arrête pas là. Des chercheurs du Massachusetts Institute of Technology (MIT) ont réussi à utiliser l'apprentissage automatique créer un réseau de neurones capable de prédire ce qui se passe sur une photo et de produire une vidéo basée sur cela. Ce sont de très courtes vidéos GIF de quelques secondes à peine, qui montrent des situations très prévisibles.
Les techniciens ont également développé des programmes capables de manipuler et de mélanger des images avec la reconnaissance faciale. Faites grimacer un chercheur devant une caméra et la même grimace peut être vue en temps réel sur l'image d'une célébrité ou d'un leader mondial. L'audio n'échappe pas non plus aux progrès de l'intelligence artificielle et de l'apprentissage automatique † Des informaticiens de l'Université de Washington ont réussi à créer un programme capable de transformer avec succès des clips audio en vidéos réalistes de synchronisation labiale. La technologie fonctionne si bien qu'elle peut faire dire aux dirigeants mondiaux des choses qu'ils n'ont jamais dites. Aimez la vidéo Obama de BuzzFeed prouvé récemment.
Comme d'habitude, les applications les plus pratiques suivent lorsque la technologie existante est commercialisée. Adobe, connu comme producteur de logiciels graphiques, travaille sur Voco, une sorte de Photoshop pour l'audio. L'entreprise travaille également sur Cloak, un outil qui vous permet d'effacer de manière imperceptible les objets et les personnes des vidéos.
D'autres entreprises technologiques ne sont pas en reste non plus. Chipmaker Nvdia peut créer des photos hyperréalistes de personnes, d'objets et de paysages, basées sur une base de données de dizaines de milliers d'images. Ces images peuvent souvent être trouvées en ligne. La technologie est tellement avancée que les systèmes peuvent convertir de manière convaincante les images des jours ensoleillés en jours de pluie. Les possibilités sont grandes et, plus important encore, elles augmentent de jour en jour, à mesure que différentes formes d'intelligence artificielle prennent de l'ampleur.
L'une des applications les plus spectaculaires utilisées aujourd'hui est la création d'une copie numérique d'une personne afin qu'elle puisse vivre après la mort. C'est un scénario qui apparaît dans la série Netflix Black Mirror comme une sombre image de l'avenir, mais c'est déjà possible aujourd'hui - du moins sous une forme primitive.
"Aujourd'hui, vous avez déjà des entreprises qui proposent de faire une sorte de copie de vous-même", explique Luc Steels, spécialiste de l'intelligence artificielle à la VUB. ‘Vous pouvez faire une sorte de téléchargement mental à mentionner. Vous ne touchez peut-être pas physiquement le cerveau, mais vous avez une image réaliste de vous basée sur tout le matériel que le système obtient à votre sujet. Ce matériel consiste en ce que vous publiez ou aimez sur les réseaux sociaux. De cette façon, la copie peut répondre comme vous répondriez et parler comme vous parleriez. Certaines personnes y voient un monument au défunt, pour faciliter la transition. »
Eterni.me est une entreprise spécialisée dans la vie numérique après la mort :elle veut utiliser l'intelligence artificielle pour créer une version numérique réaliste d'une personne basée sur tout ce que vous laissez derrière vous en ligne. Selon la quantité de données que le système reçoit, cela peut aller de données biographiques rudimentaires à une copie numérique qui devrait être un interlocuteur à part entière. Pas mal de personnes semblent intéressées :selon l'entreprise, 37 000 personnes se sont déjà inscrites au service.
La société néo-zélandaise Soul Machines crée des doubles numériques réalistes. Ils réagissent à ce qu'ils voient et entendent et s'améliorent à chaque interaction. Selon la société, le suivi d'un sosie numérique devrait devenir courant d'ici dix ans. Une autre société, Lyrebird, vous permet d'enregistrer trente phrases en ligne, puis de faire une copie audio de vous-même. Sur cette base, il reproduit votre voix et votre intonation. Steels est hésitant face à de telles technologies, pour ne pas dire sceptique :" Reste à voir ce qu'on peut faire dans ce domaine, et surtout jusqu'à quel point ça peut l'être. " En tout cas, force est de constater que la technologie ne peut que s'améliorer. dans le futur. .
Cela signifie-t-il que toute cette intelligence artificielle se rapproche de plus en plus de l'intelligence humaine et peut-être même plus loin ? Surtout dans la Silicon Valley, les scientifiques et les technologues font cette affirmation. Cela leur permet d'atteindre facilement les médias.
Pourtant, c'est prématuré, dit Steels. « Les applications d'IA sont efficaces pour des tâches très ciblées, telles que la reconnaissance d'objets ou la génération d'images. Même s'ils font encore des erreurs que nous ne ferions jamais. Un mauvais pixel peut lui faire reconnaître un objet comme autre chose, alors que nous voyons clairement qu'il s'agit de cet objet. Bien sûr, ces systèmes progressent et apprennent, mais cela montre qu'ils sont encore loin de l'intelligence humaine. Le cerveau humain, avec nos capacités culturelles et sociales, est totalement supérieur. L'idée que nous avons juste besoin de fournir aux machines un peu plus de données pour combler cette distance est un non-sens. Cela ne fait pas de mal de rêver d'une intelligence artificielle plus mature :avec de telles ambitions, vous faites avancer les développements. D'un autre côté, ce sont de tels rêves qui ont transformé toute l'histoire de l'intelligence artificielle en un battage médiatique. Ça ne fait pas de mal de critiquer ça.'