FRFAM.COM >> Science >> Technologie

Le fauteuil avocat d'Elon Musk

En plus des textes, l'intelligence artificielle peut désormais également générer des images. La mathématicienne Ann Dooms explique comment cela fonctionne.

A mon grand regret je n'ai aucun talent de dessinateur. Je repense avec stress aux cours d'éducation plastique où j'ai vu le devoir dans ma tête, mais ma main n'a pas réalisé ce que j'avais en tête. Est-ce de la maladresse ou est-ce que je ne vois pas assez précisément ce que je veux dessiner ? Même dans un programme de dessin, je ne suis pas en mesure d'obtenir un résultat réussi. Heureusement, de nos jours, je peux utiliser Google Images ou des bases de données de photos en ligne pour rechercher dans du texte ou des images similaires ce que j'ai plus ou moins en tête. Bien sûr, je dépends de ce que quelqu'un d'autre a déjà fait. Mes fantasmes les plus fous ne deviennent pas réalité.

Ou est-ce? En janvier, OpenAI, un laboratoire de recherche américain cofondé par Elon Musk, a lancé une nouvelle plateforme remarquable. Avec une entrée textuelle, il affiche des images qui correspondent à votre description. Mais contrairement à Google Images, ce n'est pas un moteur de recherche qui recherche sur le Web les images demandées. C'est une application impressionnante d'apprentissage automatique, où le système crée les images lui-même. Les concepteurs ont appelé leur plateforme DALL-E, un clin d'œil au peintre surréaliste Dalí et au robot de dessin animé WALL-E.

DALL-E est une application de GPT-3, un système logiciel qui génère des textes. Pour cela, il utilise un réseau de neurones qui a été formé de manière ingénieuse et avec beaucoup de puissance de calcul avec un énorme corpus d'exemples de textes. Une partie du réseau est présentée avec une phrase et doit prédire le mot suivant. Une autre partie vérifie ensuite la qualité de cette prédiction. Progressivement, le réseau s'apprend à devenir meilleur dans sa tâche. Le résultat est un modèle de langage qui peut écrire des nouvelles, même des poèmes et des romans entiers. Ce modèle est le premier que le langage semble vraiment comprendre.

Le fauteuil avocat d Elon Musk

Seulement ce n'est pas le cas. Vous pouvez le dire par les "accidents" dans la sortie du modèle. GPT-3 a généré beaucoup de textes qui n'ont aucun sens. Parfois, il s'agit d'erreurs ludiques, mais malheureusement, la sortie s'avère souvent être stéréotypée ou contient d'autres embarras. Le modèle a naturellement appris ces choses à partir du matériel de formation dont il disposait. Les développeurs auraient pu prévoir cela.

Actuellement, un travail acharné est fait pour guérir le système de ses problèmes de démarrage. De plus en plus souvent, nous voyons apparaître des applications moins dangereuses et simplement amusantes. DALL-E entre dans cette catégorie, pour laquelle GPT-3 a été complété par un autre gigantesque tas d'exemples. Cette fois, il ne s'agissait pas de mots et de phrases, mais de photos. Et en sortie, le modèle GPT-3 ne génère pas de texte, mais des images.

Sur la base de la base de données d'images, le système obtient un aperçu de l'apparence de certains concepts et objets, tels que des fauteuils et des avocats. Et grâce au modèle de langage «compréhension» qui le sous-tend, il est capable de générer des photos non seulement de plus de fauteuils et d'avocats, mais aussi de fauteuils en forme d'avocats.

La fin est-elle venue pour les créateurs de meubles ? Non, ce n'est pas le cas. Le réseau ne tiendra pas vraiment compte de la faisabilité physique de la conception, mais il pourra bien servir de source d'inspiration pour les concepteurs. En attendant, je vois le fauteuil avocat s'installer dans mon salon. Quelqu'un veut m'en faire un ? Malheureusement, je suis trop maladroit pour ça.


[]