Les nouvelles technologies, permettant l'apprentissage en profondeur, contribuent à tenir la promesse de l'intelligence artificielle.
Google, Facebook et d'autres géants font des progrès significatifs dans le développement de technologies capables d'apprendre d'elles-mêmes. Leurs efforts dépendent fortement de ce que l'on appelle "l'apprentissage en profondeur".
Basés sur l'idée vieille de plusieurs décennies selon laquelle les ordinateurs seraient plus intelligents s'ils fonctionnaient davantage comme le cerveau humain, les réseaux d'apprentissage en profondeur consistent en une couche après couche d'unités de traitement de l'information connectées les unes aux autres. Nous appelons ces unités des neurones artificiels. Chacun effectue une opération différente sur l'entrée disponible - par exemple, classer une image. La différence entre les réseaux de neurones conventionnels et l'apprentissage en profondeur est que ce dernier se compose de beaucoup plus de couches.
L'apprentissage en profondeur a pris de l'ampleur au milieu des années 2000. Il a été rendu possible grâce au travail de trois personnalités clés - Geoffrey Hinton de l'Université de Toronto, Yoshua Bengio de l'Université de Montréal et Yann LeCun de l'Université de New York - mais ce n'est que récemment que des applications commerciales ont commencé à être découvertes.
Un exemple est l'application Google Photos qui a été lancée en mai dernier. Le logiciel peut télécharger toutes les images de mon iPhone, identifier correctement les images de ma femme, de mon fils et de mon petit-fils, puis déposer leurs photos dans des dossiers numériques séparés et les mettre en miniature. Le logiciel peut le faire en apprenant à reconnaître les visages à partir de millions d'images analysées par le système. Au fur et à mesure qu'une image se déplace à travers toutes les couches successives du réseau, le logiciel identifie les éléments dans les images avec un niveau d'abstraction sans cesse croissant, jusqu'à ce qu'il puisse finalement détecter le visage entier dans l'image. Une fois entraîné avec suffisamment de visages, le logiciel peut reconnaître le nez et la bouche d'individus dans des images qu'il n'a jamais vues auparavant.
L'apprentissage en profondeur peut faire bien plus qu'organiser des images. Cela pourrait finalement être un pas vers une intelligence artificielle qui présente un comportement intelligent pratiquement impossible à distinguer de celui de ses maîtres humains. En février dernier, une équipe d'experts en IA de la société londonienne DeepMind (rachetée par Google en 2014 pour 617 millions de dollars) a rapporté avoir utilisé l'apprentissage en profondeur pour construire un ordinateur qui apprendrait à jouer à des dizaines de jeux vidéo. Après beaucoup de pratique, le logiciel bat des joueurs humains expérimentés dans la moitié de ces jeux. C'est un petit pas, mais l'âge de la machine doit commencer quelque part.