La programmation de robots pour des tâches de soins de santé prend du temps. Cela va plus vite quand un robot peut apprendre des compétences par lui-même.
La programmation de robots pour des tâches ménagères ou de soins de santé prend du temps et est fastidieuse. Une approche plus efficace pourrait être de laisser les robots l'apprendre eux-mêmes dans la pratique. Le doctorant Erik Schuitema a étudié comment le robot Leo peut apprendre à marcher tout seul, par essais et erreurs.
Les robots qui (sur place) apprennent à effectuer des tâches par eux-mêmes grâce à l'interaction avec le monde réel, peuvent être une alternative intéressante à la programmation compliquée. L'apprentissage par renforcement (RL) permet à un système d'apprendre à résoudre des tâches en fonction des retours sur son comportement :un bon comportement est renforcé par des récompenses positives, un mauvais comportement est puni par des récompenses négatives.
Habituellement, c'est une sorte de recherche fait uniquement à travers des simulations. Erik Schuitema :« Nous avons spécialement conçu et construit un robot marcheur bipède, nommé Leo, pour mener des recherches sur l'application de l'apprentissage par renforcement à de vrais robots. Le robot Léo est capable d'apprendre deux tâches motrices de base :placer un pied sur une marche d'escalier et marcher.'
Pour apprendre à marcher, Léo reçoit une récompense positive pour avoir avancé son pied et des récompenses négatives pour l'utilisation du temps et de l'énergie. Cette récompense est simplement un nombre dans l'ordinateur qui peut augmenter ou diminuer. Leo essaie de maximiser ses récompenses par essais et erreurs.
En plaçant un pied sur la marche, une tâche relativement simple, Leo a appris par lui-même en quinze minutes. Apprendre à marcher prend environ 5 heures dans une simulation, le robot tombant des milliers de fois. Étant donné que le matériel n'était pas tout à fait capable de résister à autant de chutes, il a été décidé de donner un coup de main à Leo dans les premières étapes de l'apprentissage. Au début, il était encore capable de "regarder" un peu la façon dont les robots marcheurs sont maintenant programmés manuellement. Léo a rapidement pu s'adapter à cette démarche et même l'améliorer légèrement en quelques heures.
Une fois le matériel rendu plus résistant aux chutes, un robot comme Léo pourra en effet apprendre à marcher complètement sur propre, dit Schuitema . Il semble donc que l'approche via l'Apprentissage par Renforcement pourrait être prometteuse. Mais il reste encore un long chemin à parcourir. Schuitema :« L'œuvre en est encore à ses balbutiements. Il pourrait s'écouler des décennies avant que ces types de robots puissent se mettre au travail dans la pratique.'