Apprenez comme des machines !

Savez-vous pourquoi l’IA va bousculer les méthodes dans les entreprises ? Parce que les erreurs dans les systèmes de reinforcement learning, les outils d’apprentissage sont encouragées et félicitées !

Le reinforcement learning consiste pour un agent autonome (un robot, un chatbot…) à apprendre de ses erreurs. S’inspirant du processus d’acquisition de connaissances propre à l’homme ou à l’animal, l’agent va prendre des décisions en se basant sur la somme des expériences passées. Pour cela, les algorithmes de reinforcement learning valident les « bonnes » décisions prises par la machine via un mécanisme de récompenses.

Le reinforcement learning a fait ses preuves dans les domaines de la robotique de pointe, entre autres pour la voiture autonome.

A l’opposé, dans le système éducatif français, se tromper est rarement vu de manière positive. L’élève qui se trompe, qui est dans l’erreur, est un “mauvais” élève. Le “bon” élève est au contraire celui qui ne se trompe pas.

Cette conception négative de l’erreur dans l’apprentissage va de pair avec une vision positive de la réussite. Chaque succès serait alors doublement signe de réussite, d’une part en tant que tel, et d‘autre part parce qu’il préparerait mieux pour les succès à venir.

Pourtant, les dernières recherches en neurosciences ont montré que le cerveau apprend grâce à l’erreur. Le cerveau fait en permanence des prédictions. La prédiction est une activité essentielle et irrépressible du cerveau humain dès le plus jeune âge et notre cerveau apprend de ses erreurs de prédiction, qu’il les détecte par lui-même ou par un retour d’information de l’environnement : c’est ainsi que les connaissances sont “mises à jour”.

Dès lors que l’erreur est vue non pas comme un échec mais comme une information précieuse sur les processus mentaux en jeu, elle devient une alliée pour les apprentissages.

Dans cette perspective, l’erreur est généralement plus informative que la réponse exacte dans la mesure où il y a souvent une multiplicité d’erreurs possibles mais une seule réponse juste.