L’extrême précision du robot fouettard

Capture d’écran 2025-02-04 102552

Des chercheurs de l’université de Berkeley ont développé une méthode d’apprentissage qui permet aux robots d’acquérir des compétences avancées de manipulation, grâce à l’intelligence artificielle, au renforcement par l’expérience et à l’intervention humaine.

L’équipe du laboratoire Robotic AI and Learning Lab de l’université de Californie à Berkeley a présenté en octobre dernier une approche combinant intelligence artificielle, apprentissage par renforcement et corrections humaines. Les robots commencent par assimiler les bases d’une tâche, puis s’améliorent grâce à l’expérience et aux retours fournis par des capteurs et caméras. Les résultats viennent d’être rendus publics.

Un élément clé de cette méthode est l’intervention humaine en temps réel. À l’aide d’une souris spéciale, un instructeur peut ajuster les mouvements du robot lorsqu’il commet une erreur. Ces corrections sont ensuite intégrées dans sa mémoire, affinant progressivement son modèle d’apprentissage. Résultat : les robots deviennent plus précis et nécessitent de moins en moins d’assistance humaine au fil du temps.

Des robots capables d’accomplir des tâches variées et complexes

Pour tester leur approche, les chercheurs ont soumis leur système robotique à plusieurs tâches exigeantes, dont le "jenga whipping" – une technique où un robot utilise un petit fouet pour extraire un bloc sans faire s’effondrer la tour. Cette tâche est particulièrement difficile à modéliser en simulation, rendant l’apprentissage en conditions réelles indispensable.

D’autres défis incluaient le retournement d’un œuf dans une poêle, le transfert d’un objet d’un bras à un autre, l’assemblage d’un tableau de bord automobile et le remplacement d’une courroie de distribution. Cette dernière tâche était l’une des plus ardues, car elle impliquait la manipulation d’une chaîne souple, nécessitant anticipation et ajustements constants.

Une précision et une rapidité inédites

Grâce à cette nouvelle méthode d’apprentissage, les robots ont atteint un taux de réussite de 100 % sur toutes les tâches testées, surpassant les techniques classiques de clonage comportemental. L’équipe a même introduit des perturbations – comme déplacer une carte mère en pleine installation – pour tester leur capacité d’adaptation. Malgré ces obstacles, les robots ont su réagir avec précision et rapidité.

Dans l’avenir, les chercheurs souhaitent pré-entraîner les robots avec des connaissances de base sur certaines tâches, réduisant encore le temps nécessaire pour apprendre de nouveaux gestes complexes. Ils ont également rendu leur travail open-source afin de permettre à d’autres scientifiques d’améliorer et d’étendre leurs résultats.

Pour en savoir plus :

L’essentiel