Disney a résolu l'un des problèmes les plus coûteux de la robotique bipède : la prévention des chutes. Un nouveau système basé sur l'apprentissage par renforcement a été développé.1 Ce système entraîne les robots à choisir des positions d'atterrissage sûres qui protègent leurs capteurs, leurs batteries et leurs articulations. La méthode utilise 4 000 simulations virtuelles simultanées pour apprendre aux robots à rouler, à atterrir et à absorber les chocs au lieu de leur résister. Publié sur arXiv D'ici novembre 2025, l'étude prévoit que des robots de 16 kg pourront chuter de manière contrôlée suite à une poussée latérale à 2 m/s. Fini les articulations rigides et les mouvements aléatoires : chaque chute deviendra un événement maîtrisé, calculé et sécurisé.
Quand la chute devient un problème de 35 kilos
Laissons de côté un instant les robots qui dansent sur les scènes de conférence. Il s'agit de chorégraphie, pas de physique. Le véritable problème survient lorsque la gravité s'en mêle. Un robot bipède qui perd l'équilibre se transforme en projectile de 16 kg qui s'écrase au sol, ses articulations rigides, ses capteurs exposés et sans aucune protection. Résultat ? Coques fissurées, composants électroniques endommagés et batteries hors service. Et des factures de réparation qui font mal.
Disney Recherche Une équipe d'ingénieurs universitaires a passé des années à apprendre à des robots à gérer les chutes. Non pas à les éviter (c'est un autre sujet), mais à atterrir de la manière la moins douloureuse possible. Le système s'appelle «Cours intensif de robotique« Et il fait exactement ce qu’il promet : il entraîne les robots à mieux tomber. » Un peu comme un parcours de parkour, mais pour des machines qui pèsent autant que Buddy, mon golden retriever : pour être précis, un chien de taille moyenne.
AIDOL et le tissu noir de la honte
Avant de parler de la façon dont un robot Disney pourrait résoudre le problème, il est bon de rappeler ce qui se passe lorsque personne ne le résout. Moscou, le 11 novembre 2025. Scène, lumières, le thème de Rocky en fond sonore (ce qui rendait le tout un peu plus ridicule, il faut bien l'avouer). Entrée AIDOL, le premier robot humanoïde russe doté d'intelligence artificielle. Il lève le bras droit en signe de salutation. « Vous n'avez pas encore vu le modèle rare ? »2« C’est ce qu’on disait en plaisantant à Naples. » La suite est connue : Aidol perd l’équilibre. Aidol tombe face contre terre. Les assistants accourent avec un drap noir pour le dissimuler aux regards des journalistes et des invités. Une scène digne de Buster Keaton, et une satisfaction subtile pour nous autres humains de constater que ces épouvantails technologiques, destinés, selon la croyance populaire, à nous remplacer, marchent encore comme s’ils avaient une diarrhée carabinée et répandaient régulièrement leurs entrailles sur le sol.
Selon le PDG Vladimir VitukhinIl s'agissait d'une erreur d'étalonnage des capteurs de la balance. Un « accident utile », a-t-il dit en plaisantant. Utile ou non, la vidéo est devenue virale en trois heures et a prouvé une chose très simple : La chute est le moment le plus critique dans la vie d'un robot bipède. Peu importe la sophistication de votre système de contrôle si vous n'avez pas de plan B pour le cas où la gravité l'emporte.
Le système Disney n'empêche pas un robot de tomber comme celui d'AIDOL. Il gère sa chute. La différence réside dans le fait qu'un robot Disney entraîné avec cette méthode ne se retrouve pas face contre terre, les articulations bloquées. Il se replie, protège sa tête et adopte une posture finale qui répartit l'impact, à la manière d'un cascadeur. Puis il se relève.
Robots Disney : 24 000 chutes virtuelles pour apprendre à moins souffrir
Le cœur du système, ai-je dit, c'est le apprentissage par renforcementDes milliers de robots numériques tombent dans un simulateur, analysant les comportements efficaces et les dysfonctionnements, et accumulant des données. Chaque chute rapporte des points si le robot atténue l'impact ou protège les zones critiques. Des points sont déduits si les mouvements deviennent chaotiques ou incontrôlables. Le système a été testé. 24 000 poses stablesDes modèles virtuels ont été lancés depuis différentes hauteurs (toujours constantes, jamais de dix étages). Dix des poses finales ont été créées par des « artistes » qui ont imaginé des positions originales : accroupis, roulades amples, atterrissages spectaculaires.
La formation a duré deux jours sur des GPU puissants. 4 000 robots virtuels Ils sont tombés simultanément. Un petit réseau neuronal a traité les angles articulaires, l'orientation du corps et les données de mouvement cinquante fois par seconde. La méthode est appelée optimisation des politiques proximales Le simulateur adapte le comportement du robot progressivement, sans à-coups. Il réduit la pression de contact et définit différents niveaux de sensibilité pour chaque partie du corps : les jambes restent souples, tandis que la tête nécessite une protection accrue.
Du simulateur au laboratoire : tester le vrai robot Disney
Après une formation virtuelle, le système a été installé sur un véritable robot Disney. Ce dernier pesait 16 kilogrammes et était doté de jambes à ressort et de bras mécaniques. Un système de capture de mouvement enregistrait chaque déplacement et transmettait des mises à jour en temps réel au contrôleur. Les tests ont démontré que le robot pouvait encaisser des chutes lors de poussées latérales de 2 mètres par seconde (environ 6,5 pieds par seconde) et des glissades vers l'avant avec rotation des hanches. Les vitesses étaient aléatoires dans chaque épisode, de sorte que le robot n'apprenait jamais un chemin fixe.
Le robot ne résiste pas à l'impact : il l'accueille. Il roule, se repositionne et protège ses batteries et ses capteurs. Sa position finale dépend de la direction et de la vitesse de la chute. Parfois, il se recroqueville. Parfois, il s'ouvre largement. Parfois, il adopte une position intermédiaire. Comme je le disais dans cet articleEn 2025, la robotique évoluera vers des systèmes plus adaptatifs et intelligents. Cette étude le confirme : les robots ne doivent pas seulement bien marcher. Ils doivent aussi (et surtout, pourrait-on dire) bien tomber.
Le fait le plus intéressant ? Le système est compatible avec différents robots. La stratégie est indépendante du matériel : elle peut être transférée à d’autres plateformes bipèdes sans nécessiter un réentraînement complet. Autrement dit, la méthode n’est pas liée à un modèle unique, mais s’applique à toute machine à deux jambes dotée d’articulations compatibles.
Pourquoi apprendre à tomber est plus important qu'on ne le pense
En résumé, c'est simple : les robots bipèdes sont de plus en plus courants. Certains Il les a déjà mis en prévente. Usines, entrepôts, hôpitaux. Ils sont parmi nous, transportant des objets, accomplissant des tâches. Mais tant qu'une chute signifie une casse, leur utilité reste limitée. Un robot capable de tomber sans être endommagé est un robot qui peut travailler plus longtemps, dans davantage d'environnements, avec moins de supervision humaine. Il ne s'agit pas d'élégance : il s'agit d'économie pure.
Disney Research a opté pour une approche pragmatique. La chute n'est pas présentée comme un spectacle, mais comme un problème d'ingénierie avec une solution concrète. Le robot tombe, protège ses composants essentiels, se relève et poursuit son chemin. Pas de bâches noires, pas de thème à la Rocky, pas de mise en scène maladroite. Juste de la physique appliquée et un apprentissage par renforcement qui fonctionne.
Il suffit d'un peu d'apprentissage et le robot tombe, si vous me permettez ce jeu de mots un peu maladroit, typique d'un père d'un enfant de huit ans. L'important, évidemment, c'est qu'il se relève intact.
- L'apprentissage par renforcement est une technique d'intelligence artificielle où un agent apprend à prendre des décisions en interagissant avec son environnement, recevant des récompenses pour les actions correctes et des sanctions pour les erreurs. Ainsi, comme dans notre apprentissage quotidien par essais et erreurs, l'agent améliore son comportement pour atteindre ses objectifs au fil du temps. Cette technique est utilisée pour enseigner aux machines à résoudre des problèmes complexes nécessitant une série de choix afin d'obtenir le meilleur résultat possible. ??
- « Il n'a pas vu la marche. » On dit parfois cette phrase, même quand il n'y a pas de marche, juste pour souligner avec pitié une chute malheureuse. Suivez-moi pour d'autres leçons napolitaines non sollicitées, en notes de bas de page. ??