Futur proche
Pas de résultat
Voir tous les résultats
28 septembre 2023
  • Home
  • Technologie
  • santé
  • Environnement
  • Énergie
  • Transport
  • Espace
  • AI
  • Concepts
  • H+
Comprendre, anticiper, améliorer l'avenir.
CES2023 / Coronavirus / Russie-Ukraine
Futur proche
  • Home
  • Technologie
  • santé
  • Environnement
  • Énergie
  • Transport
  • Espace
  • AI
  • Concepts
  • H+

Comprendre, anticiper, améliorer l'avenir.

Pas de résultat
Voir tous les résultats
Robotica, Technologie

DeepMind présente RT-2 : des robots qui voient, apprennent et agissent

Le modèle d'IA développé par DeepMind, qui combine vision et langage pour contrôler les machines, va ouvrir de nouveaux horizons en robotique.

30 juillet 2023
Gianluca RiccioGianluca Riccio
⚪ 4 minutes
PartagerPin It1TweetEnvoyerPartagerPartagerPartager

LIRE DANS :

Dans un environnement lumineux, plein de moniteurs et d'équipements technologiques, un robot se présente comme le protagoniste. Sa structure métallique reflète la lumière, mais c'est dans ses "yeux" que se cache la vraie magie. Ces yeux, alimentés par le modèle RT-2 de DeepMind, sont capables de voir, d'interpréter et d'agir.

Alors que le robot se déplace avec grâce, les scientifiques qui l'entourent scrutent chacun de ses mouvements. Ce n'est pas seulement un morceau de métal et de circuits, mais l'incarnation d'une intelligence qui unit le vaste monde du Web à la réalité tangible.

Deepmind
L'un des 13 robots utilisés pour la formation de modèles.

L'évolution de la RT-2

La robotique a parcouru un long chemin ces dernières années, mais DeepMind cela a juste amené le jeu à un tout autre niveau. Illustré dans un papier dès sa sortie il arrive RT-2. Choses? Il s'agit d'un modèle vision-langage-action (VLA) qui apprend non seulement des données Web, mais également des données robotiques, traduisant ces connaissances en instructions généralisées pour le contrôle robotique.

À une époque où la technologie progresse à pas de géant, RT-2 représente un bond significatif, promettant de révolutionner non seulement le domaine de la robotique, mais aussi notre façon de vivre et de travailler au quotidien. Mais qu'est-ce que cela signifie en pratique ?

L'article continue après les liens associés

Sans un frein des institutions, l’IA mènera-t-elle au néo-féodalisme privé ?

TeddyGPT arrive, le premier ours en peluche IA qui parle et apprend avec les enfants

DeepMind RT-2, de la vision à l'action

Les modèles de langage de vision à haute capacité (VLM) ils sont formés sur de grands ensembles de données, ce qui les rend également extraordinairement doués pour reconnaître des modèles visuels ou linguistiques (fonctionnant, par exemple, dans différentes langues). Mais imaginez pouvoir faire faire à des robots ce que ces modèles font. En effet, arrêtez de l'imaginer : DeepMind rend cela possible avec RT-2.

Transformateurs robotiques 1 (RT-1) c'était une merveille en soi, mais RT-2 va plus loin, affichant des capacités de généralisation améliorées et une compréhension sémantique et visuelle qui va au-delà des données robotiques auxquelles il a été exposé.

DeepMind
Un modèle de langage visuel (VLM) pré-formé avec des données Web apprend également à partir des données robotiques RT-1. Résultat? RT-2, un modèle d'action du langage visuel (VLA) capable de contrôler un robot - Animation : DeepMind

Raisonnement en chaîne

L'un des aspects les plus fascinants de RT-2 est sa capacité de raisonnement en chaîne. Il peut décider quel objet pourrait être utilisé comme marteau de fortune ou quel type de boisson convient le mieux à une personne fatiguée. Cette capacité de raisonnement profond pourrait révolutionner la façon dont nous interagissons avec les robots.

Et au pire, vous pourriez toujours demander à un robot de vous faire un bon café pour retrouver un peu de lucidité.

Mais comment DeepMind RT-2 contrôle-t-il un robot ?

La réponse réside dans la façon dont il a été formé. En fait, il utilise une représentation qui n'est pas sans rappeler les jetons de langue exploités par des modèles comme ChatGPT.

RT-2 a démontré des capacités émergentes étonnantes, telles que la compréhension des symboles, le raisonnement et la reconnaissance humaine. Des compétences qui montrent actuellement une amélioration de plus de 3x par rapport aux modèles précédents.

Avec RT-2, DeepMind non seulement montré que les modèles vision-langage peuvent être transformés en puissants modèles vision-langage-action, mais il a également ouvert la porte à un avenir dans lequel les robots peuvent raisonner, résoudre des problèmes et interpréter des informations pour effectuer un large éventail de tâches dans le monde réel. monde.

DeepMind
Un exemple des activités apprises par DeepMind RT-2. Tâches qui ne figuraient pas dans les données avec lesquelles elles ont été entraînées.

Et maintenant?

Dans un monde où l'intelligence artificielle et la robotique seront de plus en plus centrales, RT-2 nous montre que la prochaine évolution ne sera pas purement technique, mais "perceptive". Les machines comprendront et répondront à nos besoins d'une manière que nous n'aurions jamais imaginée.

Si ce n'est que le début, qui sait ce que l'avenir nous réserve.

Mots clés: Deepmindl'intelligence artificiellesystèmes de robot

Dernières nouvelles

  • Optivolt révolutionne le solaire : des panneaux efficaces même à l'ombre
  • Callboats, Helsinki lance des taxis autonomes et électriques sur l'eau
  • La Chine vise le sous-sol : une base lunaire dans des tubes de lave
  • Sur Mars en 26 jours avec la nouvelle voile solaire aérographe
  • Amazon investit dans Anthropic : la guerre de l'IA fait rage
  • Sourire : un médicament qui fait repousser les dents atteint les essais cliniques
  • Sans un frein des institutions, l’IA mènera-t-elle au néo-féodalisme privé ?
  • Quand allons-nous disparaître ? Voici une (belle) prédiction du supercalculateur
  • ADN et longévité : comment les « gènes sauteurs » pourraient prolonger nos vies
  • TeddyGPT arrive, le premier ours en peluche IA qui parle et apprend avec les enfants


Chat GPT Megaeasy !

Guide concret pour ceux qui abordent cet outil d'intelligence artificielle, également conçu pour le monde scolaire : de nombreux exemples d'applications, des indications d'utilisation et des instructions prêtes à l'emploi pour entraîner et interroger Chat GPT.

Soumettre des articles, divulguer les résultats d'une recherche ou découvertes scientifiques écrire à la rédaction

Entrez dans la chaîne Telegram de Futuroprossimo, cliquez ici. Ou suivez-nous sur Instagram, Facebook, Twitter, Mastodonte e LinkedIn.

FacebookTwitterInstagramTelegramLinkedInMastodontePinterestTikTok

Le quotidien de demain.


Futuroprossimo.it fournit des nouvelles sur l'avenir de la technologie, de la science et de l'innovation : s'il y a quelque chose qui est sur le point d'arriver, c'est déjà arrivé. FuturoProssimo fait partie du réseau Transférer à, des études et des compétences pour des scénarios futurs.

  • Environnement
  • architecture
  • Intelligence artificielle
  • Gadgets et assessoires électronique
  • Concepts
  • Design
  • Médecine
  • Espace
  • Robotica
  • Travail
  • Transport
  • Énergie
  • Édition française
  • édition allemande
  • Version japonnaise
  • Édition anglaise
  • Edition portugaise
  • En savoir plus
  • Édition espagnole

Abonnez-vous à la newsletter

  • L'éditeur
  • Publicité sur FP
  • Politique de Confidentialité

© 2023 Futur proche - Creative Commons License
Ce travail est distribué sous licence Creative Commons Attribution 4.0 International.

Pas de résultat
Voir tous les résultats
Comprendre, anticiper, améliorer l'avenir.
  • Home
  • Technologie
  • santé
  • Environnement
  • Énergie
  • Transport
  • Espace
  • AI
  • Concepts
  • H+