Pouvez-vous imaginer un chat gris ? Bien. Maintenant, imaginez-le avec une fourrure blanche. Imaginez-le maintenant marchant sur la Grande Muraille de Chine. Fini? Ici, à ces moments-là, une série rapide d’activations neuronales dans votre cerveau a produit des variations dans l’image présentée, basées sur votre connaissance antérieure du monde.
Facile à imaginer, pour nous, les êtres humains. Mais pour une intelligence artificielle, c’est une tout autre histoire. Malgré les progrès des réseaux neuronaux qui égalent ou dépassent les performances humaines dans certaines tâches, les ordinateurs sont encore loin de la capacité humaine à imaginer les choses.
Imaginer? Impossible pour une IA. Au moins jusqu'à hier.
Aujourd’hui, une équipe de recherche de l’USC a développé une intelligence artificielle qui utilise des capacités humaines pour imaginer un objet inédit doté de différents attributs. L'article, intitulé « Synthèse Zero-Shot avec apprentissage supervisé en groupe », est sorti en mai, et la recherche collatérale a prospéré depuis.
"Nous nous sommes inspirés des capacités humaines de généralisation visuelle pour essayer de simuler l'imagination humaine dans des machines", explique l'auteur principal de l'étude. Yunhao Ge. « Les humains peuvent séparer leurs connaissances acquises par attributs, par exemple la forme, la pose, la position, la couleur, puis les recombiner pour imaginer un nouvel objet. Notre article tente de simuler ce processus à l’aide de réseaux de neurones.
Le problème de la généralisation de l’intelligence artificielle
Supposons que nous souhaitions créer un système d'intelligence artificielle qui génère des images de voitures. Au début, nous fournissons à l'algorithme quelques images d'une voiture. La tâche serait de générer de nombreux types de voitures, de n’importe quelle couleur, sous plusieurs angles. C'est un défi sérieux : créer des réseaux de neurones capables d'extraire les règles sous-jacentes et de les appliquer à un large éventail de nouveaux exemples jamais vus auparavant. Mais les réseaux sont aujourd'hui entraînés sur des caractéristiques d'échantillons, sans prendre en compte les attributs d'un objet.
Dans cette nouvelle étude, les chercheurs ont tenté de surmonter cette limitation.
Le secret? ça s'appelle démêler
Les travaux de l'équipe de recherche reposaient sur l'application d'une méthode appelée démêlage. Le démêlage peut être utilisé pour générer deepfake, par exemple, synthétiser de nouvelles images et vidéos qui remplacent l'identité d'une personne par une autre, tout en conservant le mouvement original.
La nouvelle approche prend un groupe d’échantillons d’images, et non un échantillon à la fois comme les algorithmes traditionnels. Dd extrait la similitude entre eux pour réaliser quelque chose appelé « apprentissage de représentation démêlée contrôlable ».
Ensuite, il recombine ces connaissances pour obtenir une « nouvelle synthèse d’images contrôlable ». On pourrait utiliser le verbe « imaginer ».
C'est un processus très similaire à la façon dont nous, les humains, extrapolons : lorsqu'un humain voit la couleur d'un objet, nous pouvons facilement l'appliquer à n'importe quel autre objet en remplaçant la couleur d'origine par la nouvelle. En utilisant la technique de démêlage, l'équipe a généré un nouvel ensemble de données contenant 1,56 million d'images qui pourraient aider les futures recherches dans le domaine.
Imaginer aide à comprendre le monde
Bien que le démêlage ne soit pas une idée nouvelle, les chercheurs affirment que leur cadre peut être compatible avec presque n’importe quel type de données ou de connaissances. Cela élargit les possibilités de candidatures.
Dans le domaine de la médecine, par exemple, le démêlage pourrait aider les médecins et les biologistes à découvrir des médicaments plus utiles en séparant la fonction médicale des autres propriétés, puis en les recombinant pour synthétiser de nouveaux médicaments. Amener les machines à « imaginer » pourrait également contribuer à créer une intelligence artificielle plus sûre. Par exemple, permettre aux véhicules autonomes d’imaginer et d’éviter des scénarios dangereux jamais vus auparavant lors d’une formation.
« L’apprentissage profond a déjà démontré des performances et des promesses inégalées dans de nombreux domaines. Mais trop souvent, cela s’est produit par mimétisme superficiel et sans une compréhension plus profonde des attributs distincts qui rendent chaque objet unique », a déclaré Laurent Itti, professeur d’informatique. "Cette nouvelle approche de démêlage libère pour la première fois véritablement un nouveau sens de l'imagination dans les systèmes d'IA, les rapprochant ainsi de la compréhension humaine du monde."