Pouvez-vous imaginer un chat gris? Bien. Maintenant, imaginez-le avec une fourrure blanche. Maintenant, imaginez-le marcher sur la Grande Muraille de Chine. Fini? Ici, à ces moments-là, une série rapide d'activations neuronales dans votre cerveau a produit des variations de l'image présentée, en fonction de votre connaissance antérieure du monde.
Facile à imaginer, pour nous êtres humains. Mais pour une intelligence artificielle, c'est une toute autre histoire. Malgré les progrès des réseaux de neurones, qui égalent ou dépassent les performances humaines dans certaines activités, les ordinateurs sont encore loin de la capacité humaine à imaginer les choses.
Imaginer? Impossible pour une IA. Au moins jusqu'à hier.
Maintenant, une équipe de recherche de l'USC a développé une intelligence artificielle qui utilise des capacités humaines pour imaginer un objet jamais vu auparavant avec différents attributs. Le document, intitulé "Zero-Shot Synthesis with Group-Supervised Learning", est sorti en mai, et la recherche collatérale a prospéré depuis.
"Nous nous sommes inspirés des compétences de généralisation visuelle humaine pour essayer de simuler l'imagination humaine dans des machines", explique l'auteur principal de l'étude. Yunhao Ge. "Les humains peuvent séparer leurs connaissances apprises par des attributs, tels que la forme, la pose, la position, la couleur, puis les recombiner pour imaginer un nouvel objet. Notre article tente de simuler ce processus à l'aide de réseaux de neurones."

Le problème de la généralisation de l'intelligence artificielle
Supposons que nous voulions créer un système d'intelligence artificielle qui génère des images de voitures. Dans un premier temps, nous fournissons à l'algorithme quelques images d'une voiture. La tâche serait de générer de nombreux types de voitures, dans n'importe quelle couleur, sous plusieurs angles. C'est un défi sérieux : créer des réseaux de neurones capables d'extraire les règles sous-jacentes et de les appliquer à un large éventail de nouveaux exemples jamais vus auparavant. Mais les réseaux sont aujourd'hui entraînés sur des caractéristiques d'échantillons, sans prendre en compte les attributs d'un objet.
Dans cette nouvelle étude, les chercheurs ont tenté de surmonter cette limitation.
Le secret? ça s'appelle démêler

Le travail de l'équipe de recherche s'est basé sur l'application d'une méthode appelée démêlage. Le démêlage peut être utilisé pour générer deepfake, par exemple, synthétiser de nouvelles images et vidéos qui remplacent l'identité d'une personne par une autre, mais conservent le mouvement d'origine.
La nouvelle approche prend un groupe d'échantillons d'images, et non un échantillon à la fois comme les algorithmes traditionnels. Dd extrait la similitude entre eux pour obtenir quelque chose appelé "apprentissage de représentation démêlée contrôlable".
Puis, il recombine ces connaissances pour obtenir une "nouvelle synthèse d'images contrôlable". On pourrait utiliser le verbe "imaginer".
C'est un processus très similaire à la façon dont nous, les humains, extrapolons : lorsqu'un humain voit la couleur d'un objet, nous pouvons facilement l'appliquer à n'importe quel autre objet en remplaçant la couleur d'origine par la nouvelle. En utilisant la technique de démêlage, l'équipe a généré un nouvel ensemble de données contenant 1,56 million d'images qui pourraient aider les futures recherches dans le domaine.
Imaginer aide à comprendre le monde
Bien que le démêlage ne soit pas une idée nouvelle, les chercheurs affirment que leur structure peut être compatible avec presque tous les types de données ou de connaissances. Cela élargit les possibilités d'applications.
Dans le domaine de la médecine, par exemple, le démêlage pourrait aider les médecins et les biologistes à découvrir des médicaments plus utiles en séparant la fonction médicale des autres propriétés, puis en les recombinant pour synthétiser de nouveaux médicaments. Amener les machines à "imaginer" pourrait également aider à créer une intelligence artificielle plus sûre. Par exemple, permettre aux véhicules autonomes d'imaginer et d'éviter des scénarios dangereux jamais vus auparavant pendant la formation.
"L'apprentissage en profondeur a déjà démontré des performances et des promesses inégalées dans de nombreux domaines. Trop souvent, cependant, cela s'est produit par mimétisme superficiel et sans une compréhension plus approfondie des attributs distincts qui rendent chaque objet unique", a déclaré Laurent Itti, professeur d'informatique. "Cette nouvelle approche de démêlage, pour la première fois, libère vraiment un nouveau sens de l'imagination dans les systèmes d'IA, les rapprochant de la compréhension humaine du monde."