Je sais, nous étions tous distraits par autre chose : en janvier 2021 OpenAI, l'entreprise fondée par Elon Musk et soutenue par Microsoft, a lancé son projet le plus ambitieux à ce jour : un système d'apprentissage automatique appelé DALL-E.
A quoi sert cette intelligence artificielle ? En termes simples : il produit des images à partir d’une simple description textuelle. Un exemple? Vous écrivez « Un chameau avec un livre pour chapeau », ou « Une cravate faite de fourchettes » et il dessine, crée, bref : il invente une image.
Maintenant, Open AI a dévoilé la deuxième version de DALL-E, et les choses sont devenues sacrément sérieuses : la résolution s'est beaucoup améliorée et le temps de production a été beaucoup plus court. Une dynamique exponentielle typique à laquelle les intelligences artificielles nous ont habitués, et surtout vont nous habituer. Aussi parce que, si vous vous en souvenez, le responsable d'Open AI vient de dire que ces machines peut-être (peut-être) ils deviennent sensibles.
Un peu Wall-E, un peu Dali
La première version de DALL-E (un portemanteau de « Dali », d'après l'artiste, et de « WALL-E », d'après le personnage animé de Disney) était capable de générer des images et d'assembler diverses photos dans un collage, offrant des perspectives modifiables et déduire éléments d'une image vous-même, tels que les effets d'ombre.
Un super bon designer, avec toutes les images du monde à sa disposition, qui interprète les demandes et dessine instantanément.
"Contrairement à un moteur de rendu 3D, qui nécessite une saisie précise, DALL-E est souvent capable de" remplir les blancs "lorsque la légende implique que l'image doit inclure un certain élément n'est pas explicitement indiqué", a écrit l'équipe l'année dernière. sur le blog Open AI.
Comment fonctionne l’IA qui s’appuie sur la demande ?
DALL-E n’était pas destiné à être un produit commercial et l’équipe OpenAI a décidé que ce serait le meilleur. Les chercheurs l'ont "empêché" de créer des images sexuelles ou politiques, par exemple, pour éviter que le système ne soit utilisé pour générer de la désinformation. Il en va de même pour les noms précis : impossible de lui demander, par exemple, « dessiner Frank Sinatra jouant au tennis avec un ours polaire ».
DALL-E 1, essentiellement, profite de l'incroyable interpréteur de langage GPT-3 (ici j'en parle plus en profondeur, si cela vous intéresse) et dessine ce qu'il comprend plus ce qu'il « pressent ».
Contrairement à la première version qui était accessible à tous sur le site d'OpenAI, celle-ci n'est disponible en test que par un nombre limité de partenaires : j'attends quelques jours une réponse d'Open AI pour rejoindre le groupe.