Je sais, nous étions tous distraits par autre chose : en janvier 2021 OpenAI, la société fondée par Elon Musk et soutenue par Microsoft, a lancé son projet le plus ambitieux à ce jour : un système d'apprentissage automatique appelé LUI DONNER.
A quoi sert cette intelligence artificielle ? Vite dit : il produit des images à partir d'une simple description textuelle. Un exemple? Écrivez « Un chameau avec un livre en guise de chapeau », ou « Une cravate faite de fourchettes » et il dessine, crée, bref : il en sort une image.
Maintenant, Open AI a dévoilé la deuxième version de DALL-E, et les choses sont devenues sacrément sérieuses : la résolution s'est beaucoup améliorée et le temps de production a été beaucoup plus court. Une dynamique exponentielle typique à laquelle les intelligences artificielles nous ont habitués, et surtout vont nous habituer. Aussi parce que, si vous vous en souvenez, le responsable d'Open AI vient de dire que ces machines peut-être (peut-être) ils deviennent sensibles.

Un peu Wall-E, un peu Dali
La version DALL-E un (un portemanteau de "Dali", en tant qu'artiste, et de "WALL-E", en tant que personnage animé de Disney) était capable de générer des images et d'assembler diverses photos dans un collage, offrant des perspectives modifiables, et déduire à eux seuls des éléments d'une image, par exemple des effets d'ombrage.
Un super bon dessinateur, avec toutes les images du monde à sa disposition, qui interprète les demandes et dessine instantanément.
"Contrairement à un moteur de rendu 3D, qui nécessite des entrées précises, DALL-E est souvent capable de" remplir les blancs "lorsque la légende implique que l'image doit inclure un certain élément n'est pas spécifiquement indiqué", écrivait l'équipe l'année dernière. sur le blog Open AI.

Comment fonctionne l'IA qui s'appuie sur la demande ?
DALL-E n'était pas censé être un produit commercial, et l'équipe d'OpenAI a décidé que ce serait mieux. Les chercheurs l'ont "empêché" de créer des images sexuelles ou politiques, par exemple, pour empêcher que le système ne soit utilisé pour générer de la désinformation. Même chose pour les noms précis : impossible de lui demander, de dire, "dessine Frank Sinatra jouant au tennis avec un ours polaire".
DALL-E 1, en substance, tire parti de l'incroyable interpréteur de langage GPT-3 (ici j'en parle plus en profondeur, si cela vous intéresse) et dessine ce qu'il comprend plus que ce qu'il "sent".

Contrairement à la première version qui était accessible à tous sur le site d'OpenAI, celle-ci n'est disponible en test que par un nombre limité de partenaires : j'attends quelques jours une réponse d'Open AI pour rejoindre le groupe.