Make-A-Video, l'IA de Meta crée des vidéos à partir de texte

30 septembre 2022

Technologie

Après les générateurs d'images à partir de textes, place aux clips : Make-A-Video place l'entreprise de Zuckerberg à la tête de la recherche.

Partagez

Nous ne nous sommes toujours pas remis de l'avènement de DALL-E2, Midjourney et compagnons que Meta a annoncés Faire une vidéo, un outil qui génère de courts clips vidéo à partir de descriptions textuelles. C'est la prochaine étape pour le monde du contenu généré par l'IA.

C'est la première fois qu'un outil de conversion texte-vidéo arrive aussi près du lancement final. "La recherche sur l'intelligence artificielle fait progresser l'expression créative en fournissant aux gens des outils pour créer de nouveaux contenus rapidement et facilement", lit-on dans le rapport. communiqué de presse présentation.

Make-A-Video est capable de donner vie à la créativité avec quelques mots ou lignes de texte et de créer des films distinctifs riches en couleurs, personnages et décors. Le système peut également transformer des photographies ou des vidéos existantes en nouveaux films similaires.

Superbe coup, David

"Il est beaucoup plus difficile de générer des vidéos que des photos", déclare le PDG de Meta Mark Zuckerberg dans un poster sur Facebook. Mais vas-y, je n'y ai pas pensé. « En plus de générer correctement chaque pixel, le système doit également prédire comment ils évolueront au fil du temps. Make-A-Video résout ce problème en ajoutant une couche d'apprentissage non supervisée qui permet au système de comprendre le mouvement dans le monde physique et de l'appliquer à la génération traditionnelle de texte en image.

Il site Web by Make-A-Video présente quelques exemples de vidéos réalisées par l'IA, comme « un chien portant un costume de super-héros avec une cape rouge volant dans le ciel » et « un tableau d'ours en peluche ». C’est une nouvelle démonstration de la progression incroyablement rapide de ces systèmes. Seulement deux? Il y a trois ans? Ces choses étaient pratiquement de la science-fiction.

Faire une vidéo — La capture d'écran tirée du clip « d'un ours en peinture » généré par l'intelligence artificielle de Make-A-Video

Make-A-Video, émerveillement (et bien sûr dangers)

Alors que nous comptons de plus en plus sur l’IA pour générer de l’art, il sera de plus en plus important pour les entreprises d’adopter des politiques de transparence autour de ces algorithmes. En lisant le document de recherche derrière Make-A-Video, il est clair que cette intelligence artificielle a été « entraînée » à l’aide d’un sous-ensemble d’un ensemble de données appelé LAOIN, qui comprend également des images loin d’être nettes. Lequel? Exécutions de l’Etat islamique, nudité non consensuelle, etc. Meta garantit avoir soigneusement passé au crible ces données, éliminant automatiquement les images de nus et autres fausses images.

Sera. Pendant ce temps, la bataille pour l’éthique continue.

L’introduction du texte en vidéo comme outil pour les artistes et les créateurs complique également la question (déjà épineuse) de la légitimité de l’art généré par l’IA. En août, vous savez, un gars appelé Jason Allen a remporté un concours d'art en utilisant une image créée par Midjourney, suscitant une controverse.

Même les entreprises qui collectent des images à des fins commerciales (comme Shutterstock ou Getty Images) ont fermé la porte à ce contenu. Aucune question éthique, dans ce cas. Légal seulement. À qui appartiennent les images utilisées par les algorithmes pour s’entraîner ? Transformer ces images en de nouvelles choses constitue-t-il une violation du droit d'auteur ou non ? Les lois ne se sont pas encore adaptées.

Pendant ce temps, le tsunami continue : ces technologies submergent littéralement le public, avec la même rapidité avec laquelle elles apprennent à se perfectionner. L'annonce d'hier sur Make-A-Video suit d'un jour seulement le sortie publique de DALLE-2 par OpenAI. La société qui a développé DALLE-2 a supprimé la liste d'attente du système, permettant à quiconque de générer des images à partir de lignes de texte.

Mais même si le public a accès à de plus en plus d’outils de génération d’art IA, certaines des questions éthiques fondamentales concernant leur utilisation restent ouvertes : et elles exigent des réponses.

Gianluca Riccio, directeur créatif de Melancia adv, rédacteur et journaliste. Elle fait partie de l'Institut italien pour le futur, de la World Future Society et de H+. Depuis 2006, il dirige Futuroprossimo.it, la ressource italienne de futurologie.

Pour rendre compte des recherches, découvertes et inventions, contactez la rédaction ! Suivez Futuro Prossimo sur Whatsapp : nouvelles et mises à jour exclusives (gratuites).