Nous ne nous sommes toujours pas remis de l'avènement de DALL-E2, Midjourney et compagnons que Meta a annoncés Faire une vidéo, un outil qui génère de courts clips vidéo à partir de descriptions textuelles. C'est la prochaine étape pour le monde du contenu généré par l'IA.
C'est la première fois qu'un outil de conversion texte-vidéo arrive aussi près du lancement final. "La recherche sur l'intelligence artificielle fait progresser l'expression créative en fournissant aux gens des outils pour créer de nouveaux contenus rapidement et facilement", lit-on dans le rapport. communiqué de presse présentation.
Make-A-Video est capable de donner vie à la créativité avec quelques mots ou lignes de texte et de créer des films distinctifs riches en couleurs, personnages et décors. Le système peut également transformer des photographies ou des vidéos existantes en nouveaux films similaires.
Superbe coup, David
"Il est beaucoup plus difficile de générer des vidéos que des photos", déclare le PDG de Meta Mark Zuckerberg dans un poster sur Facebook. Mais vas-y, je n'y ai pas pensé. « En plus de générer correctement chaque pixel, le système doit également prédire comment ils évolueront au fil du temps. Make-A-Video résout ce problème en ajoutant une couche d'apprentissage non supervisée qui permet au système de comprendre le mouvement dans le monde physique et de l'appliquer à la génération traditionnelle de texte en image.
Il site Web by Make-A-Video présente quelques exemples de vidéos réalisées par l'IA, comme « un chien portant un costume de super-héros avec une cape rouge volant dans le ciel » et « un tableau d'ours en peluche ». C’est une nouvelle démonstration de la progression incroyablement rapide de ces systèmes. Seulement deux? Il y a trois ans? Ces choses étaient pratiquement de la science-fiction.
Make-A-Video, émerveillement (et bien sûr dangers)
Alors que nous comptons de plus en plus sur l’IA pour générer de l’art, il sera de plus en plus important pour les entreprises d’adopter des politiques de transparence autour de ces algorithmes. En lisant le document de recherche derrière Make-A-Video, il est clair que cette intelligence artificielle a été « entraînée » à l’aide d’un sous-ensemble d’un ensemble de données appelé LAOIN, qui comprend également des images loin d’être nettes. Lequel? Exécutions de l’Etat islamique, nudité non consensuelle, etc. Meta garantit avoir soigneusement passé au crible ces données, éliminant automatiquement les images de nus et autres fausses images.
Sera. Pendant ce temps, la bataille pour l’éthique continue.
L’introduction du texte en vidéo comme outil pour les artistes et les créateurs complique également la question (déjà épineuse) de la légitimité de l’art généré par l’IA. En août, vous savez, un gars appelé Jason Allen a remporté un concours d'art en utilisant une image créée par Midjourney, suscitant une controverse.
Même les entreprises qui collectent des images à des fins commerciales (comme Shutterstock ou Getty Images) ont fermé la porte à ce contenu. Aucune question éthique, dans ce cas. Légal seulement. À qui appartiennent les images utilisées par les algorithmes pour s’entraîner ? Transformer ces images en de nouvelles choses constitue-t-il une violation du droit d'auteur ou non ? Les lois ne se sont pas encore adaptées.
Pendant ce temps, le tsunami continue : ces technologies submergent littéralement le public, avec la même rapidité avec laquelle elles apprennent à se perfectionner. L'annonce d'hier sur Make-A-Video suit d'un jour seulement le sortie publique de DALLE-2 par OpenAI. La société qui a développé DALLE-2 a supprimé la liste d'attente du système, permettant à quiconque de générer des images à partir de lignes de texte.
Mais même si le public a accès à de plus en plus d’outils de génération d’art IA, certaines des questions éthiques fondamentales concernant leur utilisation restent ouvertes : et elles exigent des réponses.