Un nouvel algorithme "met d'autres mots dans la bouche" des personnes présentes dans les vidéos en éditant la transcription du texte.

Gianluca Riccio

6 juin 2019

vidéo

Technologie

Une collaboration entre géants de la technologie permet de modifier le discours dans une vidéo simplement en modifiant la transcription du texte: la personne dans le film change les mots et les mouvements des lèvres.

Partagez

Il devient extrêmement facile (et je ne pense pas que ce soit une bonne chose) de modifier une vidéo, et les derniers développements en matière d'IA sont vraiment impressionnants.

Une collaboration entre des géants (les universités de Stanford et de Princeton plus l'Institut d'informatique Max Planck et Adobe) permet d'altérer le discours d'une vidéo simplement en modifiant la transcription textuelle, et sans créer d'effet « doublage ».

En d'autres termes, la personne qui parle en vidéo changera littéralement les mots de son discours, modifiant également les mouvements des lèvres.

Pour obtenir ce résultat quelque peu inquiétant, l'algorithme « apprend » les phonèmes et leur prononciation par le sujet dans la vidéo et crée un modèle 3D précis de son visage, capable de reproduire tous les sons et mouvements : à ce stade, il suffira d’éditer le texte du discours et l’algorithme remplacera la phrase originale.

Actuellement, l’algorithme a besoin d’au moins 40 minutes de séquences pour « s’entraîner » à reproduire une personne dans un film.

Voici une vidéo montrant le fonctionnement du système:

D'énormes doutes éthiques

Il est clair que ce mécanisme crée la possibilité que n'importe qui puisse modifier un discours (peut-être de personnalités politiques ou de personnalités publiques) en y insérant des éléments de haine, ou de désinformation, et en les diffusant comme originaux et naturels: cela ne fait qu'augmenter les inquiétudes quant à la diffusion de systèmes basés sur deepfake.

D'un autre côté, il y a un côté positif, et il réside dans les énormes économies que le montage obtiendra en évitant de devoir refaire des scènes entières à cause de petites erreurs de prononciation.

Pour le reste, je suis sûr que d'autres méthodes « anti-contrefaçon » seront également développées pour les vidéos : des filigranes dynamiques ou des filigranes qui complexifient encore le travail de l'intelligence artificielle, dans une compétition entre réalité et manipulation qui semble déjà destinée à caractériser les années prochaines.

Plus d'informations sur la recherche ici

Gianluca Riccio, directeur créatif de Melancia adv, rédacteur et journaliste. Elle fait partie de l'Institut italien pour le futur, de la World Future Society et de H+. Depuis 2006, il dirige Futuroprossimo.it, la ressource italienne de futurologie.

Pour rendre compte des recherches, découvertes et inventions, contactez la rédaction ! Suivez Futuro Prossimo sur Whatsapp : nouvelles et mises à jour exclusives (gratuites).

Robiati Riccio

FP sur Fatto Quotidiano
Alberto Robiati et Gianluca Riccio guident les lecteurs à travers des scénarios du futur : les opportunités, les risques et les possibilités dont nous disposons pour créer un avenir possible.

Sur le même sujet :

Google Gemini arrive, et ça coupe le souffle : mais quand peut-il être utilisé ?

7 décembre 2023

Immergé dans le futur : comment l’IA et la VR vont redéfinir notre réalité physique

21 novembre 2023

SciMatch : prenez un selfie et rencontrez votre âme sœur

2 octobre 2023

archives

Le dernier

Greffe d'ovaires : la ménopause « à la demande » divise la science

22 avril 2024

Energie houlomotrice : le CETO obtient le feu vert en Espagne

22 avril 2024

BlackHawk, 45 nœuds avec seulement 50 kW : tous les secrets du dériveur volant

22 avril 2024

Un drone d'arbitre ? Tout ce qui manque au football, c'est le VAR volant

22 avril 2024

TikTok transforme (et divise) le monde occidental : sera-t-il interdit ?

21 avril 2024