Un nouvel appareil portable développé par des scientifiques de L'Université Cornell est capable de capturer les expressions faciales d'une personne à l'aide d'un sonar et de les reproduire sous forme d'avatar numérique. Éviter les caméras pourrait atténuer les problèmes de confidentialité.
EarIO, c'est le nom de l'appareil, est hyper simple. Il se compose d'un casque avec un microphone et un haut-parleur de chaque côté, et peut être connecté à n'importe quel casque normal. Les haut-parleurs reproduisent des impulsions sonores hors de portée de l'ouïe humaine, et leurs échos sont captés par des microphones, tout comme un sonar fonctionne.
Les profils d'écho changent en fonction des expressions faciales : pour cette raison, des algorithmes convenablement entraînés reconnaissent les variations reçues par le sonar et les traduisent en images.

EarlO, le sonar qui "voit" les choses à partir des sons
"Grâce à la puissance de l'intelligence artificielle, notre algorithme établit des liens complexes entre les mouvements musculaires et les expressions faciales que les humains ne peuvent pas percevoir", dit-il. Ke Li, l'un des co-auteurs de l'étude. "Il peut être utilisé pour extraire une information très complexe : celle de tout le devant du visage." La recherche a été publiée dans la revue Actes de l'Association for Computing Machinery on Interactive, Mobile, Wearable and Ubiquitous Technologies. Et je vous le mets en lien ici.
L'équipe a testé le sonar EarIO sur 16 participants, exécutant l'algorithme sur un smartphone ordinaire. Et l'appareil était capable de reconstruire les expressions faciales comme le ferait un appareil photo / appareil photo normal. Les bruits de fond tels que le vent, les conversations ou le bruit de la rue n'ont pas du tout interféré avec sa capacité à enregistrer les visages.
Technologie de 007
Les chercheurs soulignent que le sonar présente plusieurs avantages par rapport à l'utilisation d'un seul telecamera. Les données acoustiques consomment beaucoup moins d'énergie et de capacité de traitement, ce qui vous permet d'utiliser des appareils plus petits et plus légers. Les caméras peuvent également collecter de nombreuses informations personnelles supplémentaires que les utilisateurs ne souhaitent peut-être pas partager, de sorte que le sonar peut être plus sûr.
Bien sûr, volant avec imagination, j'imagine une telle technologie "glissée" silencieusement dans un casque normal, et je pense qu'elle peut transmettre des mouvements de lèvres et des expressions à distance, même à des fins de surveillance. Cette fois, cependant, je vois des utilisations plus pratiques.
Qui? Tout d'abord, ceux du secteur du jeu vidéo : un moyen pratique de reproduire des expressions faciales physiques sur un avatar numérique pour les jeux, la réalité virtuelle ou le métaverse. Maintenant, l'équipe travaille pour exclure d'autres interférences, comme lorsque l'utilisateur tourne la tête, et simplifie le système de formation pour l'algorithme d'IA.
Nous verrons. C'est-à-dire entendre. Bref, vous comprenez.