Un nouvel appareil portable développé par des scientifiques de L'Université Cornell est capable de capturer les expressions faciales d'une personne à l'aide d'un sonar et de les reproduire sous forme d'avatar numérique. Éviter les caméras pourrait atténuer les problèmes de confidentialité.
EarIO, c'est le nom de l'appareil, est hyper simple. Il se compose d'un écouteur avec un microphone et un haut-parleur de chaque côté, et peut être connecté à n'importe quel écouteur normal. Les haut-parleurs diffusent des impulsions sonores hors de portée de l’audition humaine et leurs échos sont captés par des microphones, tout comme les sonars.
Les profils d'écho changent en fonction des expressions faciales : pour cette raison, des algorithmes correctement entraînés reconnaissent les variations reçues du sonar et les traduisent en images.
EarlO, un sonar qui « voit » les choses à partir des sons
"Grâce à la puissance de l'intelligence artificielle, notre algorithme établit des liens complexes entre les mouvements musculaires et les expressions faciales que les humains ne peuvent pas percevoir", explique-t-il. Ke Li, l'un des co-auteurs de l'étude. "Il permet d'extraire des informations très complexes : celles de tout le devant du visage." La recherche a été publiée dans la revue Actes de l'Association for Computing Machinery on Interactive, Mobile, Wearable and Ubiquitous Technologies. Et je vous le mets en lien ici.
L’équipe a testé le sonar EarIO sur 16 participants, en exécutant l’algorithme sur un smartphone ordinaire. Et l’appareil était capable de reconstruire les expressions faciales comme le ferait un appareil photo/caméra vidéo normal. Les bruits de fond tels que le vent, les conversations ou le bruit de la rue n’ont en aucun cas gêné sa capacité à enregistrer les visages.
Technologie de 007
Les chercheurs soulignent que le sonar présente plusieurs avantages par rapport à l'utilisation d'un seul telecamera. Les données acoustiques consomment beaucoup moins d'énergie et de capacité de traitement, ce qui vous permet d'utiliser des appareils plus petits et plus légers. Les caméras peuvent également collecter de nombreuses informations personnelles supplémentaires que les utilisateurs ne souhaitent peut-être pas partager, de sorte que le sonar peut être plus sûr.
Bien sûr, en volant avec mon imagination, j'imagine une technologie comme celle-ci "coincée" silencieusement dans un écouteur normal, et je pense qu'elle peut transmettre à distance les mouvements et les expressions des lèvres également à des fins de surveillance. Cette fois, cependant, j’y vois des utilisations plus pratiques.
Lequel? Tout d’abord ceux du secteur du gaming : un moyen pratique de reproduire des expressions physiques du visage sur un avatar numérique pour les jeux, la réalité virtuelle ou le métaverse. L'équipe s'efforce désormais d'exclure d'autres interférences, comme lorsque l'utilisateur tourne la tête, et de simplifier le système de formation pour l'algorithme d'IA.
Nous verrons. C'est-à-dire entendre. Bref, vous comprenez.