Futur proche
Pas de résultat
Voir tous les résultats
Juin 6 2023
  • CFL
  • Technologie
  • santé
  • Environnement
  • Énergie
  • Transport
  • Espace
  • AI
  • Concepts
  • H+
Comprendre, anticiper, améliorer l'avenir.
CES2023 / Coronavirus / Russie-Ukraine
Futur proche
  • CFL
  • Technologie
  • santé
  • Environnement
  • Énergie
  • Transport
  • Espace
  • AI
  • Concepts
  • H+

Comprendre, anticiper, améliorer l'avenir.

Pas de résultat
Voir tous les résultats
Technologie

LIBS, l'IA qui peut lire les lèvres des gens dans les vidéos

LIBS est un nouveau système d'IA qui peut lire les lèvres mieux que quiconque, humain ou autre. Cela aidera les sourds (et les espions globaux).

5 décembre 2019
Gianluca RiccioGianluca Riccio
⚪ 3 minutes
Partager93Pin It19Tweet52EnvoyerPartager14PartagerPartager10

LIRE CECI DANS :

L'intelligence artificielle et les algorithmes d'apprentissage automatique capables de lire les lèvres à partir de vidéos n'ont en fait rien d'extraordinaire.

En 2016, des chercheurs de Google et de l'Université d'Oxford ont détaillé un système capable de lire sur les lèvres et d'annoter des films avec une précision de 46,8 %. Cela vous paraît peu ? Il surpassait déjà la précision de 12,4 % d'un lecteur labial humain professionnel. Et il n'y avait pas encore de LIBS.

Cependant, 46,8% ne sont pas à la hauteur des capacités dont l'intelligence artificielle peut faire preuve aujourd'hui. Les systèmes de pointe ont du mal à surmonter les ambiguïtés dans les mouvements des lèvres, ce qui empêche leurs performances de surpasser celles de la reconnaissance vocale basée sur l'audio.

A la recherche d'un système plus performant, les chercheurs Alibaba, Université du Zhejiang et Stevens Institute of Technology ils ont conçu une méthode baptisée Lèvre par parole (LIBS), qui utilise des caractéristiques extraites des reconnaissances vocales pour servir d'indices complémentaires. Le système place la barre encore plus haut de 8 % et peut encore s'améliorer.

LIBS et d'autres solutions similaires peuvent aider les personnes malentendantes à suivre des vidéos sans sous-titres. On estime que 466 millions de personnes dans le monde souffrent de déficience auditive, soit environ 5 % de la population mondiale. D'ici 2050, ce nombre pourrait atteindre plus de 900 millions, selon l'Organisation mondiale de la santé.

L'article continue après les liens associés

ChatGPT, les 3 premiers secteurs qui seront totalement bouleversés par l'IA

L'avenir est un factotum : les chatbots vont transformer le marketing relationnel

LIBS, l'IA qui lit mieux que quiconque les lèvres

La méthode AI pour lire la lèvre

LIBS tire des informations audio utiles de plusieurs facteurs : comme un cryptographe qualifié, l'IA recherche des mots compréhensibles. A ce point il les compare avec la correspondance à la lèvre et va chercher tous les labiles semblables. Mais cela ne s'arrête pas là : il compare également la fréquence vidéo de ces images, et d'autres indices techniques, affinant la recherche pour lire sur les lèvres même dans des mots incompréhensibles à notre oreille.

Si cela semble compliqué, réessayez, mais je ne promets rien.

Je cite Document de présentation technologique. "Les composants de reconnaissance vocale et de lecture labiale LIBS sont basés sur une architecture séquence-séquence basée sur l'attention, une méthode de traduction automatique qui mappe une entrée à une séquence (audio ou vidéo)."

Les chercheurs ont formé l'IA sur une première base de données contenant plus de 45.000 100.000 phrases prononcées par la BBC, et sur CMLR, le plus grand corpus chinois disponible pour la lecture labiale en chinois mandarin, avec plus de XNUMX XNUMX phrases naturelles.

Les champs d'application ne se limitent pas à l'aide aux sourds. L'usage d'attribuer un usage « socialement noble » à chaque technologie ne doit jamais faire oublier que l'usage principal de ces technologies se situe dans le domaine militaire ou de la sécurité.

Personne n'a pensé au fait que ce système peut rendre la surveillance de la sécurité encore plus infaillible et omniprésente étonnantes nouvelles caméras de sécurité, ou de nouveaux systèmes satellitaires?

Avec l'IA désormais devenue un œil omniscient ce sera une blague à écouter (ou reconstruire) nos chuchotements même depuis un satellite en orbite.

Tais-toi! (Jusqu'à ce qu'il lise aussi ses pensées) Big Brother vous écoute!

Mots clés: AIGrande Fratellointelligence artificiellesorveglianza


Chat GPT Megaeasy !

Guide concret pour ceux qui abordent cet outil d'intelligence artificielle, également conçu pour le monde scolaire : de nombreux exemples d'applications, des indications d'utilisation et des instructions prêtes à l'emploi pour entraîner et interroger Chat GPT.

Soumettre des articles, divulguer les résultats d'une recherche ou découvertes scientifiques écrire à la rédaction

Le plus lu de la semaine

  • Oculus rend visite en VR à la maison d'Anne Frank

    281 actions
    Partager 112 Tweet 70
  • Sucralose, l'amère vérité : l'édulcorant abîme l'ADN

    6 actions
    Partager 2 Tweet 1
  • PAINT, le stylo régénérant qui cicatrise les blessures

    4 actions
    Partager 2 Tweet 1
  • Solaire spatial, énergie envoyée sur Terre avec des ondes radio : ils l'ont fait

    4 actions
    Partager 1 Tweet 1
  • Les doigts bioniques "voient" dans les objets, "touchent" l'ère de l'ingénierie tactile

    3 actions
    Partager 1 Tweet 1

Entrez dans la chaîne Telegram de Futuroprossimo, cliquez ici. Ou suivez-nous sur Instagram, Facebook, Twitter, Mastodonte e LinkedIn.

Le quotidien de demain.


Futuroprossimo.it fournit des nouvelles sur l'avenir de la technologie, de la science et de l'innovation : s'il y a quelque chose qui est sur le point d'arriver, c'est déjà arrivé. FuturoProssimo fait partie du réseau Transférer à, des études et des compétences pour des scénarios futurs.

FacebookTwitterInstagramTelegramLinkedInMastodontePinterestTikTok (application mobile)
  • Environnement
  • architecture
  • Intelligence artificielle
  • Gadgets et assessoires électronique
  • Concepts
  • Design
  • Médecine
  • Espace
  • Robotica
  • travail
  • Transport
  • Énergie
  • Édition française
  • édition allemande
  • Version japonnaise
  • Édition anglaise
  • Edition portugaise
  • Русское издание
  • Édition espagnole

Abonnez-vous à la newsletter

  • L'éditeur
  • Publicité sur FP
  • Politique de Confidentialité

© 2022 Futur proche - Creative Commons License
Ce travail est distribué sous licence Creative Commons Attribution 4.0 International.

Pas de résultat
Voir tous les résultats
Comprendre, anticiper, améliorer l'avenir.
  • CFL
  • Technologie
  • santé
  • Environnement
  • Énergie
  • Transport
  • Espace
  • AI
  • Concepts
  • H+