Des chercheurs de l’Université de Californie à San Diego ont récemment construit un système d’apprentissage automatique qui prédit ce que les oiseaux s’apprêtent à chanter.
Si vous ne trouvez pas de grandes possibilités pratiques, je commencerai par vous dire que la synthèse vocale prédictive en temps réel pour les prothèses vocales serait déjà une bonne chose. Mais les implications de la compréhension du chant des oiseaux pourraient aller beaucoup plus loin.
Chant des oiseaux, un monde extrêmement articulé
Le chant des oiseaux est une forme de communication complexe qui implique le rythme, le ton et, surtout, les comportements appris.
Selon les chercheurs, apprendre à une intelligence artificielle à comprendre (et à être capable de construire suffisamment pour anticiper) le chant des oiseaux est une étape précieuse sur la voie du remplacement des vocalisations humaines biologiques.
Les prothèses motrices utilisaient les primates comme modèle animal. Il n’existe pas de modèle similaire pour les prothèses vocales. C’est peut-être la raison pour laquelle celles-ci sont plus limitées en termes de technologie d’interface neuronale, de couverture cérébrale et de conception d’études comportementales.
Il n’est pas facile de « penser » au chant des oiseaux, mais c’est une étape importante
Les oiseaux chanteurs sont un modèle intéressant de comportement vocal appris complexe. Le chant des oiseaux partage un certain nombre de similitudes uniques avec la parole humaine. Son étude a déjà fourni d’excellentes informations générales sur les mécanismes et circuits qui sous-tendent l’apprentissage, l’exécution et le maintien de la motricité vocale.
Mais traduire des vocalises en temps réel n'est pas un défi facile. Les systèmes actuels sont encore lents par rapport à nos schémas naturels de pensée et de parole.
Pensez-y, car c'est beau : les systèmes de traitement du langage naturel de pointe ont encore du mal à suivre la pensée humaine.
Nous sommes encore trop rapides pour une voiture
Lorsque nous interagissons avec notre Assistant Google ou Alexa, il y a souvent une pause plus longue que celle à laquelle on pourrait s'attendre lorsque l'on parle à une personne réelle. En effet, l'IA traite notre discours, détermine la signification de chaque mot par rapport à ses capacités, puis détermine à quelles réactions ou programmes accéder pour répondre.
Bien sûr, il est déjà étonnant que ces systèmes basés sur le cloud fonctionnent à cette vitesse. Mais ils ne sont pas encore assez performants pour créer une interface en temps réel permettant aux sans-voix de parler à la vitesse de la pensée.
Recherche sur le chant des oiseaux
Tout d’abord, l’équipe a implanté des électrodes dans une douzaine de cerveaux d’oiseaux (chardonnerets zèbres), puis a commencé à enregistrer l’activité cérébrale pendant le chant des oiseaux.
Mais il ne suffit pas d'entraîner une IA à reconnaître l'activité neuronale des oiseaux pendant leur chant : même le cerveau d'un oiseau est trop complexe pour cartographier complètement le fonctionnement des communications entre ses neurones.
Les chercheurs ont donc formé un autre système pour réduire les chansons en temps réel en modèles reconnaissables avec lesquels l'IA peut travailler.
C'est très intéressant, car il apporte une solution à un problème en suspens.
Le traitement du chant des oiseaux en temps réel est impressionnant et reproduire ces résultats avec le langage humain serait historique.
Mais ce premier travail n'est pas encore prêt. Et il n'est pas encore adaptable à d'autres systèmes vocaux. Cela peut ne pas fonctionner au-delà du chant des oiseaux.
Mais si c'était le cas, ce serait l'un des premiers et gigantesques sauts technologiques pour les interfaces cerveau-ordinateur depuis la résurgence de l'apprentissage en profondeur en 2014.