Un institut futuriste vise à préserver (et recréer) les voix des gens en utilisant l'intelligence artificielle.
Les chercheurs impliqués dans l'initiative "Banque vocale" espèrent changer la vie de toutes les personnes qui perdent la voix à la suite d'une maladie ou d'un accident. Perdre la voix n'est pas vraiment comme avoir une baisse momentanée du son ou un enrouement. La perte de la voix est en partie la perte de l'identité.
Tout est parti d'une collaboration entre la Northeastern University of Boston et le Voyelles D.. Il est important de fournir à ceux qui perdent l'usage de la parole un moyen de conserver le sens de leur identité après un cancer de la gorge ou une maladie dégénérative. Ce projet leur permettra de "parler" en utilisant une forme synthétique très proche de leur propre voix.
C'est le premier centre de ce type, et sera dirigé par le prof. Rupal Patel, fondateur et PDG de VocaliD.
La société propose déjà un tel service pour les particuliers, explique Patel, mais de nombreuses personnes manquent d'équipements de qualité suffisante pour échantillonner correctement les voix. Construire une « banque de voix » permet aux futurs patients de garder leur voix quand ils en ont encore la possibilité.
"Souvent, les patients viennent nous voir au dernier moment", dé. « Ils n'ont pas assez de temps pour garder leur voix parce qu'ils sont à la merci de la maladie, des opérations et plus encore. Et c'est très frustrant."
La banque de voix
Le résultat a été la collaboration avec Northeastern pour diffuser la technologie au public. Le cœur du projet est la Voice Preservation Clinic, un centre où les patients à risque de perdre leur voix peuvent l'enregistrer pour la protéger.
L'approche est beaucoup plus compliquée que celles basées sur les synthèses vocales traditionnelles : un algorithme d'apprentissage automatique reconstruit les ligatures, les phonèmes et même le rythme par rapport à la respiration. Dans un stand spécial, de petites histoires, des poèmes ou des conversations sur différents thèmes sont enregistrés. Quelqu'un a même plaisanté sur le fait de perdre sa voix, une façon autodestructrice de gérer une grande peur.
« Ce qu'il faut, c'est environ deux ou trois heures de conversation. À partir de ces enregistrements, notre intelligence artificielle est capable de générer un moteur vocal qui a le même son. C'est comme rendre la voix à ceux qui l'ont perdue".
La voix régénérée peut être utilisée comme synthèse vocale pour parler en convertissant des textes écrits, et peut être intégrée demain avec un logiciel qui génère des mots, des images ou des actions à partir de chemins mentaux.
Une amélioration très rapide
La technologie, dit Patel, s'améliore rapidement et sera bientôt en mesure de reproduire une parole impossible à distinguer de la parole humaine.
L'équipe pourra aussi "vieillir" la voix pour l'adapter à l'âge de la personne, alors qu'il n'est pas encore possible de "faire grandir" la voix d'un garçon en la transformant en adulte.