Un institut futuriste vise à préserver (et recréer) la voix des gens grâce à l'intelligence artificielle.
Les chercheurs impliqués dans l'initiative « banque de voix » espèrent pouvoir changer la vie de toutes les personnes qui perdent la voix à la suite d'une maladie ou d'un accident. Perdre la voix n’est pas exactement la même chose qu’avoir une diminution temporaire du son ou un enrouement. La perte de voix est en partie la perte d’identité.
Tout est parti d'une collaboration entre la Northeastern University of Boston et le Voyelles D.. Il est important d’offrir à ceux qui perdent la capacité de parler un moyen de conserver un sentiment d’identité après un cancer de la gorge ou une maladie dégénérative. Ce projet leur permettra de « parler » en utilisant une forme synthétique très similaire à leur propre voix.
C'est le premier centre de ce type, et sera dirigé par le prof. Rupal Patel, fondateur et PDG de VocaliD.
L'entreprise propose déjà un tel service aux particuliers, explique Patel, mais de nombreuses personnes n'ont pas accès à un équipement de haute qualité pour échantillonner correctement leur voix. Créer une « banque de voix » permet aux futurs patients de préserver leur voix tant qu’ils en ont encore la possibilité.
« Les patients viennent souvent chez nous à la dernière minute » dé. « Ils n'ont pas assez de temps pour préserver leur voix car ils sont à la merci de la maladie, des opérations et bien plus encore. Et c'est très frustrant."
La banque de voix
Le résultat a été la collaboration avec Northeastern pour diffuser la technologie au public. Le cœur du projet est la Voice Preservation Clinic, un centre où les patients à risque de perdre leur voix peuvent l'enregistrer pour la protéger.
L’approche est bien plus compliquée que celles basées sur la synthèse vocale traditionnelle : un algorithme d'apprentissage automatique reconstruit les ligatures, les phonèmes et même le rythme par rapport à la respiration. Dans un stand spécial, de petites histoires, des poèmes ou des conversations sur différents thèmes sont enregistrés. Quelqu'un a même plaisanté sur le fait de perdre sa voix, une façon autodestructrice de gérer une grande peur.
« Ce dont vous avez besoin, c’est d’environ deux ou trois heures de parole. À partir de ces enregistrements, notre intelligence artificielle est capable de générer un moteur vocal qui sonne de la même manière. C'est comme redonner la voix à ceux qui l'ont perdue. »
La voix régénérée peut être utilisée comme synthèse vocale pour parler en convertissant des textes écrits, et peut être intégrée demain avec un logiciel qui génère des mots, des images ou des actions à partir de chemins mentaux.
Une amélioration très rapide
La technologie, dit Patel, s'améliore rapidement et sera bientôt en mesure de reproduire une parole impossible à distinguer de la parole humaine.
L'équipe pourra également « vieillir » la voix pour l'adapter à l'âge de la personne, alors qu'il n'est pas encore possible de « faire grandir » la voix d'un enfant jusqu'à celle d'un adulte.