Futur proche
Pas de résultat
Voir tous les résultats
1 avril 2023
  • Acceuil
  • Technologie
  • santé
  • Environnement
  • Énergie
  • Transport
  • Espace
  • AI
  • Concepts
  • H+
Comprendre, anticiper, améliorer l'avenir.
CES2023 / Coronavirus / Russie-Ukraine
Futur proche
  • Acceuil
  • Technologie
  • santé
  • Environnement
  • Énergie
  • Transport
  • Espace
  • AI
  • Concepts
  • H+

Comprendre, anticiper, améliorer l'avenir.

Pas de résultat
Voir tous les résultats
Technologie

AudioLM, l'IA de Google écoute un fragment d'une chanson et la complète

Un nouveau système d'IA est capable de créer de la musique (et des mots) à partir de sons après avoir écouté quelques secondes d'audio ou de chansons

8 Octobre 2022
Gianluca RiccioGianluca Riccio
⚪ 4 minutes
Partager69Pin It17Tweet43EnvoyerPartager12PartagerPartager9

LIRE CECI DANS :

AudioLM, le système développé par les chercheurs de Google, génère toutes sortes de sons, y compris des sons complexes comme une musique de piano dans une chanson ou des gens qui parlent, presque indiscernables du fragment initial qui lui est soumis.

La technique est très prometteuse et peut être utile à bien des égards. Par exemple, il peut accélérer le processus de formation à l'IA ou générer automatiquement de la musique pour accompagner les vidéos. Mais c'est bien plus que cela.

Rejoue-le, Sam

Nous sommes déjà habitués à entendre le son généré par l'intelligence artificielle. Quiconque se bat tous les jours avec Alexa ou Google Nest le sait bien : nos assistants vocaux traitent le langage naturel.

Il y a bien sûr aussi des systèmes entraînés à la musique : souvenez-vous juke-box par OpenAI ? Je vous en ai parlé ici. Tous ces systèmes reposent cependant sur une "formation" longue et complexe, qui passe par le catalogage et l'administration de nombreuses "idées". Nos intelligences artificielles sont avides de données, et elles en veulent de plus en plus.

L'article continue après les liens associés

Quand l'IA mène au suicide : l'affaire qui secoue le monde de la technologie

Tree Canopy, la super arme de Google contre la chaleur dans les villes

L'étape suivante consiste à faire "réfléchir" l'IA en lui permettant de traiter plus rapidement les informations qu'elle écoute, sans nécessiter de longues formations. Quelque chose de similaire à ce que vous essayez de faire avec les systèmes d'auto-conduite.

Comment fonctionne AudioLM

Pour générer l'audio, quelques secondes de chanson ou de son sont introduites dans AudioLM, qui prédit littéralement ce qui va suivre. Ce n'est pas Shazam, il ne cherche pas le morceau entier et le re-propose. Il ne fait pas un collage de sons qu'il a en mémoire. Il les construit. Le processus est similaire à la façon dont je modèles linguistiques comme GPT-3, ils prédisent des phrases et des mots.

Les clips audio publiés par l'équipe Google semblent très naturels. En particulier, la musique de piano générée par AudioLM semble plus fluide que celle générée avec les intelligences artificielles actuelles. En d'autres termes, il est meilleur pour capturer la façon dont nous produisons une chanson, ou un son.

"C'est vraiment impressionnant, notamment parce que cela indique que ces systèmes apprennent une sorte de structure en couches", dit-il. Roger Danenberg, chercheur en musique générée par ordinateur à l'université Carnegie Mellon.

Chanson ou son, l'IA joue tout
AudioLM traite et prédit les sons de manière sans précédent

Pas seulement une chanson

Imaginez parler à AudioLM, deux mots et arrêtez. Le système poursuivra le discours en apprenant votre cadence, votre accent, vos pauses, voire votre respiration. Bref, exactement comme tu parles. Il n'a pas besoin de faire de formation spécifique : il peut le faire presque tout seul.

Comme un perroquet répétant les choses que vous entendez. Seulement c'est un perroquet capable de recevoir et de produire n'importe quel son, et de compléter de manière autonome ceux laissés au milieu.

En résumé? Nous aurons très bientôt (et dans ces cas là, c'est très bientôt) des systèmes capables de parler beaucoup plus naturellement, et de composer une chanson ou un son exactement comme De E 2, MidjourneyAI et d'autres créent des images, ou Faire une vidéo crée des clips basés sur notre entrée.

Qui détient les droits d'une chanson ?

Alors que ces systèmes seront capables de créer du contenu presque par eux-mêmes, cela "presque" fait encore toute la différence dans le monde, et oblige à considérer les implications éthiques de cette technologie.

Si je dis "Alors, fais-moi une fin différente pour Bohemian Rapsody" et que cette chose va faire une chanson dans ce sens, qui peut revendiquer les droits et percevoir les royalties pour la chanson ? Sans parler du fait que les sons et les discours désormais indiscernables des humains sont beaucoup plus convaincants et ouverts à une diffusion sans précédent de la désinformation.

Dans le document publié pour présenter cette IA (je mets le lien ici), les chercheurs écrivent qu'ils envisagent déjà comment atténuer ces problèmes en insérant des moyens de distinguer les sons naturels de ceux produits avec AudioLM. je crois peu. Bon nombre des objectifs pour lesquels cette IA a été créée seraient perdus.

Plus généralement, le risque est de produire un phénomène que j'appellerais "méfiance à l'égard de la réalité". Si tout peut être vrai, rien ne peut l'être. Rien n'a de valeur.

Nous essayons de former notre intelligence naturelle à ces changements tout en réfléchissant à la manière dont l'intelligence artificielle peut les produire. Si nous ne le faisons pas, nous aurons une chanson avec une fin très amère.

Mots clés: acoustiquegoogleintelligence artificielle


Chat GPT Megaeasy !

Guide concret pour ceux qui abordent cet outil d'intelligence artificielle, également conçu pour le monde scolaire : de nombreux exemples d'applications, des indications d'utilisation et des instructions prêtes à l'emploi pour entraîner et interroger Chat GPT.

Soumettre des articles, divulguer les résultats d'une recherche ou découvertes scientifiques écrire à la rédaction

Le plus lu du mois

  • AirCar, la voiture volante de Lazzarini est une voiture de course à 750km/h avec 4 places

    397 actions
    Partager 159 Tweet 99
  • Oculus rend visite en VR à la maison d'Anne Frank

    199 actions
    Partager 80 Tweet 50
  • Des animaux qui savent vivre éternellement et où les trouver

    952 actions
    Partager 380 Tweet 238
  • Dures vérités : la Chine serait-elle déjà plus forte que les États-Unis dans un conflit ?

    5 actions
    Partager 2 Tweet 1
  • Énergie solaire offshore : Seavolt est sur le point de révolutionner l'industrie

    4 actions
    Partager 1 Tweet 1
  • On parlera aux animaux : la révolution bioacoustique passe par l'IA

    5 actions
    Partager 1 Tweet 1
  • Moines brasseurs allemands : "adieu bouteilles et frais de transport, voici la bière en poudre"

    4 actions
    Partager 1 Tweet 1

Entrez dans la chaîne Telegram de Futuroprossimo, cliquez ici. Ou suivez-nous sur Instagram, Facebook, Twitter, Mastodonte e LinkedIn.

Le quotidien de demain.


Futuroprossimo.it fournit des nouvelles sur l'avenir de la technologie, de la science et de l'innovation : s'il y a quelque chose qui est sur le point d'arriver, c'est déjà arrivé. FuturoProssimo fait partie du réseau Transférer à, des études et des compétences pour des scénarios futurs.

FacebookTwitterInstagramTelegramLinkedInMastodontePinterestTikTok.
  • Environnement
  • architecture
  • Intelligence artificielle
  • Gadgets et assessoires électronique
  • Concepts
  • Design
  • Médecine
  • Espace
  • Robotica
  • travail
  • Transport
  • Énergie
  • Édition française
  • édition allemande
  • Version japonnaise
  • Édition anglaise
  • Edition portugaise
  • Русское издание
  • Édition espagnole

Abonnez-vous à la newsletter

  • L'éditeur
  • Publicité sur FP
  • Politique de Confidentialité

© 2022 Futur proche - Creative Commons License
Ce travail est distribué sous licence Creative Commons Attribution 4.0 International.

Pas de résultat
Voir tous les résultats
Comprendre, anticiper, améliorer l'avenir.
  • Acceuil
  • Technologie
  • santé
  • Environnement
  • Énergie
  • Transport
  • Espace
  • AI
  • Concepts
  • H+