Site icon Vokode

Jukebox est une IA qui transforme des paroles en musique

IA

Jukebox est un système d'IA créé par OpenAI qui génère de la musique à partir de paroles entendues dans un morceau

Une fois n’est pas coutume : voilà un autre article que nous consacrons à la rencontre de l’IA et de la création musicale. Après le projet “Kórsafn” de Björk ou le morceau de Travis Scott jusqu’à MatchTune la startup d’André Manoukian et Philippe Guillaud, c’est le projet de OpenAI qui a piqué notre curiosité.

OpenAI a développé ce système d’intelligence artificielle ou IA reposant sur du machine learning à même de créer une musique à partir de presque rien. Ce presque rien, ce sont des paroles entendues dans un morceau. Mais Jukebox n’est pas le coup d’essai d’OpenAI. Récemment, l’entreprise introduisait MuseNet, l’ancêtre de Jukebox. Un système d’intelligence artificielle également capable de produire des sons sur demande mais pas que. MuseNet était également d’appréhender un morceau de musique en entier et de l’assimiler.

Dans un second temps, l’IA était alors en mesure de prédire une chanson avant même de l’entendre.

L’IA : l’avenir de la création musicale ?

En ce sens, Jukebox n’est que le successeur de MuseNet mais au lieu de reconnaître un morceau, ce système est capable d’en composer un de toute pièce. La prouesse ne s’arrête pas là : l’IA choisit elle même les instruments, genres musicaux et même.. les paroles. Il lui suffit d’ailleurs de 12 secondes d’un morceau pour pouvoir composer elle-même le reste.

La technologie Jukebox par OpenAI

Sur ce dernier point, elle n’est pas prête de renverser les paroliers humains mais la science progresse. Pour l’heure, Jukebox ne peut pas appréhender et assimiler des paroles. Pour le reste du processus de composition, l’IA mélange elle-même différentes séquences de morceaux qu’elle a déjà assimilé.

Pourtant, elle comprend le texte d’où elle tire sa mélodie, ce qui lui permet ensuite d’harmoniser l’ensemble du morceau ainsi produit. Précisons que pour les besoins de son développement, l’IA a écouté et assimilé l’équivalent de 1,2 millions de morceaux. C’est cette vaste « culture musicale » qui lui permet d’improviser. Comme elle semble faire improviser des impresarios virtuels exploitant la voix d’icônes de la musique dont Elvis Presley.

Jack Park Canny Dope Man par Travis Scott

Même si cette solution n’a pas encore séduit de musiciens de métier, les applications sont multiples. Notamment pour des expériences nécessitant une improvisation en continu. L’IA est de toute façon amenée à se démocratiser dans la création musicale. On pensera notamment au morceau de Travis Scott : Jack Park Canny Dope Man.

Quitter la version mobile