edición general
119 meneos
2346 clics

MusicLM: Generación de música a partir de una descripción textual (Google) [ENG]

Presentamos MusicLM, un modelo que genera música de alta fidelidad a partir de descripciones textuales como "una relajante melodía de violín acompañada de un riff de guitarra distorsionado". MusicLM plantea el proceso de generación de música condicional como una tarea de modelado jerárquico secuencia a secuencia, y genera música a 24 kHz que se mantiene constante durante varios minutos. Nuestros experimentos demuestran que MusicLM supera a los sistemas anteriores tanto en calidad de audio como en adherencia a la descripción textual.

| etiquetas: google , ia , musiclm

menéame