RIFFUSION: Usando o Stable Diffusion para gerar Música (através de espectrogramas)
Turma, esbarrei numa das mais criativas adaptações do Stable Diffusion que é o RIFFUSION (uma mistura de riff
+ diffusion
) onde a idéia é utilizar o mesmo algoritmo de geração de imagens do Stable Diffusion, mas para gerar imagens de espectrogramas, que em seguida são convertidas para músicas.
Veja nos dois exemplos abaixo, um prompt tradicional gerando a foto de um cavalo, e outro prompt gerando um espectrograma:
"photograph of an astronaut riding a horse" | "funk bassline with a jazzy saxophone solo" |
---|---|
Onde o espectrograma acima irá gerar esta música:
https://www.riffusion.com/about/funky_sax.mp3
Você pode escutar mais músicas e ter uma explicação mais detalhada no link da Fonte
.