Ferramenta de IA da Nvidia pode criar sons “nunca antes ouvidos”
O Fugatto é capaz de gerar música, efeitos sonoros e fala a partir de entradas de texto e áudio que não foram previamente treinadas no modelo. Em uma demonstração, ele compôs música com base em comandos inusitados, como “Crie um saxofone uivando, latindo e, em seguida, música eletrônica com cães latindo”.
Além de criar sons únicos, a ferramenta permite transformar vozes, alterando sotaques ou ajustando o tom para transmitir emoções, como calma ou irritação. A ferramenta também oferece recursos avançados de edição musical, como isolar vocais, adicionar instrumentos ou substituir uma melodia, transformando, por exemplo, um piano em um cantor de ópera.
Para desenvolver o Fugatto, os pesquisadores da Nvidia reuniram milhões de amostras de áudio e criaram instruções que ampliaram significativamente as capacidades do modelo. Isso possibilitou maior precisão e a realização de novas tarefas sem a necessidade de dados adicionais. No entanto, a Nvidia não divulgou quando ou se o recurso será disponibilizado ao público.