MusicGen: como funciona o compositor de música por IA da Meta
A Meta, empresa dona do Facebook e do WhatsApp, acabou de liberar gratuitamente para o público o MusicGen, uma ferramenta que cria músicas usando a inteligência artificial.
Por meio de prompts, como “pop dançante com batidas tropicais” ou “música eletrônica dos anos 80 com graves marcantes”, o sistema gera automaticamente uma faixa de alguns segundos. Também é possível fazer o upload de uma canção ou até de um assobio para usar como base da melodia.We present MusicGen: A simple and controllable music generation model. MusicGen can be prompted by both text and melody.
— Felix Kreuk (@FelixKreuk)
We release code (MIT) and models (CC-BY NC) for open research, reproducibility, and for the music community:
A demo do MusicGen
A versão demo do MusicGen pode ser acessada pelo repositório e conta com apenas dois espaços: um para descrever a música que você quer gerar e outro para subir uma melodia base (este último é opcional).
Assim, o sistema cria uma faixa em questão de segundos, dependendo de quantas pessoas estiverem acessando ao mesmo tempo.Como outros projetos da Meta AI, o MusicGen se propõe a ser código-aberto, para que outros desenvolvedores possam trabalhar e fazer melhorias na ferramenta. A empresa disponibilizou no todos os passos para instalar o sistema em um servidor próprio.
O MusicGen chega para ser um forte concorrente ao MusicLM, do Google, cujos testes se iniciaram em maio. Inclusive, a comparando o MusicGen com o MusicLM e outros modelos de música feitas por AI. É curioso ver como o mesmo prompt pode gerar músicas distintas, mas mantendo a mesma temática.
Artistas em risco?
Como toda novidade envolvendo arte e inteligência artificial, a música criada por AI também levanta debates sobre direitos autorais. De acordo com a Meta, o treinamento do MusicGen utilizou mais de 20 mil horas de canções licenciadas de uma base de dados com 10 mil faixas de alta resolução. Além disso, também usou mais de 390 mil faixas instrumentais disponíveis no Shutterstock e no Pond5. A empresa afirma que possui acordos com os detentores dos direitos para treinar sua AI.
Mesmo assim, isso não significa que os artistas concordam que suas obras possam ser usadas para criar conteúdos derivados de computador. Pelo contrário, ferramentas como Stability AI, Midjourney e DeviantArt estão sendo processados por usarem ilustrações sem consentimento para gerar imagens em AI. Até o serviço de fotografias Getty Images entrou com uma ação na Justiça britânica por uso indevido de imagens. De qualquer forma, os músicos não têm que se preocupar em perder o emprego para a inteligência artificial— ao menos por enquanto. Até o momento, as músicas geradas por computação ainda contam com limitações importantes. Uma das maiores questões é a qualidade de som, já que as ferramentas ainda não conseguem gerar faixas de alta fidelidade, que contemplem todo o espectro audível de 44,1 KHz. Parte disso deriva da dificuldade em separar o som de cada instrumento para depois reproduzi-los de maneira fidedigna. Quanto mais complexa é a música, como uma orquestra, mais difícil é criar uma faixa sem ruídos aparentes. Fora a questão da criatividade, algo que as máquinas não são capazes de aprender. Como já disse o cantor Nick Cave, “canções surgem do sofrimento, baseados na complexa e humana necessidade de criação. E algoritmos não sentem, dados não sofrem”.