Stability Audio 3.0: IA cria músicas de até 6 minutos e meio
A Stability AI, aquela galera por trás do Stable Diffusion que você já deve conhecer, acabou de soltar uma novidade que promete agitar o mundo da criação de áudio. Eles lançaram uma nova família de modelos de inteligência artificial chamada Stability Audio 3.0. E, olha, a promessa é grande: músicas com qualidade profissional que podem durar mais de seis minutos!
A empresa apresentou quatro modelos diferentes sob essa nova marca. Temos os pequenos, chamados small SFX e small, ambos com 459 milhões de parâmetros. Esses são ideais para rodar direto no seu aparelho e gerar sons ou músicas de até dois minutos. Perfeito para quem precisa de algo rápido e na mão.
Mas a cereja do bolo fica com os modelos medium (1.4 bilhão de parâmetros) e large (2.7 bilhões de parâmetros). Esses dois conseguem criar composições completas que chegam a incríveis 6 minutos e 20 segundos! E o mais legal é que eles mantêm a estrutura musical e a melodia, sem virar uma bagunça sonora. Isso é mais que o dobro do que o Stability Audio 2.0, lançado em 2024, conseguia fazer. É um salto e tanto!
Para quem gosta de colocar a mão na massa, uma ótima notícia: os modelos small SFX, small e medium estão disponíveis com pesos abertos. Isso significa que qualquer um pode usar e até modificar. Em 2024, a Stability AI já tinha liberado o Stable Audio Open, que gerava até 47 segundos de música. Essa nova leva de modelos é um avanço gigante em relação às versões abertas anteriores.
Já o modelo large é um pouco mais exclusivo. Ele só pode ser acessado via API ou através de serviços pagos de auto-hospedagem. E se sua empresa fatura mais de 1 milhão de dólares, prepare-se: você vai precisar de uma licença corporativa. Faz sentido, né? Afinal, é um recurso poderoso.
O mercado de geração de música por IA está fervendo. Empresas como Google e ElevenLabs também estão nessa corrida, lançando seus próprios modelos e ferramentas. Mas, como temos visto com as batalhas judiciais de Suno e Udio, a questão do licenciamento de dados e as parcerias com gravadoras são cruciais para a sobrevivência a longo prazo desses serviços.
A Stability AI, esperta que só ela, já se adiantou. No ano passado, fechou acordos com gigantes como Warner Music Group e Universal Music Group. A ideia é desenvolver modelos e ferramentas de criação musical em conjunto. E a empresa garante que esse novo conjunto de modelos de áudio foi treinado com dados totalmente licenciados. Isso traz uma tranquilidade enorme para quem for usar.
A startup de IA também está desenvolvendo uma nova suíte de produtos pensada para músicos profissionais. Ainda não deram muitos detalhes, mas a expectativa é alta. Para liderar essa frente, trouxeram Ethan Kaplan, que já foi diretor digital da Universal Audio e da Fender. É gente grande chegando para fazer a diferença!
Não é só a Stability AI que está de olho nos talentos da indústria musical. Várias empresas de IA estão contratando executivos da música para dar mais credibilidade aos seus projetos. Suno, por exemplo, trouxe o ex-CEO da Merlin, Jeremy Sirota, como diretor comercial. E a ElevenLabs recrutou Derek Cournoyer, da Kobalt, para liderar a estratégia musical. Sinal de que a música e a IA estão cada vez mais conectadas, e com gente que entende do riscado.


