Stability AI, società leader nel campo dell’Intelligenza Artificiale generativa, ha introdotto di recente un nuovo modello denominato “Stable Audio” in grado di generare in modo autonomo frammenti musicali e audio. Questa innovativa tecnologia, sviluppata grazie all’addestramento su un ampio database musicale, promette di rivoluzionare il mondo della creatività e produzione sonora.
Vediamo più nel dettaglio le peculiarità di Stable Audio e perché rappresenta una vera e propria svolta nell’ambito della music generation assistita dall’Intelligenza Artificiale. Innanzitutto, a differenza di altri sistemi basati su reti neurali che generano output audio casuali, Stable Audio consente all’utente un alto grado di controllo sull’output finale grazie all’inserimento di parametri testuali.
Digitando prompt come “post-rock, chitarre, batteria, basso, archi, euforico, sollevante, malinconico, scorrevole, grezzo, epico, sentimentale, 125 BPM” è possibile indirizzare il modello verso determinate caratteristiche musicali e stilistiche. I risultati, di durata fino a 90 secondi per gli utenti premium a $12/mese, illimitata per utenti enterprise, e 45 secondi per gli utenti gratuiti, sono sorprendenti per la ricchezza di dettagli e varietà degli arrangiamenti generati.
Stable Audio alla prova
Ho provato Stable Audio ed al primo tentativo ho cercato di generare musica elettronica usando questo prompt :
Danceable synth song, layered pads, driving electronic beats, chorus synthesised 120 BPM
questo è il risultato
Ho chiesto poi un genere completamente diverso (modern Country) con questo prompt :
Modern country, electric guitar, drums, bass, catchy chorus about Saturday night 110 BPM
e questo è il risultato
Non male !
Ma cosa rende Stable Audio così rivoluzionario rispetto ai competitor ? Innanzitutto l’approccio basato sul “latent diffusion”, ovvero sulla diffusione latente, una tecnica di generazione mediante spazio latente introdotta per la prima volta da Stability AI nel famoso modello Stable Diffusion per immagini.
Ciò consente di controllare in modo estremamente preciso non solo le caratteristiche qualitative dell’output ma anche aspetti quantitativi come la durata esatta e il punto di partenza temporale. In secondo luogo, il database di riferimento è enorme, composto dall’intera libreria Audio Sparx, il che alimenta la creatività del modello.
Audio Sparx è una collezione di oltre 60.000 registrazioni audio creative commons, campioni e loops coperti da licenze aperte utilizzabili liberamente dagli sviluppatori.
I contenuti di Audio Sparx includono:
- Brani musicali completi di vari stili e generi
- Registrazioni di singoli strumenti musicali
- Voci umane ed effetti vocali
- Suoni ambientali e naturali
- Effetti sonori ed electronic loops
- Campioni percussivi
- Motivi melodici e di accompagnamento
La libreria è costantemente aggiornata per offrire una varietà sempre maggiore di spunti sonori e assicurare un addestramento più ricco e completo ai modelli AI.
Stable Audio è inoltre completamente aperto e accessibile, basta infatti compilare un semplice form online per generare le proprie clip musicali.
La facilità d’uso unita alla sorprendente qualità dell’output rende Stable Audio incredibilmente popolare tra chi produce musica in qualsiasi forma, dai musicisti più affermati agli appassionati alle prime armi. È sufficiente inserire poche parole chiave per ottenere idee e spunti musicali da cui partire per sviluppare nuove composizioni.
Anche il mondo della pubblicità e dell’advertising potrebbe sfruttare le potenzialità di Stable Audio ad esempio per creare sigle, jingle o inserti musicali da inserire nei media. Senza dimenticare il settore videoludico, dove brani generati possono costituire utili basi per le colonne sonore dei futuri titoli.
Sarà interessante osservare l’evoluzione del modello nel tempo e se Stability AI saprà migliorarsi grazie a ulteriori fasi di addestramento IA. Certamente Stable Audio rappresenta oggi una soluzione innovativa per tutti coloro che vogliono dare vita alle proprie idee musicali in modo semplice e dinamico.