Stability AI, conosciuto soprattutto per la sua tecnologia di intelligenza artificiale generativa di testo e immagine con Stable Diffusion, ha rilasciato oggi una nuova LLM, Stable Code 3b. Si tratta di un nuovo modello all’avanguardia progettato per assistere i programmatori al completamento del loro codice. In più, offre molteplici funzionalità aggiuntive.
La particolarità di questa LLM è di essere molto piccola. Nonostante ciò, offre prestazioni di alto livello in tutti i più importanti linguaggi di programmazione.
Come suggerisce il nome, Stable Code 3B è un modello da circa 3 miliardi (dove B sta per billion) di parametri. E’ focalizzato sulle capacità di completamento del codice per lo sviluppo di software. Offre prestazioni di alto livello in tutti i più importanti linguaggi di programmazione (18 per l’esattezza).
Stable Code 3B dimensioni compatte
Le dimensioni compatte del modello ne consentono l’esecuzione privata e locale in tempo reale sui laptop. I laptop possono avere o meno capacità IA, con o senza GPU dedicata. La RAM consigliata è di almeno 16 GB. Naturalmente un laptop con capacità IA per esempio con un Core Ultra Meteor Lake o con un AMD Ryzen 8040 Mobile Hawk Point permetterà di rispondere alle richieste in un modo più immediato. Anche l’integrazione con una GPU discreta potrebbe aumentare la velocità di esecuzione dei prompt di richiesta.
Stable Code 3B offre funzionalità e prestazioni significativamente migliori in più linguaggi di programmazione. Il nuovo modello non solo suggerisce e completa con nuove righe di codice quello già esistente, ma può anche riempire sezioni mancanti nel codice esistente. La possibilità di riempire le sezioni mancanti del codice è una funzionalità avanzata di completamento del codice nota come Fill in the Middle (FIM).
Addestramento e prompt fino a 100.000 token
L’addestramento per il modello è stato inoltre ottimizzato con una dimensione del contesto ampliata utilizzando una tecnica nota come Rotary Position Embeddings (RoPE) che consente una lunghezza del prompt fino a 100.000 token.
Stable Code 3B è stato addestrato sul cluster Stability AI utilizzando 256 NVIDIA A100 40GB GPUs. I suoi dati di addestramento includevano repository di codici, forum di programmatori e altre fonti tecniche.
Questo modello può essere utilizzato sui principali 18 linguaggi di programmazione, C, CPP, Java, JavaScript, CSS, Go, HTML, Ruby, Rust, Markdown, Shell, Php, Sql, R, Typescript, Python, Jupyter-Clean e RestructuredText selezionati in base al sondaggio StackOverflow Developer Survey del 2023. Fornisce prestazioni all’avanguardia rispetto a modelli di dimensioni simili.
Come utilizzare Stable Code 3B
Stable Code 3B viene reso disponibile per uso commerciale come parte del nuovo servizio di abbonamento di servizi Stability annunciato lo scorso dicembre. I membri, oltre all’accesso a Stable Code 3B ottengono anche accesso ad altri strumenti IA di Stability AI, tra cui gli strumenti per la generazione di immagini a Stable Diffusion SDXL, il modello StableLM Zephyr 3B per la generazione di contenuto testuale, Stable Video per la generazione di video e Stable Audio per la generazione di audio. Il tutto ha un costo di $ 20 al mese .
Se non hai bisogno di una licenza commerciale e vuoi semplicemente sperimentare con i servizi Stability puoi iscriverti al piano gratuito per Uso Personale e non commerciale; oppure scaricare la Stable Code 3B da Huggingface e eseguirla localmente sul tuo pc, minipc o laptop per esempio servendoti di LMstudio, ollama, GPT4ALL, chatllm, Faraday o altre applicazioni per eseguire localmente un modello LLM.
Dal momento che queste LLM come Stable Code 3B sono ottimizzate per il coding e sono di dimensioni molto compatte, ricorda che le capacità di linguaggio sono limitate quindi meglio comunicare le richieste in lingua inglese.