Nonostante qualche giorno fa sembrava che il rilascio di Gemini fosse rimandato al 2024 per problemi tecnici, due ore fa invece Google a sorpresa lo ha annunciato ufficialmente. Gemini è il suo nuovo e più potente modello di Intelligenza Artificiale, LLM (Large Language Model). Frutto di anni di ricerca e sviluppo da parte dei migliori team di Google, incluso Google DeepMind, è stato progettato per essere molto più avanzato e capace rispetto ai precedenti modelli IA di Google.
Presentazione di Gemini
Nel suo messaggio introduttivo, il CEO di Google, Sundar Pichai ha sottolineato come l’IA stia diventando una tecnologia sempre più trasformativa, in grado di migliorare la vita delle persone in tanti modi diversi. Gemini rappresenta un passo importante in questa direzione, grazie alle sue capacità senza precedenti.
Demis Hassabis, CEO di Google DeepMind, ha spiegato che è stato addestrato in modo nativo su diversi tipi di contenuti, inclusi testo, codice, audio, immagini e video. Questo gli conferisce un livello superiore di comprensione e ragionamento rispetto ai precedenti modelli di IA, in grado solo di integrare modalità separate.
Il nuovo LLM di Google (Large Language Model) ha raggiunto prestazioni di livello mondiale nei principali benchmark di riferimento, superando persino gli umani in alcuni test. In particolare, ha ottenuto il 90% di accuratezza nel test MMLU di comprensione del linguaggio multitask ed è il primo modello a superare gli esperti umani in questa valutazione.
Da come si evince dalla tabella benchmark sotto riportata, Gemini Ultra supera in prestazioni anche GPT-4 in 7 test su 8.
Inoltre, è esperto nei linguaggi di programmazione più diffusi tra cui Python, Java, C++ e Go. Google ha sfruttato una versione specializzata di Gemini per creare AlphaCode 2, un successore di l’intelligenza artificiale generativa vincitrice del concorso dello scorso anno.
Disponibile in tre modelli
Google ha ottimizzato Gemini in tre diversi modelli:
- Ultra, il più grande e potente per i compiti più complessi;
- Pro, per scalabilità e ampia gamma di task;
- Nano, per applicazioni mobile e compiti on-device.
Verrà implementato in molti prodotti Google come Bard, Ricerca, Maps, Assistant. Sarà disponibile anche per sviluppatori e aziende tramite API.
Modello Pro integrato in Bard
A partire da oggi, Bard utilizza una versione specificatamente ottimizzata di Gemini Pro in inglese per ragionamenti, pianificazione, comprensione e altro ancora più avanzati. E all’inizio del prossimo anno verrà introdotto Bard Advanced, che darà il primo accesso ai modelli e funzionalità più avanzati, incluso Ultra.
Se vuoi provare già da subito Bard potenziato da Gemini AI modello Pro dovrai usare una VPN americana. Attenzione, in questo momento Bard usa la versione Pro e non la Ultra (disponibile forse ad inizio 2024). Google riporta che “la versione Pro surclassa GPT-3.5” (da cui si intuisce che non è a livello di GPT-4).
Gemini Ultra e i test di sicurezza
Gemini Ultra non sarà disponibile almeno fino al 2024, poiché Google ha riportato che richiede ulteriori test di sicurezza prima di essere autorizzato al rilascio a “clienti, sviluppatori, partner ed esperti di sicurezza e responsabilità selezionati“. Come dalla tabella benchmark vista sopra, Ultra promette di essere notevolmente potente.
Google ha confermato di porre la massima attenzione alla sicurezza e alla responsabilità nello sviluppo di modelli IA sempre più potenti come Gemini. L’azienda collaborerà con esperti esterni e organizzazioni per identificare eventuali rischi e garantire che l’IA sia di beneficio per tutti.