Da poche ore Google ha annunciato Gemini 1.5 Pro. Facciamo un po’ di chiarezza su cosa sta cambiando in Google IA.
Solo pochi giorni fa, Google annunciava la nuova chat conversazionale Gemini 1.0 (versione gratuita) e Gemini Advanced (versione in abbonamento inclusa nel piano Google One AI Premium) entrambe in sostituzione di Bard, e la ridenominazione dei suoi modelli LLM.
I modelli LLM di Google, utilizzati per esempio per potenziare le stesse chat conversazionali sono stati ridenominati in Nano 1.0 (ex Gemini nano), Pro 1.0 (ex Gemini Pro) e Ultra 1.0 (ex Gemini Ultra). Nano 1.0 è il modello più leggero in dimensioni; può essere utilizzato anche per un uso off line su smartphone e altri dispositivi. Per esempio, il nuovo Samsung S24 usa il Nano 1.0 per potenziare le sue funzionalità IA.
Il Pro 1.0 (ex Gemini Pro) è utilizzato nella chat conversazionale (chatbot) Gemini 1.0 (ex Bard) in versione Web e in versione app su Android e iOS. Come vedi, la versione di Gemini 1.0 segue la versione del suo modello, Pro 1.0.
Infine, il modello Ultra 1.0 rilasciato pochi giorni fa, è utilizzato nella nuova chat conversazionale Gemini Advanced (1.0) in abbonamento nel piano Google One AI Premium. Per il momento il servizio è attivo solo in lingua in inglese e solo negli Stati Uniti.
Ora attenzione, se ancora non sei caduto in confusione con tutte queste nomenclature, da ieri nel suo messaggio di annuncio, Google ha iniziato a chiamare i suoi modelli in questo altro modo: 1.0 Nano (invece di Nano 1.0), 1.0 Pro (invece di Pro 1.0) e 1.0 Ultra (invece di Ultra 1.0). Quindi da ora le chiameremo in questo modo.
Gemini 1.5 Pro
Ieri a sorpresa Google comunica l’aggiornamento del modello 1.0 Pro alla versione 1.5 Pro. Appunto pochi giorni dopo l’uscita del nuovo chatbot Gemini e Gemini Advanced. Secondo Google, 1.5 Pro raggiunge una qualità molto vicina ai risultati di 1.0 Ultra. Questo grazie ad una finestra Token più ampia, ma utilizzando meno risorse di elaborazione.
Se testato su un panel completo di valutazioni di testo, codice, immagini, audio e video, 1.5 Pro supera 1.0 Pro nell’87% dei benchmark utilizzati per lo sviluppo dei modelli linguistici di grandi dimensioni (LLM) interni di Google. E se confrontato con 1.0 Ultra sugli stessi benchmark, funziona a un livello simile.
Il modello 1.5 Pro va a potenziare già da oggi la chat conversazionale gratuita Gemini (ex Bard).
Il chatbot Gemini, che puoi chiamare anche Gemini 1.5 Pro (dal momento che si serve del modello 1.5 Pro), da oggi viene fornito con una finestra di contesto standard da 128.000 token contro i soli 32.000 token di Gemini 1.0.
Inoltre, da oggi un gruppo di sviluppatori e clienti aziendali può provarlo con una finestra da 1 milione token. Se la fase sperimentale andrà a buon fine Google spera di portare la finestra con 1 milione di token a tutti sul chatbot Gemini 1.5 Pro.
Finestra da 1 milione di token
Una finestra da 1 milione di token significa poter inviare richieste molto più lunghe al chatbot.
Avere una finestra da 1 milione di token per un chatbot significa che può ricevere richieste molto più lunghe. Ricordiamo che un token è una singola unità di testo, come una parola, un numero o un simbolo. I token possono essere anche composti da immagini, video, audio o codice. Quanto più grande è la finestra di contesto di un modello, tanto più informazioni può accogliere ed elaborare in un dato prompt. Il suo output sarà più coerente, pertinente e utile.
Ecco alcuni vantaggi che si hanno con finestre di token molto ampie:
- Migliore comprensione del contesto. Il chatbot può ricordare l’intera conversazione fino a quel momento, capendo meglio sfumature e contesto di ogni domanda o richiesta.
- Risposte più precise e pertinenti. Con una memoria più ampia, il chatbot può attingere a una gamma più ampia di informazioni. Quindi genera risposte accurate e pertinenti al tema in corso.
- Dialoghi più fluidi e naturali. Il chatbot può seguire più fili di conversazione e riprendere argomenti precedenti, creando un’interazione più simile a una conversazione umana.
Se confrontiamo la finestra token di Pro 1.5 da 1 milione di token con altri chatbot, notiamo che GPT4 è limitato a 128k token e Claude 2.1 a 200K token.
Prima di attivare 1 milione di token sul chatbot Gemini 1.5 Pro, Google ha affermato che sta lavorando a delle ottimizzazioni per migliorare la latenza e ridurre i tempi di elaborazione. Per il momento se usi Gemini 1.5 hai il token a 128k.
Esempi
Nel video qui sotto, Google mostra un esempio in cui viene inviata in una finestra di contesto un file pdf di 402 pagine, e come le risposte fornite siano coerenti e precise. Per replicare un test simile occorre AI Studio, attualmente non disponibile in Italia. Per il momento se usi Gemini 1.5 puoi allegare solo file immagine.
In questo altro video, quando viene inviato ad AI Studio un film muto di 44 minuti di Buster Keaton (corrrispondente a circa 700K token) il modello 1.5 Pro può analizzare accuratamente vari punti ed eventi della trama e ragionare su diversi dettagli del film.
Gemini 1.5 Pro: altre novità
Google ha annunciato che a partire da oggi gli sviluppatori e i clienti Cloud possono iniziare ad utilizzare il modello Ultra 1.0, con la API Gemini inclusa in AI Studio e in Vertex AI .
Tabella riassuntiva
Ecco una tabella riassuntiva degli attuali modelli LLM (large language models) utilizzati da Google per potenziare dispositivi, chat conversazionali o servizi API.
Modello LLM | Utilizzo | |
1.0 Nano | Potenzia funzionalità IA di smartphone e altri dispositivi. Grazie alle dimensioni ridotte è possibile l’installazione e funzionamento da locale. | |
1.5 Pro | Gemini 1.5 Pro: chat conversazionale (chatbot) gratuita di Google. Altri compiti serviti da remoto come sistemi di traduzione automatica, strumenti di scrittura automatica, motori di ricerca. Modello utilizzabile anche via API Gemini inclusa in AI Studio e in Vertex AI. | |
1.0 Ultra | Gemini Avanced: chat conversazionale (chatbot) in abbonamento su Google One AI Premium. Altri compiti serviti da remoto come sistemi di traduzione automatica, strumenti di scrittura automatica, motori di ricerca. Modello utilizzabile anche via API Gemini inclusa in AI Studio e in Vertex AI. |
Gemini 1.5: conclusione
La serie di annunci di Google riflette la voglia di Google di portare funzionalità avanzate e migliorate di intelligenza artificiale nei suoi prodotti di consumo, anche per guadagnare il tempo perso nei confronti di Microsoft.
Purtroppo in Italia non possiamo ancora sperimentare a fondo tutte le novità introdotte in Gemini 1.5 Pro e Gemini Advanced. Per esempio la creazione immagini all’interno di Gemini ancora non è possibile. Gemini Advanced anche se è un servizio a pagamento, in Italia è limitato alla lingua inglese e usa il modello 1.5 Pro invece di 1.0 Ultra. AI Studio in Italia non può essere ancora utilizzato, così come le app Gemini Android e iOS. Per ora per noi, è un “attendere prego“.