Gemini Live permette di avere una conversazione vocale naturale con il modello AI Gemini; quasi come se stessimo dialogando con una persona. Durante una conversazione, Gemini Live può essere interrotto mentre ci risponde; può anche eseguire conversazioni con più persone.
E’ il diretto concorrente della chat vocale Advanced Voice Mode(AVM) di OpenAI e della chat vocale di Microsoft che usa il modello di AVM OpenAI.
Google questa volta cerca di battere OpenAI e Microsoft sul tempo; ha annunciato oggi che nelle prossime settimane amplierà le lingue supportate migliorando le capacità linguistiche e funzionali di Gemini Live. Gemini Live sarà anche gratuito, e potrà essere selezionato come assistente vocale Android. Già a partire da oggi, Gemini Live supporta su Android francese, tedesco, portoghese, hindi e spagnolo .
Al contrario, la Advanced Voice Mode di OpenAI e la chat vocale del nuovo Copilot sono per ora solo in inglese; limitate a pochi messaggi al giorno, e non disponibili in Europa. La Advanced Voice Mode di OpenAI è anche ristretta solo agli abbonati di ChatGPT.
Nelle prossime settimane, Gemini Live sarà in grado di conversare in oltre 40 lingue diverse (lingua italiana inclusa). Gemini Live permetterà anche di utilizzare fino a due lingue sullo stesso dispositivo. Google ha inoltre introdotto 10 nuove voci tra cui scegliere, consentendo di personalizzare ulteriormente l’esperienza d’uso.
Queste novità non solo dimostrano l’impegno di Google nel rendere Gemini Live un assistente sempre più sofisticato e adattabile alle esigenze individuali; dimostrano anche la sua volontà di creare un Assistente AI. Intanto i possessori di un iPhone per avere una chat conversazionale con queste capacità dovranno aspettare, anche molto a lungo; in particolare per chi ha un iPhone in Europa.
Integrazione con le app Google e nuove funzionalità
Oltre all’espansione linguistica, Google potenzierà l’integrazione di Gemini Live con le sue app più popolari. Nelle prossime settimane, verranno introdotte nuove estensioni per Keep, Tasks, Utilities e funzionalità ampliate per YouTube Music.
Queste integrazioni permetteranno di sfruttare appieno le potenzialità di Gemini per svolgere compiti quotidiani in modo più efficiente. Ad esempio, sarà possibile chiedere a Gemini di cercare una ricetta nelle email di Gmail e aggiungere gli ingredienti alla lista della spesa in Keep.
L’assistente potrà anche creare playlist musicali basate su richieste specifiche, come “canzoni che ricordano la fine degli anni ’90”. L’estensione per il Calendario, in arrivo a breve, consentirà di scattare una foto a un volantino di un concerto e chiedere a Gemini di verificare la disponibilità nella propria agenda.
Una delle funzionalità più interessanti è la possibilità di chiedere informazioni su ciò che è visualizzato sullo schermo. E’ un servizio simile a Copilot Vision presentato pochi giorni fa nel nuovo Copilot.
Ad esempio, mentre si guarda un video di viaggio su YouTube, si potrà chiedere a Gemini di elencare tutti i ristoranti menzionati e aggiungerli direttamente a Google Maps. L’integrazione profonda con Android permetterà a Gemini di interagire con molte delle app già installate sul dispositivo. Un’altra funzionalità particolarmente utile è la possibilità di trascinare e rilasciare le immagini generate da Gemini direttamente in app come Gmail e Google Messages.
Queste novità renderanno l’interazione con l’assistente AI molto naturale e contestuale, sfruttando appieno le potenzialità dell’hardware Android. Le possibilità sono limitate solo dall’immaginazione.
Gemini Live: conclusioni
L’espansione linguistica di Gemini Live e le nuove integrazioni con le app Google dimostrano l’impegno dell’azienda nel rendere l’assistente AI uno strumento sempre più versatile e potente.
Questa evoluzione non solo migliora l’accessibilità della tecnologia AI; offre anche nuove opportunità per migliorare l’efficienza personale attraverso interazioni più naturali e intuitive. Google dopo una partenza molto rallentata nei confronti di OpenAI, a volte con risultati poco convincenti (ricordiamo le prime versioni di Bard), ora stà dimostrando di essere lanciata a recuperare i passi perduti.