Microsoft ha svelato oggi un importante aggiornamento di Copilot, il suo assistente AI personale, aggiungendo capacità vocali e visive per trasformarlo in un compagno digitale. Queste nuove funzionalità portano Copilot al passo con altri chatbot AI come Google Gemini e ChatGPT di OpenAI, che alimenta lo stesso Copilot.
Tra le novità principali troviamo Copilot Voice, che permette conversazioni fluide l’AI simili alla modalità vocale AVM di OpenAI; Copilot Vision, che consente all’assistente di “vedere” ciò che stai guardando sul web in tempo reale; e Think Deeper, una modalità per gestire domande complesse con risposte dettagliate passo dopo passo.
Copilot Voice: conversazioni naturali con l’AI
La novità più rilevante è sicuramente Copilot Voice, che consente di avere conversazioni vocali naturali con l’assistente IA. Questa funzionalità permette di interrompere Copilot mentre sta parlando, proprio come in una normale conversazione tra persone. Copilot Voice è simile alle recenti funzionalità Gemini Live e ChatGPT Advanced Voice Mode (AVM). Copilot Voice è potenziato da OpenAI. Quello che colpisce guardando il demo (sotto) è la naturalezza del parlato del modello AI; molto simile a quella di un umano e molto distante dagli assistenti robotizzati con i quali abbiamo interagito per anni (Siri, assistente Google, Alexa e altri).
Sono disponibili quattro diverse voci tra cui scegliere, per personalizzare l’esperienza. Nelle prime demo, la voce di Copilot includeva anche intercalari ed esitazioni tipiche del parlato umano. Questa caratteristica rende l’interazione molto più naturale rispetto ai tradizionali assistenti vocali.
La possibilità di avere un dialogo fluido, emozionale e bidirezionale con l’IA rappresenta un importante passo avanti verso assistenti virtuali sempre più simili a interlocutori umani.
Copilot Voice sarà inizialmente disponibile solo in lingua inglese in alcuni paesi selezionati; tra cui Stati Uniti, Regno Unito, Australia, Canada e Nuova Zelanda, con piani di espansione futura ad altre lingue e regioni.
Il servizio è gratuito a differenza della chat vocale AVM di OpenAI. C’è però un limite di tempo per l’utilizzo di Copilot Voice. Gli abbonati a Copilot Pro ottengono più minuti, ma il numero esatto di utilizzo può “variare” in base alle domande poste.
Copilot Vision: l’AI che “vede” ciò che fai sul web e interagisce con te
Copilot Vision è una funzionalità innovativa ma sperimentale, che consente all’assistente AI di Microsoft di “vedere ciò che vedi” ma solo mentre navighi sul web usando un browser. A differenza di altri chatbot popolari che possono gestire testo e immagini, il vantaggio di Copilot Vision è la capacità di interagire mentre osserva le tue attività di navigazione in tempo reale. Anche in questo demo quello che sorprende è l’estrema velocità di reazione del modello IA e la naturalezza del parlato.
Può processare testo e immagini sullo schermo, pronto a rispondere a domande, suggerire mosse successive e aiutare senza interrompere il flusso di lavoro. Ad esempio, mentre sfogli IMDB indeciso su quale film guardare, Copilot Vision può analizzare i poster e consigliare verbalmente le migliori opzioni.
La funzionalità è per ora sperimentale e limitata a un elenco pre-approvato di siti web “popolari”; non funzionerà su contenuti a pagamento o “sensibili”. Copilot Vision sarà presto disponibile in Copilot Labs e sarà disponibile per un numero limitato di abbonati Copilot Pro negli Stati Uniti.
Microsoft assicura che la privacy e la sicurezza sono prioritarie; le sessioni di Copilot Vision sono opt-in e i dati vengono cancellati al termine, senza training o tracking.
Think Deeper: risposte dettagliate a domande complesse
Think Deeper è un’altra funzionalità sperimentale di Copilot. E’ in gardo di rispondere a domande complesse fornendo risposte dettagliate passo dopo passo. Utilizza i più recenti “modelli di ragionamento” di OpenAI; probabilmente una versione personalizzata del modello o1-preview annunciato di recente. Il modello o1-preview valuta attentamente tutte le opzioni prima di dare una risposta.
Microsoft afferma che Think Deeper è progettato per essere utile in una varietà di compiti quotidiani; come la risoluzione di problemi matematici difficili, la valutazione di costi di gestione di progetti domestici e infiniti altri compiti. Tuttavia, dato che si basa probabilmente su o1, avrà sicuramente delle limitazioni in alcune aree.
Think Deeper per ora è stato inserito in Copilot Labs; la piattaforma per testare funzionalità sperimentali ancora in fase di sviluppo e disponibile solo per gli abbonati a Copilot Pro. Inoltre al momento è accessibile a un numero limitato di utenti Copilot Pro ; in Australia, Canada, Nuova Zelanda, Regno Unito e Stati Uniti. Microsoft sta procedendo con cautela, raccogliendo feedback per perfezionare l’esperienza prima di un lancio più ampio.
Altre novità: Copilot Daily, accesso rapido e una personalità da “hype man”
Oltre a Voice, Vision e Think Deeper, Microsoft introduce Copilot Daily; un servizio che offre un riassunto quotidiano di notizie e meteo. E’ letto dalla voce Copilot preferita attingendo da fonti autorizzate come Reuters e Financial Times.
Copilot è stato integrato direttamente nel browser Microsoft Edge; consente di rispondere rapidamente a domande, riepilogare il contenuto della pagina, tradurre testo o riscrivere una frase. Ora è ancora più semplice accedere a Copilot direttamente dal browser Microsoft Edge semplicemente digitando @copilot nella barra degli indirizzi.
Un’altra novità interessante è il lavoro sulla personalità di Copilot: Mustafa Suleyman, CEO di Microsoft AI, afferma che l’assistente è stato modificato per offrire più supporto emotivo agli utenti, definendolo “il tuo hype man, che ti sostiene e ti incoraggia“. L’obiettivo è creare “un’interazione dinamica, emergente ed in evoluzione” per “aiutarti a mostrarti nel modo in cui vuoi nella tua vita quotidiana“.
Copilot : conclusioni
Con l’aggiunta di funzionalità vocali e visive avanzate, una personalità più coinvolgente ed emozionale e capacità di ragionamento approfondito, Copilot diventa un alleato digitale per la produttività e la vita quotidiana. Purtroppo tutte queste novità non arriveranno in Europa nel breve termine.
Sarà interessante vedere come queste innovazioni verranno accolte e come influenzeranno l’evoluzione di altri chatbot AI popolari come Google Gemini. Microsoft sembra puntare non solo sulla funzionalità ma anche sull’aspetto emotivo e relazionale dell’interazione con l’AI, cercando di stabilire un legame più profondo e personale tra Copilot e chi lo utilizza.