Nel mondo della tecnologia, l’attenzione è focalizzata sull’assistente virtuale basato sull’intelligenza artificiale (IA). Le grandi aziende tech, tra cui Amazon, Microsoft e OpenAI, Google, Apple, Meta sono in corsa per migliorare i loro assistenti vocali o crearne dei nuovi, integrando la tecnologia dei grandi modelli di linguaggio al fine di offrire un’esperienza utente più intelligente e per certi versi più “umana“.
Il nuovo assistente virtuale Alexa di Amazon
La nuova generazione di Alexa di Amazon rappresenterà un importante aggiornamento, caratterizzato da un ritardo ridotto di risposta, una migliore comprensione del contesto e una migliore qualità conversazionale.
Gli utenti potranno esprimere richieste in modo più astratto, ad esempio chiedendo ad Alexa di organizzare una festa a tema e inviare gli inviti via email, con la capacità di gestire tutte queste attività.
Gli utenti potranno anche pronunciare più comandi contemporaneamente. Per esempio in una casa con servizi di domotica sarà possibile chiedere in modo naturale “Alexa accendi gli irrigatori, apri la porta del garage e spegni le luci esterne” e Alexa riconoscerà ed eseguirà queste attività.
Inoltre, si potrà dire “Alexa, chiacchieriamo dei film di Quentin Tarantino” e parlare senza dover richiamare il nome di Alexa per il resto della conversazione. Inoltre Alexa ricorderà alcune informazioni e preferenze dell’utente, quindi non sarà necessario presentarsi ogni volta. La nuova assistente virtuale Alexa sembrerà quindi “più umana” e meno robotica.
Assistente virtuale Copilot di Microsoft
Microsoft in questi giorni, a partire dallo scorso 26 Settembre, sta diffondendo l’ultima versione di Windows 11 che conterrà il nuovo assistente virtuale Copilot, in sostituzione dell’abbandonato Cortana.
Copilot di Microsoft sarà parte integrante di Windows 11 e fungerà da compagno digitale per gli utenti. Gli utenti potranno interagire con l’ assistente virtuale Copilot attraverso comandi testuali o vocali per controllare le impostazioni del computer, avviare le applicazioni o ottenere risposte a svariate domande.
Copilot sarà alimentato dal più recente modello di grande linguaggio di OpenAI, GPT-4, che gli conferirà un livello superiore di intelligenza e comprensione. Copilot potrà anche gestire l’elaborazione delle immagini, tra cui l’organizzazione del desktop, la spiegazione dei contenuti delle pagine web o la modifica di documenti e grafici.
Ad esempio, puoi chiedere in parole naturali a Copilot di aiutarti a organizzare il tuo desktop e lui disporrà le finestre in riquadri; quando navighi sul Web, puoi chiamare Copilot e lasciare che ti aiuti a riassumere, spiegare e riscrivere il contenuto del pagina web magari di un articolo scritto in cinese, oppure potrai chiedergli di scrivere testi e riassumere grafici.
Copilot ha anche la capacità di elaborare le immagini : per esempio dopo aver acquisito uno screenshot, puoi chiedere direttamente a Copilot di rimuovere lo sfondo, ritagliare oggetti o persone, salvare il file, ecc.
App ChatGPT di OpenAI
OpenAI qualche giorno fa ha sorprendentemente annunciato l’introduzione di nuove funzionalità multimodali per ChatGPT . La app di ChatGPT ora può vedere, ascoltare e parlare.
Questo aggiornamento verrà implementato per gli utenti a pagamento nelle prossime due settimane e forse più avanti anche per gli utenti free. La nuova versione multimodale di ChatGPT sarà in grado di condurre conversazioni basate su immagini e di sostenere conversazioni vocali in tempo reale.
Ad esempio, potresti scattare una foto del tuo frigorifero e chiedere a ChatGPT cosa cucinare per cena. Ora disponibile come applicazione su Android e iOS, questa nuova versione di ChatGPT offre una gamma più ampia di funzionalità di assistenza personale rispetto alla versione precedente.
Assistente virtuale Google Bard, Siri , Meta
Oltre a queste aziende che hanno annunciato ufficialmente aggiornamenti dei loro assistenti, Google è stata oggetto di voci secondo cui avrebbe intenzione di rinnovare a breve Google Assistant sfruttando le più recenti tecnologie di grandi modelli di linguaggio.
Nel frattempo, pochi giorni fa, Google ha annunciato le Bard Extensions nel suo assistente virtuale Bard. Un notevole passo avanti verso l’assistenza personale. Ad esempio, se stai pianificando un viaggio ora puoi chiedere a Bard di ottenere tramite gmail le date che vadano bene a tutta la tua famiglia, cercare informazioni in tempo reale sui voli e sugli hotel, vedere le indicazioni di Google Maps per l’aeroporto e guardare video di YouTube su cosa fare lì, il tutto in una sola conversazione con Bard.
Anche Apple sembra stia lavorando su dei modelli di linguaggio IA e sta apportando miglioramenti alle sue funzionalità, tra cui Mappe e Siri. Stessa cosa si può dire per Meta che sembra stia lavorando ad una chat simile a chatGPT.
Le principali aziende tech stanno cercando di migliorare il proprio assistente virtuale personale per ottenere un vantaggio competitivo. Questa competizione tra i nuovi assistenti rappresenta una nuova era nel campo degli assistenti virtuali, con la tecnologia dei grandi modelli di linguaggio come fattore chiave per determinare il vincitore.
Sarà tutto gratis ?
Sia che si tratti del nuovo assistente virtuale Alexa, di Copilot, di ChatGPT multimodale o Bard, invitare un assistente a rispondere a richieste comporterà una notevole quantità di potenza di calcolo e quindi costi da sostenere.
Al momento non si hanno notizie di addebiti per Copilot integrato nel sistema operativo Windows 11. Dovrebbe essere gratuito e aperto agli utenti ma non per gli utenti business. Per esempio, nella suite per ufficio Microsoft 365, Copilot sarà una funzionalità di abbonamento premium al prezzo di $30 al mese. Anche Google chiederà un pagamento per l’assistenza all’interno di Google Workspace. Al momento la ChatGPT multimodale di OpenAI sarà disponibile solo per gli abbonati premium, nota come ChatGPT Plus, per $20 al mese. Anche la nuova Alexa o alcune funzioni speciali di Alexa che saranno introdotte in futuro, potrebbero essere a pagamento.
Sfide e prospettive future
Tuttavia, questa competizione sarà intensa e determinerà il futuro degli assistenti personali, con impatti significativi sul modo in cui interagiamo con la tecnologia e sfruttiamo l’intelligenza artificiale per semplificare la nostra vita quotidiana.
Negli anni passati, l’entusiasmo iniziale per gli assistenti vocali come Siri prima e Alexa poi, ha negli ultimi anni lasciato il posto ad una pesante delusione per la loro evidente carenza di capacità conversazionale.
La comparsa di ChatGPT alla fine del 2022 ha introdotto conversazioni fluide e ha surclassato le aspettative dei precedenti assistenti personali. Il divario di prestazioni tra chatGPT e tutti i precedenti assistenti era a dir poco imbarazzante.
Come conseguenza, Alexa ha segnalato problemi finanziari e tagli di personale mentre Microsoft ha immediatamente creduto ed investito in OpenAI e ha abbandonato Cortana la scorsa estate.
Nonostante il grande potenziale dei nuovi assistenti, ci sono anche sfide da affrontare. Con lo sviluppo degli assistenti personali, cresce anche l’attenzione sulla privacy e la sicurezza dei dati degli utenti. Trovare un equilibrio tra offrire un servizio personalizzato e proteggere i dati degli utenti sarà una sfida importante.
LLM open source
Con il proliferare di modelli di intelligenza artificiale (LLM) open source di qualità con licenze di utilizzo permissive come Mistral 7B, il prossimo futuro ci potrebbe riservare anche svariati dispositivi di assistenza vocale, disposivi IoT, assistenza per anziani e altre tipologie limitate solo dalla immaginazione dei creatori e sviluppatori. Poter realizzare dispositivi potenziati da IA senza dover pagare extra per servizi di API remota sarà un opzione allettante per gli sviluppatori.
Ricordate il film “Her” ? Non siamo molto lontani.
Il film “Her” e gli assistenti virtuali assistiti dall’intelligenza artificiale (IA) di oggi aprono una finestra su un futuro in cui la tecnologia e l’umanità si intrecciano in modi profondi ed emotivi. Entrambi sollevano questioni importanti legate alla nostra relazione con la tecnologia e allo sviluppo dell’IA.
“Her” ci presentava un mondo in cui un assistente virtuale, Samantha, era in grado di comprendere emozioni umane, apprendere e instaurare relazioni complesse con gli esseri umani. Questo ci fa riflettere sulla possibilità che le IA del futuro possano diventare più simili a compagni umani, offrendo non solo assistenza pratica, ma anche un livello di comprensione e connessione emotiva.
Entrambi i mondi, quello del film e quello della realtà attuale, sollevano preoccupazioni etiche e di privacy. Nel film, l’IA Samantha aveva accesso a informazioni strettamente personali dell’utente, sollevando questioni sulla gestione della privacy e della sicurezza dei dati.
Nella realtà attuale, anche gli assistenti virtuali raccolgono e raccoglieranno sempre più dati personali.
Inoltre, sia nel film che nella realtà, emerge la questione della solitudine e della connessione umana. Il protagonista di “Her,” Theodore, sviluppa una relazione con un’IA a causa della sua solitudine emotiva. Questo ci fa riflettere sul ruolo che gli assistenti virtuali potrebbero avere nel mitigare o accentuare la solitudine umana.
Sarà fondamentale affrontare sfide etiche, regolamentari e sociali mentre continuiamo a sviluppare e adottare queste tecnologie in evoluzione. Se lo desideri, lascia il tuo punto di vista nei commenti.