Il nuovo ChatGPT Agent presentato ieri da OpenAI durante una Live su Youtube, segna una trasformazione nella capacità di gestire attività articolate e composte da più passaggi; agisce come se fosse un assistente digitale che svolge interi processi per tuo conto attraverso una semplice conversazione.

A differenza delle versioni precedenti di OpenAI Operator e Deep Research, l’agente non si limita alla generazione testuale. ChatGPT è la prima implementazione a combinare browser, codice, API e memoria persistente (sandbox) in un ecosistema conversazionale stabile, supervisionato e accessibile. La novità è l’integrazione di tutti questi strumenti in un’unica interfaccia nativa.
ChatGPT Agent integra browser visuale, browser testuale, terminale di codice e connettori API, comportandosi come un operatore esperto. Può scaricare file, elaborarli, compilare moduli online, accedere a Gmail o Google Calendar e restituire i risultati direttamente nella conversazione.
Il sistema combina la reattività della chat con una componente esecutiva autonoma; accede a una macchina virtuale isolata dove interagisce in sicurezza con strumenti e contenuti esterni. E’ un assistente in grado di portare a termine task come l’organizzazione di un viaggio, la produzione di report da fonti multiple o l’aggiornamento automatizzato di tabelle finanziarie.
L’accesso è controllato; l’agente chiede l’autorizzazione prima di intraprendere azioni significative (come effettuare un acquisto) e puoi interrompere, prendere il controllo del browser o interrompere l’attività in qualsiasi momento. Riceverai una notifica sull’app mobile al completamento di un’attività.
ChatGPT Agent: da Operator e DeepResearch al nuovo agente
ChatGPT Agent nasce dall’unione funzionale di due prototipi distinti già esistenti in OpenAI : Operator e Deep Research. Il primo consente l’interazione attiva con il web: click, scroll, input nei moduli. Il secondo si focalizza sull’analisi e ricerca profonda, combinando fonti per sintetizzare un report articolato.
Entrambi hanno dei limiti evidenti. Operator è limitato a compiti di navigazione e interazione con le pagine web, senza comprendere pienamente il contesto o trarre conclusioni articolate. DeepResearch, al contrario, può analizzare e sintetizzare informazioni trovate sul web, ma non e in grado di interagire con siti che richiedono accesso autenticato o caricamento dinamico. ChatGPT Agent combina entrambe le capacità di Operator e DeepResearch, superando questi vincoli.
Nella nuova architettura, le funzionalità di navigazione intelligente e analisi ragionata coesistono. Quando il prompt lo richiede, ChatGPT decide quale strumento usare, passando tra codice, browser o API senza soluzione di continuità. La differenza è netta anche nella gestione della sessione; l’agente dispone di uno spazio di lavoro virtuale persistente (sandbox), dove mantiene credenziali, file e stato delle attività fino al completamento del task. Questo lo rende adatto anche a compiti ricorrenti, schedulabili a orari predefiniti.
Casi d’uso : dal PowerPoint alla gestione dei clienti
Queste funzionalità agentiche unificate migliorano l’utilità di ChatGPT sia nei contesti quotidiani che professionali. Sul lavoro, puoi automatizzare attività ripetitive; convertire screenshot o dashboard in presentazioni composte da elementi vettoriali modificabili, riprogrammare riunioni, pianificare e prenotare eventi fuori sede. Puoi aggiornare fogli elettronici con nuovi dati finanziari, mantenendo la stessa formattazione. Nella vita privata, puoi utilizzarlo per pianificare e prenotare itinerari di viaggio, progettare e prenotare cene, o trovare specialisti e fissare appuntamenti.
Alcuni esempi:
- Preparare una presentazione completa in PowerPoint, partendo da tre articoli online e salvandola in formato modificabile
- Aggiornare una tabella Excel esistente, mantenendo formule e formattazione, con dati freschi prelevati da API finanziarie
- Prenotare biglietti per un evento, dopo aver confrontato più opzioni online e scelto la più conveniente
- Eseguire una ricerca di mercato: analizzare i siti di tre concorrenti, riassumere punti di forza e debolezza in un file Word
- Puoi pianificare l’esecuzione automatica delle attività completate, ad esempio la generazione di un report settimanale sulle metriche ogni lunedì mattina.
A livello tecnico, questi compiti implicano l’accesso a siti autenticati; l’uso di API, la gestione di documenti, il riconoscimento di strutture semantiche nei testi, l’interazione proattiva con l’utente. Tutto avviene in una conversazione, con notifiche di completamento e controllo manuale in ogni fase.

ChatGPT Agent: costi, accesso e limiti di utilizzo
ChatGPT Agent è in fase di distribuzione graduale. Il rollout dell’agente ChatGPT inizia oggi per gli utenti Pro, Plus e Team, mentre la disponibilità per gli utenti Enterprise ed Education è prevista per fine luglio. Gli utenti Pro hanno a disposizione attività quasi illimitate ogni mese, mentre gli altri piani pagamento ne hanno a disposizione 50 al mese, con possibilità di utilizzo aggiuntivo tramite opzioni flessibili basate su crediti.
ChatGPT Agent è già disponibile (non in Europa per il momento) e sostituirà Operator. Operator rimarrà attivo per un periodo di 30 giorni da oggi, dopodiché sarà dismesso. Deep Research continuerà invece ad essere disponibile nel menu a discesa della chat conversazionale di ChatGPT.
Ogni sessione ha monitoraggio attivo: per compiti delicati come l’invio email o acquisti online, è richiesta conferma esplicita. Sono in atto controlli di sicurezza, come la cancellazione automatica della cronologia e restrizioni sulle azioni automatizzate. Per attivare ChatGPT Agent, occorre selezionare la modalità agent dal menu strumenti nella composizione del messaggio.
ChatGPT Agent: uno scenario che velocizza il lavoro digitale
L’introduzione di ChatGPT Agent suscita un forte interesse per la sua capacità di completare attività complesse in autonomia, come generare presentazioni partendo da fonti online o compilare moduli avanzati. La possibilità di interagire con siti reali, accedendo con credenziali, rappresenta un salto netto rispetto agli strumenti testuali tradizionali.
L’esecuzione in una macchina virtuale separata (sandbox) aggiunge un ulteriore livello di sicurezza operativa, utile per tenere sotto controllo i processi avviati. Nonostante alcuni limiti come momentanea restrizione geografica, la prospettiva generale è quella di uno strumento potente e in evoluzione, per migliorare e velocizzare la produttività.