OpenAI ha lanciato ieri Canvas, una nuova interfaccia per ChatGPT; cerca di migliorare il modo in cui si interagisce con l’intelligenza artificiale per scrivere e programmare. La nuova interfaccia permette all’utente e a ChatGPT di collaborare su un progetto in modo innovativo; non solo attraverso la conversazione (prompt), ma creando e affinando le idee fianco a fianco.
Canvas va oltre la semplice chat; offre un ambiente di lavoro collaborativo tra l’uomo e l’IA. Le prime impressioni degli sviluppatori sono generalmente positive; un passo avanti rispetto a soluzioni simili come Claude Artifacts di Anthropic.
In effetti è molto simile alla funzionalità Artifacts di Anthropic lanciata a giugno 2023. Ma c’è una differenza chiave. In Canvas il documento nell’editor laterale è completamente modificabile dall’utente; mentre in Artifacts l’output generato dall’AI non è direttamente editabile. Canvas consente quindi una collaborazione più diretta, senza dover copiare e incollare continuamente tra editor.
Canvas è stato costruito con GPT-4o; a partire da oggi, OpenAI lo sta rilasciando agli abbonati ChatGPT Plus e Team; gli utenti Enterprise e Education otterranno l’accesso la prossima settimana. L’azienda prevede inoltre di rendere Canvas disponibile anche agli utenti gratuiti di ChatGPT quando uscirà dalla beta.
Come funziona Canvas: un’interfaccia per la collaborazione uomo-IA
Canvas si presenta come una finestra separata che si apre accanto all’interfaccia di chat standard di ChatGPT. Questa nuova interfaccia consente di lavorare su progetti di scrittura e coding in modo più intuitivo e flessibile.
Il funzionamento di base è semplice; si può chiedere a ChatGPT di generare una bozza iniziale di un progetto, oppure incollare un testo o codice esistente per ricevere feedback e suggerimenti. Una delle caratteristiche più apprezzate è la possibilità di evidenziare sezioni specifiche del testo o del codice; indicando esattamente su cosa si vuole che l’IA si concentri.
ChatGPT può quindi fornire commenti in linea per suggerire miglioramenti o apportare direttamente modifiche al documento. Questo approccio permette una collaborazione più naturale e contestuale tra l’uomo e l’IA.
Per attivare la nuova interfaccia di ChatGPT, è sufficiente includere frasi come “usa canvas” o “avvia canvas” nel prompt iniziale. In alcuni casi, per determinate richieste di scrittura come la generazione di bozze di post per blog, il modello GPT-4o è addestrato ad avviare automaticamente Canvas se lo ritiene utile.
Per i progetti di coding, invece, Canvas viene attivato solo su richiesta esplicita. L’interfaccia offre anche una serie di scorciatoie per eseguire rapidamente azioni comuni; come la modifica della lunghezza del testo, il debug del codice o l’aggiunta di commenti. È inoltre possibile ripristinare versioni precedenti del lavoro utilizzando il pulsante “indietro” integrato in Canvas. Questa flessibilità permette di iterare rapidamente su idee e soluzioni, sfruttando al meglio le capacità dell’IA come partner creativo.
Funzionalità avanzate
Canvas offre una serie di funzionalità avanzate specifiche sia per la scrittura che per il coding. Per quanto riguarda la scrittura, le scorciatoie disponibili includono: la possibilità di suggerire modifiche, con ChatGPT che offre suggerimenti e feedback in linea; la regolazione della lunghezza del documento, permettendo di allungarlo o accorciarlo secondo necessità; la modifica del livello di lettura, adattando il testo dal livello elementare a quello universitario; l’aggiunta di una “rifinitura finale” che controlla grammatica, chiarezza e coerenza; l’inserimento di emoji pertinenti per enfasi e colore. Queste funzioni permettono di raffinare rapidamente il testo, adattandolo a diversi scopi.
Sul fronte del coding, Canvas offre strumenti altrettanto potenti: la revisione del codice, con ChatGPT che fornisce suggerimenti in linea per migliorarlo; l’aggiunta di log, inserendo istruzioni di stampa per facilitare il debug e la comprensione del codice; l’inserimento di commenti per rendere il codice più leggibile; la correzione di bug, con l’IA che individua e riscrive il codice problematico; la conversione del codice in altri linguaggi, traducendolo in JavaScript, TypeScript, Python, Java, C++ o PHP.
Queste funzionalità rendono Canvas uno strumento versatile per sviluppatori di tutti i livelli, dalla fase di ideazione a quella di debug e ottimizzazione. La possibilità di iterare rapidamente sul codice, ricevendo feedback immediati dall’IA, accelera notevolmente i processi di sviluppo software.
L’addestramento di GPT-4o per Canvas
Lo sviluppo della nuova interfaccia ha richiesto un approccio innovativo all’addestramento del modello GPT-4o. OpenAI ha dovuto insegnare al modello a collaborare come un vero e proprio partner creativo, capace di comprendere quando aprire una canvas, effettuare modifiche mirate o riscrivere completamente un testo.
Il team di ricerca ha sviluppato una serie di comportamenti chiave, tra cui: l’attivazione di Canvas per scrittura e coding, la generazione di diversi tipi di contenuti, l’esecuzione di modifiche mirate, la riscrittura di documenti e la fornitura di critiche in linea.
Per misurare i progressi, sono state utilizzate oltre 20 valutazioni interne automatizzate. Un aspetto particolarmente innovativo è stato l’uso di tecniche di generazione di dati sintetici, come la distillazione di output dal modello OpenAI o1-preview, per addestrare ulteriormente il modello sui suoi comportamenti fondamentali.
Questo approccio ha permesso di migliorare rapidamente la qualità della scrittura e le nuove interazioni. Secondo OpenAI una delle sfide principali è stata definire quando attivare Canvas. Il modello è stato addestrato ad aprire Canvas per prompt come “Scrivi un post sul blog sulla storia dei chicchi di caffè“, evitando al contempo l’attivazione eccessiva per compiti generali di domanda e risposta. Per il coding, il modello è stato intenzionalmente orientato a non attivare Canvas troppo facilmente, per evitare di disturbare i programmatori più esperti. Questi parametri continueranno ad essere raffinati in base al feedback degli utenti.
OpenAI Canvas : conclusioni
Canvas offre un’interfaccia intuitiva e collaborativa per progetti di scrittura e coding tra uomo e IA. Le prime reazioni sono generalmente positive, con molti che apprezzano la fluidità e l’efficacia dello strumento, soprattutto per compiti di scrittura e coding di media complessità. Tuttavia, emergono anche alcune perplessità sulla sua efficacia per progetti di sviluppo software più articolati o per l’integrazione con flussi di lavoro esistenti.
Le funzionalità avanzate messe a disposizione, come la possibilità di evidenziare sezioni specifiche, accedere a scorciatoie per azioni comuni e ripristinare versioni precedenti del lavoro, possono velocizzare notevolmente il flusso di lavoro sia per chi scrive che per chi fa coding.
Strumenti altamente specializzati per il coding come Cursor.ai possono offrire un’esperienza utente superiore per il coding avanzato. Nonostante ciò, il potenziale di Canvas è innegabile. Sicuramente OpenAI raffinerà ulteriormente questa tecnologia in base al feedback degli utenti e anche in base a come risponderanno i concorrenti come Anthropic.