OpenAI ha annunciato ieri la disponibilità generale di GPT-4, il suo ultimo modello di generazione di testo, tramite la sua interfaccia di programmazione applicativa (API).
A partire da ieri pomeriggio, tutti gli sviluppatori che utilizzano l’API di OpenAI e che hanno una iscrizione con pagamenti regolari possono accedere a GPT-4. L’azienda prevede di aprire l’accesso a nuovi sviluppatori entro la fine di questo mese e in seguito aumentare i limiti di disponibilità in base alla capacità di calcolo disponibile. “Pagamenti regolari” si riferisce al fatto che gli sviluppatori che desiderano accedere a GPT-4 tramite l’API di OpenAI devono avere un precedente storico di pagamenti andati a buon fine. Ciò indica cheOpenAI richiede che gli sviluppatori abbiano effettuato pagamenti corretti e completati con successo in passato per poter accedere a GPT-4. È un requisito per garantire che gli sviluppatori siano in grado di gestire le spese e che abbiano dimostrato una corretta condotta finanziaria nel loro utilizzo dei servizi di OpenAI.
OpenAI ha ricevuto milioni di richieste di accesso all’API di GPT-4 da parte degli sviluppatori fin dal mese di marzo, e ogni giorno cresce il numero di prodotti innovativi che utilizzano GPT-4, come ha scritto OpenAI in un post sul blog. L’obiettivo è quello di creare un futuro in cui i modelli basati su chat possano supportare qualsiasi tipo di utilizzo.
GPT-4 è in grado di generare testo, inclusi codici, e accettare sia immagini che testi come input, migliorando così le capacità di GPT-3.5, il suo predecessore, che accettava solo testo. Ha la capacità di comprendere bozze di pagine web disegnate a mano e genera automaticamente il codice per un’intera pagina web. Nella parte di inserimento del testo, GPT-4 può accettare istruzioni delle più complesse. GPT-4 raggiunge risultati “paragonabili a quelli umani” in vari test professionali e accademici. Come i modelli GPT precedenti di OpenAI, GPT-4 è stato allenato utilizzando dati pubblicamente disponibili, inclusi dati provenienti da pagine web pubbliche, nonché dati ottenuti tramite licenze da OpenAI.
L’abilità di comprendere le immagini non è ancora disponibile per tutti i clienti di OpenAI. Attualmente, OpenAI sta testando questa funzionalità con un singolo partner, Be My Eyes e per questa abilità non è stata fornita una data precisa per l’apertura dell’accesso a un pubblico più ampio.
Anche se GPT-4 rappresenta un notevole avanzamento va sottolineato che non è perfetto. Può generare informazioni non corrette e commette errori di ragionamento. Non è in grado di apprendere dai suoi errori e presenta difficoltà nel risolvere problemi complessi, ad esempio nell’introdurre vulnerabilità di sicurezza nel codice che genera.
In futuro, OpenAI prevede di consentire agli sviluppatori di personalizzare ulteriormente GPT-4 e GPT-3.5 Turbo, un altro recente modello di generazione di testo con capacità inferiori (e uno dei modelli originali utilizzati da ChatGPT), utilizzando i propri dati, come già possibile con diversi altri modelli di generazione di testo di OpenAI. Questa funzionalità dovrebbe essere disponibile entro la fine di quest’anno, secondo quanto affermato da OpenAI.
Da quando GPT-4 è stato presentato a marzo, la competizione nel campo dell’intelligenza artificiale generativa è diventata più accesa. Di recente, Anthropic ha ampliato la finestra di contesto per Claude, il suo modello di intelligenza artificiale generativa di punta (ancora in fase di anteprima), da 9.000 a 100.000 token. (La finestra di contesto si riferisce al testo considerato dal modello prima di generare nuovo testo, mentre i token rappresentano le unità di testo grezzo – ad esempio, la parola “fantastico” sarebbe suddivisa nei token “fan”, “tas” e “tic”). GPT-4 deteneva il primato precedente in termini di finestra di contesto, con un massimo di 32.000 token. In generale, i modelli con finestre di contesto più piccole tendono a “dimenticare” il contenuto di conversazioni anche molto recenti, portandoli fuori tema.
Un altro annuncio fatto da OpenAI riguarda le sue API per DALL-E 2, il suo modello di generazione di immagini, e Whisper, il suo modello di trascrizione vocale in testo, che ora sono disponibili a tutti (anche chi non ha un pagamento attivo). L’azienda ha inoltre pianificato la deprecazione dei vecchi modelli disponibili tramite l’API per “ottimizzare la capacità di calcolo“.
A partire dal 4 gennaio 2024, i vecchi modelli, come GPT-3 e le sue varianti, non saranno più disponibili e verranno sostituiti da nuovi modelli “base GPT-3“, che si presume siano più efficienti dal punto di vista del calcolo. Gli sviluppatori che utilizzano i vecchi modelli dovranno aggiornare manualmente le proprie integrazioni entro il 4 gennaio, mentre coloro che desiderano continuare a utilizzare vecchi modelli personalizzati dovranno adattarli ai nuovi modelli “base GPT-3”.
OpenAI ha dichiarato che fornirà supporto agli utenti che hanno precedentemente personalizzato modelli per agevolare questa transizione. Nei prossimi giorni contatteranno gli sviluppatori che hanno utilizzato i vecchi modelli, fornendo ulteriori informazioni una volta che i nuovi modelli di completamento saranno pronti per i primi test.