Negli ultimi anni abbiamo assistito a significativi progressi nel campo dell’intelligenza artificiale conversazionale, con la comparsa di chatbot sempre più avanzati in grado di interagire in modo fluido con gli esseri umani. Con Claude 2.1, Anthropic cerca di guadagnare posizioni nella “competizione” con ChatGPT di OpenAI.
Claude 2.1 la nuova versione rilasciata da Anthropic
Mentre in OpenAI c’è bagarre con le note vicende di Sam Altman, Claude oggi ha ricevuto da Anthropic un importante aggiornamento che migliora sostanzialmente le sue capacità. Con la nuova versione 2.1 rilasciata da Anthropic, Claude può ora analizzare contenuti testuali molto più estesi.
Fino ad ora, come la maggior parte dei chatbot, Claude era in grado di comprendere solo brevi prompt di poche migliaia di parole. Con la versione 2.1 invece la “finestra di contesto“, ovvero la quantità massima di testo che può essere fornita come input, è stata aumentata fino a raggiungere 200.000 token, quasi 500 pagineo 150.000 parole ! Quindi una finestra di contesto quasi 2 volte più grande rispetto a GPT-4 Turbo !
Questa nuova capacità permette agli utenti di interagire con Claude fornendo interi codici sorgente, articoli scientifici, resoconti finanziari o perfino opere letterarie estese come l’Iliade o l’Odissea. Il bot sarà in grado di riassumere il contenuto, rispondere a domande specifiche, fare confronti tra più documenti e individuare pattern non sempre facili da cogliere per gli esseri umani. Certo, l’analisi di input così lunghi richiederà qualche minuto anziché pochi secondi, ma i tempi di risposta dovrebbero comunque migliorare con i progressi tecnologici.
Claude 2.1 riduce le allucinazioni
Un’altra novità importante riguarda la riduzione di circa la metà del tasso di “allucinazioni“, ovvero di risposte errate date dal sistema con eccessiva sicurezza. Anthropic ha infatti lavorato per rendersi conto con maggiore sincerità quando non è in possesso di una risposta certa, evitando di fornire informazioni errate. I test hanno mostrato miglioramenti anche nella capacità di riassumere e comprendere documenti lunghi e complessi come contratti legali o relazioni finanziarie.
Claude 2.1 ha dimostrato una riduzione del 30% delle risposte errate e un tasso 3-4 volte inferiore di conclusioni errate di un documento a sostegno di una determinata affermazione.
Tool use, lo strumento per i processi aziendali
Infine, Anthropic ha introdotto una nuova funzionalità beta definita “tool use” (uso degli strumenti), che mira a rendere il bot più integrato con i processi aziendali degli utenti. Claude 2.1 potrà infatti essere istruito a:
- utilizzare la calcolatrice per ragionamenti numerici complessi
- accedere a database esterni
- interrogare motori di ricerca web
- tradurre richieste in linguaggio naturale in chiamate strutturate ad API
- connettersi a dataset privati per fornire consigli e aiutare gli utenti a completare gli acquisti.
Questa nuova funzionalità è attualmente in fase di sviluppo iniziale. Anthropic sta creando queste funzionalità per gli sviluppatori, fornendo linee guida per la loro integrazione in modo semplice nelle applicazioni.
Claude 2.1: altri miglioramenti
Gli sviluppatori avranno poi a disposizione nuovi strumenti per ottimizzare l’addestramento del modello, ad esempio creando prompt multipli e generando codice per integrarlo con le proprie applicazioni. Anthropic punta così a rendere Claude uno strumento sempre più potente ed efficace per le aziende.
Conclusione
Per Anthropic, il momento di questo rilascio non potrebbe essere migliore. Con il suo principale rivale OpenAI allo sbando, può proporre una scelta più affidabile.
Il sistema Claude 2.1 ora è in grado di analizzare fino a 150.000 parole in una singola interazione, contro le precedenti 2.500, ampliando notevolmente il contesto fornito. Questo consente di interagire su argomenti molto più articolati e complessi.
La possibilità di dialogare su vasti contenuti testuali porta a nuovi utilizzi in ambiti come l’assistenza legale, la revisione di documentazione tecnica, il riassunto automatico. Per raggiungere l’affidabilità e la comprensione umane, specialmente per le informazioni ambigue o contraddittorie ci vuole ancora molto impegno degli sviluppatori. I progressi finora ottenuti lasciano però ben sperare per le future potenzialità dell’IA conversazionale.