Dopo la presentazione di diversi modelli open source, Mistral 7B e Mixtral 8x7B lo scorso dicembre ieri, Mistral AI ha annunciato da poche ore il lancio di Mistral Large. E’ un modello di intelligenza artificiale (LLM) con capacità multilingue native, e di Le Chat Mistral, un assistente conversazionale (chatbot) multilingue in tutto simile a ChatGPT.
Mistral Large
Mistral Large è il primo modello chiuso (non open source) della società francese e si distingue per le sue capacità multilingue, le sue dimensioni (notevoli) e le sue prestazioni (appena sotto GPT4). Supera modelli concorrenti come LLaMA 2 70B nei benchmark HellaSwag, Arc Challenge e MMLU. Raggiunge capacità avanzate di ragionamento grazie a vari miglioramenti apportati. E’ in grado di comprendere e generare testi in modo nativo in inglese, francese, spagnolo, tedesco e italiano; coglie le sottigliezze grammaticali e i contesti culturali di ciascuna lingua. Inoltre, la sua finestra di 32.000 token gli permette una buona capacità di ricordare informazioni anche da documenti molto lunghi.
Un altro aspetto notevole di Mistral Large è la sua capacità di seguire istruzioni precise. Ciò consente agli sviluppatori di progettare politiche di moderazione personalizzate. Questa caratteristica è stata utilizzata per impostare la moderazione a livello di sistema di “le Chat Mistral“. Inoltre, è nativamente in grado di eseguire chiamate a funzioni, abilità fondamentale per lo sviluppo di applicazioni e la modernizzazione di stack tecnologici.
Le performance di Mistral Large si posizionano tra Claude 2.1 e GPT-4.
I test condotti su diversi benchmark dimostrano le elevate prestazioni in vari ambiti. Per il ragionamento e la conoscenza generale ottiene ottimi risultati; su MMLU (per la comprensione multilivello del linguaggio). Per i test di abilità di ragionamento comune su HellaSwag, Wino Grande e Arc Challenge.
Superando anche i precedenti modelli di Mistral AI, si distingue in particolare nelle capacità multilingue misurate su questi stessi benchmark in francese, tedesco, spagnolo e italiano. Risultati al top li ottiene anche in ambito matematico e di coding, come dimostrano i punteggi su HumanEval, MBPP, Math Maj e GSM8K.
Le Chat Mistral: il primo chatbot di Mistral
L’altro importante annuncio di Mistral AI riguarda il lancio della versione beta del suo nuovo assistente conversazionale chiamato Le Chat alternativo a ChatGPT, per ora in beta e in accesso gratuito.
Le Chat Mistral è un assistente conversazionale (chatbot) basato sui modelli di Mistral AI. Offre un punto di accesso conversazionale per interagire con i vari modelli dell’azienda. Per ora non permette di inserire allegati come in Claude 2.1. Per ora è disponibile globalmente in versione gratuita.
La finalità di Le Chat Mistral per ora non è quella di diventare un servizio utilizzato da milioni di persone alternativo a ChatGPT ma principalmente quella di offrire una dimostrazione del suo modello linguistico.
“La Chat è una dimostrazione dei nostri modelli, che sono un po’ il motore di questo tipo di applicazioni di intelligenza artificiale generativa. L’obiettivo è anche quello di mostrare alle aziende cosa possono costruire con esso”, ha affermato Arthur Mensch, CEO di Mistral.
Le Chat Mistral opera utilizzando Mistral Large o Mistral Small; oppure un modello prototipo chiamato Mistral Next, progettato per essere breve e conciso. Grazie a un meccanismo di moderazione a livello di sistema regolabile, le Chat avverte in modo non invasivo quando la conversazione si spinge verso direzioni in cui l’assistente potrebbe produrre contenuti sensibili o controversi.
Per le aziende è disponibile Le Chat Enterprise; abilita funzioni aggiuntive come l’auto implementazione e una moderazione più granulare. L’assistente rappresenta dunque un valido strumento per potenziare la produttività dei team aziendali.
API Mistral Large
Mistral AI sta adottando un modello di business simile a OpenAI, offrendo Mistral Large tramite un’API a pagamento con tariffe basate sull’utilizzo. Attualmente, il costo per interrogare Mistral Large è di 8 dollari per milione di token di input e 24 dollari per milione di token di output. Mistral Large per il momento ha una finestra di contesto predefinita di 32.000 token. In confronto, GPT-4 Turbo ha una finestra di contesto da 128.000 token e costa $10 per milione di token di input e $30 per milione di token di output, rendendo Mistral Large attualmente il 20% più conveniente.
Ricordiamo che un token è una singola unità di testo, come una parola, un numero o un simbolo. I token possono essere anche composti da immagini, video, audio o codice. Quanto più grande è la finestra di contesto di un modello, tanto più informazioni può accogliere ed elaborare in un dato prompt. Il suo output sarà più coerente, pertinente e utile.
Disponibilità di Mistral Large
Mistral Large sarà disponibile attraverso la piattaforma proprietaria La Plateforme di Mistral AI e su Microsoft Azure, grazie a una partnership annunciata con il colosso americano. Ciò permetterà agli sviluppatori di sfruttare le capacità avanzate di questo modello attraverso API facilmente integrabili nelle loro applicazioni e servizi.
Microsoft è ora un investitore di minoranza anche in Mistral. L’azienda di Satya Nadella ha replicato la stessa strategia di OpenAI, investendo fortemente nelle startup IA per essere pioniera a tutti i livelli. Microsoft ha partnership anche con Meta e HuggingFace per quanto riguarda l’IA.
Implicazioni e Potenzialità
Mistral AI vuole affermarsi come la startup francese ed europea più importante nel campo dell’intelligenza artificiale.
Mistral Large, con le sue capacità multilingue e la sua precisione nel seguire istruzioni, apre nuove possibilità per lo sviluppo di applicazioni che interagiscono in modo naturale con gli utenti in diverse lingue. Questo è particolarmente rilevante in un contesto globale dove la capacità di comunicare e operare in più lingue è molto importante.
Invece, Le Chat Mistral con la sua capacità di moderazione su potenziali contenuti sensibili o controversi è un passo importante verso la creazione di tecnologie di IA responsabili e rispettose delle normative e delle sensibilità culturali.
Resta da vedere come i ricercatori di Mistral AI riusciranno a migliorare nel tempo le capacità dei propri sistemi. Il potenziale sembra davvero notevole.