Reka AI, un’azienda di intelligenza artificiale con sede in California, ha lanciato qualche ora fa Reka Core, il suo modello di linguaggio (large languague model) multimodale più avanzato. Costruito da zero, utilizza le ultime GPU H100 di NVIDIA e Pytorch per l’apprendimento automatico. Reka Core vuole proporsi come una soluzione valida e alternativa ai migliori modelli Claude di Anthropic e ChatGPT 4 di OpenAI.
Disponibile oggi tramite API a pagamento o chat conversazionale gratuita, Core è il terzo modello della famiglia di modelli linguistici di Reka; segue a Flash ed Edge. Edge è il modello più piccolo, ideale per i casi in cui la velocità è fondamentale; è adatto anche per usi locali o su dispositivo. Flash invece è un modello di media grandezza, ottimizzato per le comuni domande quotidiane da remoto.
Reka Core
Modello IA multimodale è un modello che può comprendere, lavorare e generare informazioni in diverse modalità, come testo, immagini e video e talvolta anche audio. Reka Core riesce bene proprio in questo; è in grado di elaborare e comprendere input di testo, immagini, video e audio.
Supporta 32 lingue e una finestra di contesto di 128.000 token e può gestire grandi quantità di informazioni diverse. Rappresenta uno strumento potente per varie applicazioni.
Sebbene le dimensioni esatte del modello non siano state divulgate, Reka Core è descritto come un modello di grandi dimensioni addestrato su molteplici fonti di dati; tra questi, dati pubblici, dati concessi in licenza e dati sintetici che coprono testo, audio, video e file di immagine. Questa vasta portata di addestramento consente a Core di comprendere molteplici modalità di input e fornire risposte in diversi domini, come matematica e codifica.
Prestazioni e valutazioni di Reka Core
Nonostante Reka Core sia stato addestrato in meno di un anno, in alcuni test è in grado di eguagliare o superare le prestazioni dei modelli leader provenienti da aziende consolidate nel settore dell’IA, come OpenAI, Google e Anthropic. Ad esempio, nel test di percezione video, Core ha superato il suo unico concorrente, Gemini Ultra di Google. Il punteggio è di 59,3 contro 54,3.
Nei benchmark MMMU per attività con immagini, Reka Core si è posizionato subito dopo GPT-4, Claude 3 Opus, Gemini Ultra e Gemini Pro 1.5, con un punteggio di 56,3.
Il benchmark MMMU (Massive Multi-discipline Multimodal Understanding) è un set di test che valuta i modelli di apprendimento automatico massivo (LLM) in un contesto di comprensione zero-shot, ovvero senza fornire informazioni specifiche sulle domande che si vuole chiedere. Questo metodo di valutazione è utile per misurare la capacità dei modelli di generare risposte senza aver ricevuto informazioni specifiche prima.
Risultati di Reka Core in altri test
Anche nel test MMLU per attività di conoscenza, Core ha raggiunto un punteggio di 83,2, posizionandosi dietro ai leader di settore come GPT-4, Claude 3 Opus e Gemini Ultra.
Il benchmark MMLU (Massive Multitask Language Understanding) è un benchmark che valuta la comprensione e la capacità di risolvere problemi di un modello linguistico in diversi settori. Il benchmark copre 57 soggetti e si basa su test a scelta multipla per valutare la conoscenza acquisita durante il pre-addestramento dei modelli linguistici.
Inoltre, Reka Core ha superato GPT-4 nei benchmark GSM8K per il ragionamento e HumanEval per la codifica, con punteggi rispettivamente di 92,2 e 76,8. Reka afferma che in una valutazione umana indipendente condotta da terze parti, le prestazioni multimodali di Reka Core sono state giudicate come le seconde migliori.
Il test GSM8K (Grade School Math 8K) è un benchmark che valuta la capacità di un modello linguistico di risolvere problemi di matematica elementare. Il benchmark consiste in un insieme di problemi di matematica e richiede calcoli elementari utilizzando operazioni aritmetiche basilari.
API di supporto
Reka Core fornisce anche un API con un prezzo di 10 dollari per milione di token di input e 25 dollari per milione di token di output. GPT-4 Turbo di OpenAI, per il contesto, ha lo stesso prezzo per i token di input ma $ 30 per l’output. Reka spera di sbloccare nuovi e unici casi d’uso per i clienti provenienti da diversi settori industriali, come e-commerce, gaming, assistenza sanitaria e robotica.
Chatbot conversazionale
Reka Core ha già reso disponibile un chatbot conversazionale basato su Reka Core (disponibili anche Flash e Edge), per il momento completamente gratuito e aperto a tutti a questo link.
Reka Core : conclusione
Sebbene Reka sia ancora in una fase iniziale, l’azienda ha raggiunto buoni livelli prestazionali in breve tempo e sembra seriamente intenzionata a dire la sua tra OpenAI, Anthropic e Google, nel settore dell’intelligenza artificiale.
Il lancio di Reka Core segna un traguardo significativo nell’avanzamento dell’intelligenza artificiale multimodale. Mentre l’IA continua a evolversi, la capacità di Reka Core di elaborare e comprendere molteplici modalità di dati potrebbe aprire la strada a nuove applicazioni e casi d’uso innovativi in vari settori industriali. Il CEO di Reka ha comunicato che per il momento non ha intenzione di rendere open source la sua tecnologia.