A ridosso di Natale la società cinese AI Deepseek aveva presentato Deepseek V3, un valido modello open source in grado di sfidare ChatGPT 4o e Claude Sonnet 3.5. Ieri Deepseek ha stupito ancora tutti presentando il modello di ragionamento DeepSeek-R1; un modello di linguaggio sempre open-source che si confronta con il modello di ragionamento OpenAI o1. Questo modello eguaglia le capacità di OpenAI o1 su benchmark prestigiosi come AIME, MATH-500 e SWE-bench Verified.
Ma ciò che distingue davvero DeepSeek-R1 è il connubio tra performance elevate, il modello open source, e il costo API sorprendentemente basso rispetto i prezzi di OpenAI e Anthropic. Elementi che potrebbero cambiare le regole del gioco nel panorama AI. I modelli di DeepSeek si fanno notare quindi come una soluzione accessibile e scalabile. Una porta aperta verso un’adozione più ampia delle AI di ultima generazione. Al momento è possibile utilizzare in modo completamente gratuito sia il modello Deepseek V3 sia il modello di ragionamento R1; R1 è attivabile con il pulsante DeepThink dal sito https://chat.deepseek.com .
DeepSeek-R1 : architettura e metodologia
DeepSeek-R1 si basa su un’architettura mixture-of-experts; incorpora 671 miliardi di parametri, con 37 miliardi attivati in ogni operazione, ottimizzando così l’uso delle risorse computazionali. Il suo sviluppo è avvenuto attraverso un processo in più fasi; include addestramento con reinforcement learning su larga scala e perfezionamento supervisionato in domini specifici. Questa combinazione ha permesso di migliorare l’accuratezza e la leggibilità del modello. Risolve problemi riscontrati nelle prime versioni, come il mix linguistico e una scarsa qualità dei risultati testuali.
Un aspetto distintivo di DeepSeek-R1 è la sua capacità di auto-verifica e riflessione durante il processo di ragionamento. Un processo simile a quello che abbiamo visto con OpenAI o1 e con Gemini Flash Thinking 2.0 . Questo modello è stato progettato per affrontare compiti complessi che richiedono un alto livello di affidabilità; per esempio, la risoluzione di problemi di fisica avanzata e la programmazione. Inoltre, la disponibilità del modello sulla piattaforma API sotto licenza MIT, gratuitamente sul sito https://chat.deepseek.com e su piattaforme come Hugging Face ne favorisce l’uso commerciale e la personalizzazione. Tutto a favore di una maggiore collaborazione nella comunità AI globale.
Benchmark e performance
Nei test comparativi, DeepSeek-R1 ha raggiunto risultati sorprendenti che riflettono la sua capacità di affrontare con successo sfide complesse. Nel benchmark AIME 2024, incentrato sulla risoluzione di problemi matematici avanzati, ha ottenuto un punteggio del 79,8%; supera marginalmente OpenAI o1. Questo risultato sottolinea la robustezza del suo algoritmo, progettato per comprendere e risolvere problemi logici intricati. Sul fronte del test MATH-500, il modello ha dimostrato una precisione notevole; raggiunge il 97,3%, un livello che lo colloca al vertice della competizione per capacità di calcolo e ragionamento.
In ambito generale, nonostante una lieve differenza nel test MMLU, dove ha registrato il 90,8% contro il 91,8% di o1, DeepSeek-R1 ha mostrato un’eccellenza particolare nei compiti di programmazione, ottenendo un punteggio di 2.029 su Codeforces.
Questo lo posiziona tra i sistemi più efficienti nel trattare con codice complesso e algoritmi intricati; un alleato indispensabile per sviluppatori e aziende. La capacità di DeepSeek-R1 di combinare precisione e velocità nei processi di ragionamento mostra come le tecnologie open-source possano sfidare i giganti consolidati del settore.
Sul fronte economico, DeepSeek-R1 si pone come un’alternativa estremamente conveniente. I costi API di Deepseek-R1 variano da $0.14 (cached) a $0.55 (uncached) per milione di token in ingresso a $2.19 per milione di token in uscita; il modello è significativamente più accessibile rispetto a OpenAI o1, che richiede $15 per milione di token in ingresso e $60 per quelli in uscita. Questo aspetto potrebbe spingere molte aziende e sviluppatori a preferire DeepSeek-R1 per progetti a budget molto contenuto. Puoi accedere alle API da questo link mentre la documentazione API è disponibile a questo link.
DeepSeek-R1: conclusione
OpenAI, con il suo modello o1, ha fissato standard elevati in termini di prestazioni; tuttavia, i costi superiori e la mancanza di trasparenza hanno limitato l’accesso a queste tecnologie. DeepSeek, startup cinese specializzata in soluzioni open-source, con il suo modello DeepSeek-R1 non solo eguaglia le capacità di o1 in diversi benchmark, ma lo fa con un costo operativo ridotto del 90-95%.
DeepSeek-R1 oltre a competere con soluzioni leader del settore come OpenAI o1 e Gemini Flash Thinking, offre quindi un’alternativa economicamente sostenibile e altamente performante. La sua architettura innovativa e la metodologia di addestramento avanzata lo rendono adatto a una vasta gamma di applicazioni, dalla ricerca scientifica alla programmazione.
Il rilascio di modelli come DeepSeek-R1 sotto licenza aperta segna un progresso nella democratizzazione delle tecnologie AI, promuove un ambiente di innovazione e trasparenza. Sarà interessante osservare come questo modello influenzerà il settore nei prossimi mesi, specialmente in termini di adozione commerciale e sviluppo collaborativo.