Close Menu
    Ultimi Articoli

    GTBox T1: il mini PC che si traveste da altoparlante Bluetooth

    31/10/202518 Views
    Galaxy Tab S11 Ultra

    Samsung Galaxy Tab S11 Ultra: quando il tablet Android diventa una workstation portatile

    31/10/2025

    Galaxy S25 FE: il flagship mascherato che Samsung non voleva creare

    31/10/2025

    Python 3.14 è ora disponibile su Azure App Service for Linux con base Ubuntu

    30/10/2025

    WhatsApp introduce le chiavi di accesso per backup sicuri

    30/10/2025
    hallowen 2025

    Halloween 2025: la nostra selezione di film horror da vedere

    30/10/202566 Views
    Five Nights at Freddy's: Into the Pit

    Five Nights at Freddy’s: Into the Pit in regalo su Epic Games

    30/10/2025
    Bendy and the Ink Machine

    Bendy and the Ink Machine in regalo su Epic Games

    30/10/2025
    sabato, Novembre 1
    Trending
    • GTBox T1: il mini PC che si traveste da altoparlante Bluetooth
    • Samsung Galaxy Tab S11 Ultra: quando il tablet Android diventa una workstation portatile
    • Galaxy S25 FE: il flagship mascherato che Samsung non voleva creare
    • Python 3.14 è ora disponibile su Azure App Service for Linux con base Ubuntu
    • WhatsApp introduce le chiavi di accesso per backup sicuri
    • Halloween 2025: la nostra selezione di film horror da vedere
    • Five Nights at Freddy’s: Into the Pit in regalo su Epic Games
    • Bendy and the Ink Machine in regalo su Epic Games
    Login
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    • Home
    • Computer
      1. MINI PC
      2. Laptop
      3. Monitor
      4. Teoria
      5. Mouse
      6. GPU
      7. Windows
      8. Motherboard
      9. Tastiere
      10. View All

      GTBox T1: il mini PC che si traveste da altoparlante Bluetooth

      31/10/2025
      Geekom A9 Max

      Mini PC Geekom A9 Max: compatto fuori, potente dentro

      03/09/2025
      Minisforum UM690L Slim

      Minisforum UM690L Slim: prestazioni desktop in dimensioni ultra compatte

      10/08/2025
      GMKtec NucBox K11

      GMKtec NucBox K11, una soluzione completa per produttività e intrattenimento

      28/07/2025
      Legion 5 15IRX10

      Lenovo Legion 5 15IRX10, potenza da workstation e versatilità gaming

      13/10/2025
      Lenovo Yoga Slim 7

      Potenza e autonomia si muovono insieme sul Lenovo Yoga Slim 7

      26/09/2025
      Dell Inspiron 16

      Dell Inspiron 16 5645: un notebook elegante, potente e versatile al prezzo giusto

      27/07/2025
      Acer Aspire 3 A315-44P

      Acer Aspire 3 A315-44P: Potenza e versatilità a buon prezzo

      25/07/2025
      PG27FFX2A

      ASRock PG27FFX2A 520Hz: zero lag, massima reattività, pura precisione

      15/09/2025
      ASUS ROG Strix XG32UCWMG

      ASUS ROG Strix XG32UCWMG : nuovo punto di riferimento per il gaming di fascia alta

      10/09/2025
      BenQ MA320U

      BenQ MA320U, monitor 4K ideale per Mac

      01/08/2025
      ROG Strix XG27ACDNG

      ASUS ROG Strix XG27ACDNG: un monitor per gamer competitivi e professionisti della grafica

      28/07/2025
      Bluetooth 6.1

      Bluetooth 6.1: più privacy e autonomia per i dispositivi wireless

      12/05/2025
      ASUS ProArt Z790

      Evoluzione del bus di sistema PCIe fino al PCIe 7

      16/04/2025
      USB

      USB : l’evoluzione di Universal Serial Bus dagli anni 90 ad oggi

      02/02/2025
      bluetooth

      L’evoluzione del Bluetooth: un viaggio attraverso le versioni fino al 6.1

      13/11/2024
      MX Master 4

      Logitech MX Master 4, feedback aptico e design migliorato

      02/10/2025
      Mouse NZXT Lift 2

      Mouse NZXT Lift 2, mouse filare ultraleggero e preciso

      19/07/2025
      Burst II Air

      Turtle Beach Burst II Air wireless, un mouse gaming di soli 47 gr!

      15/06/2025
      Scimitar Elite Wireless SE

      Corsair Scimitar Elite Wireless SE: un mouse pensato per chi ha bisogno di controllare tutto

      04/06/2025
      HBM4E

      Samsung con HBM4E punta a 3.25TB/s entro il 2027, oltre le specifiche JEDEC

      15/10/2025
      OpenAI AMD

      AMD e OpenAI: alleanza strategica da miliardi di dollari

      06/10/2025
      pcie 250watt

      Asus alimenta una RTX 5060 Ti da 250 W su uno slot PCIe potenziato

      23/09/2025
      nvidia intel

      Nvidia investe e collabora con Intel: nuove APU Intel x86 RTX e CPU x86 nei cloud Nvidia

      19/09/2025
      Copilot

      Windows 11 si trasforma con Copilot Voice, Vision e Actions

      17/10/2025
      Windows 11 25H2

      Microsoft rilascia Windows 11 25H2 con focus sulla sicurezza

      01/10/2025
      Microsoft store

      Microsoft Store è ora gratuito per sviluppatori individuali

      11/09/2025
      kernel windows

      Antivirus fuori dal kernel: Microsoft cambia le regole su Windows

      27/06/2025
      pcie 250watt

      Asus alimenta una RTX 5060 Ti da 250 W su uno slot PCIe potenziato

      23/09/2025
      ROG Strix B860-A Gaming

      Asus ROG Strix B860-A Gaming WiFi, motherboard per build ad alte prestazioni.

      10/08/2025
      MSI MAG Z890 Tomahawk WiFi

      MSI MAG Z890 Tomahawk WiFi: scheda madre top per Intel Ultra

      12/06/2025
      CVN Z790D5

      Colorful presenta la nuova mobo gaming CVN Z790D5 ARK FROZEN

      22/08/2024
      Signature Slim Solar+ K980

      Logitech Signature Slim Solar+ K980: la tastiera che si ricarica con la luce

      24/09/2025
      Epomaker HE75 Mag

      Tastiera magnetica Epomaker HE75 Mag: la scelta giusta per chi pretende il massimo spendendo poco

      26/07/2025
      Keys-To-Go 2

      Logitech Keys-To-Go 2: tastiera wireless per laptop, tablet e smartphone

      14/06/2025
      Logitech G515 TKL

      Logitech G515: tastiera gaming TKL sottile e versatile a prezzo accessibile

      04/06/2025

      GTBox T1: il mini PC che si traveste da altoparlante Bluetooth

      31/10/2025

      Python 3.14 è ora disponibile su Azure App Service for Linux con base Ubuntu

      30/10/2025

      Google attiverà HTTPS di default in Chrome

      29/10/2025
      CS3250

      PNY CS3250: un SSD Gen5 con ottime prestazioni.. sulla carta

      29/10/2025
    • Tech
      1. Curiosità
      2. Eventi
      3. memory cards
      4. Powerbank
      5. Smartwatch
      6. Gadgets
      7. Bluetooth speakers
      8. Intelligenza artificiale
      9. Offerte
      10. Software
      11. View All

      Con Nano Banana, Gemini supera ChatGPT tra le app AI

      17/09/2025
      grotta lunare

      Scoperta una grotta lunare sotterranea

      16/07/2024
      Oleg Kononenko

      Oleg Kononenko: 1000 giorni nello spazio

      05/06/2024

      GPT-4 supera gli analisti finanziari nella previsione degli utili aziendali

      28/05/2024
      BYD YangWang U9 Extreme

      BYD YangWang U9 Extreme: il nuovo re della velocità tra le auto di serie

      24/09/2025
      Awe Dropping Apple

      Awe Dropping del 9 settembre 2025, Apple svela il suo futuro

      09/09/2025
      Starship Flight 10

      SpaceX Starship Flight 10: il ritorno del gigante spaziale

      27/08/2025
      Made by Google 2025

      Tutto pronto per il Made by Google 2025: il 20 agosto debutta la nuova generazione Pixel

      18/08/2025
      SSD Crucial P310 2TB

      Crucial P310 2TB SSD NVMe: storage ad alta velocità a un ottimo prezzo

      08/06/2025
      V-NAND QLC Samsung

      Il futuro dello storage è pronto: Samsung svela la V-NAND QLC da 1 Tb

      12/09/2024
      microSD SD Express

      Samsung presenta la prima microSD SD Express

      07/03/2024

      ADATA lancia il primo SSD esterno USB4 SE920

      31/10/2023

      Anker Nano Power Bank 5K, il caricatore più sottile con MagSafe e Qi2

      26/09/2025
      Sharge ICEMAG 2

      Sharge ICEMAG 2: power bank Qi2 15W con raffreddamento attivo

      12/05/2025
      Baseus Nomos

      Baseus Nomos Power Bank: ricarica wireless veloce e sicura

      11/05/2025

      Xiaomi Power Bank da 165W: ricarica ultra-rapida e design compatto

      10/04/2025

      Watch Ultra 3, il miglior smartwatch Apple per outdoor

      28/10/2025
      AGM Legion Pro

      AGM Legion Pro: una scelta intelligente per chi cerca uno smartwatch robusto e versatile

      21/10/2025

      Watch SE 3, l’economico di Apple ma con caratteristiche premium

      17/10/2025

      Pixel Watch 4, lo smartwatch più completo di Google

      13/10/2025
      Gamesir G7 Pro

      GameSir G7 Pro: precisione e versatilità per il gaming

      08/09/2025

      Kindle Colorsoft 16 GB perfetto per manga, fumetti e riviste, ora in offerta su Amazon

      27/08/2025
      8BitDo Ultimate 2C Controller

      8BitDo Ultimate 2C Wireless Controller, il migliore sotto i 50 euro

      10/08/2025
      8BitDo Ultimate

      8BitDo Ultimate Mobile Gaming Controller: massimo controllo per i gamer su Android

      27/07/2025

      JBL Boombox 4: speaker Bluetooth con AI e USB-C lossless

      19/09/2025
      Ultimate Ears EVERBOOM

      Ultimate Ears Everboom: audio a 360 gradi, design solido e 20 ore di autonomia

      09/08/2025
      EarFun Uboom L

      EarFun UBoom L, l’altoparlante economico, pratico e di qualità

      27/07/2025
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      25/07/2025
      GitHub Agent HQ

      GitHub Agent HQ: orchestrazione multi-agente per sviluppatori stanchi di cambiare tool

      29/10/2025
      Qualcomm AI200 e AI250

      Qualcomm presenta i chip AI200 e AI250 e sfida Nvidia e AMD nel mercato dei data center AI

      28/10/2025

      Nuovo Add-in Excel di Claude per Financial Services

      28/10/2025

      Modelli AI avanzati sviluppano l’istinto di sopravvivenza

      27/10/2025
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      25/07/2025
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      nubia z60 ultra

      Offerte Black Friday Nubia: telefoni premium a prezzi convenienti

      22/11/2024
      Scream Fest 2024

      Steam Scream Fest 2024: sconti horror per Halloween

      29/10/2024

      WhatsApp introduce le chiavi di accesso per backup sicuri

      30/10/2025
      servo motore rendering

      Servo: il nuovo motore di navigazione scritto in Rust

      21/10/2025

      Google Search cambia: ora puoi nascondere gli annunci, ma solo dopo averli visti

      14/10/2025
      Epic Games

      Con iOS 18.6 installare Epic Games Store su iPhone è più semplice

      01/10/2025

      Galaxy S25 FE: il flagship mascherato che Samsung non voleva creare

      31/10/2025

      WhatsApp introduce le chiavi di accesso per backup sicuri

      30/10/2025

      Falla in Google Messages per Wear OS invia SMS senza permessi

      30/10/2025
      GitHub Agent HQ

      GitHub Agent HQ: orchestrazione multi-agente per sviluppatori stanchi di cambiare tool

      29/10/2025
    • Mobiles
      1. Smartphones
      2. View All

      Galaxy S25 FE: il flagship mascherato che Samsung non voleva creare

      31/10/2025

      Poco X7, lo smartphone economico di Xiaomi

      24/10/2025

      Samsung Galaxy A56 un mid-range con IA e supporto fino al 2031

      04/10/2025

      Xiaomi 15T Pro, il nuovo flagship economico, completo, elegante e duraturo

      29/09/2025
      Galaxy Tab S11 Ultra

      Samsung Galaxy Tab S11 Ultra: quando il tablet Android diventa una workstation portatile

      31/10/2025

      Redmi Pad 2: un tablet elegante ed economico, perfetto per l’uso quotidiano

      29/10/2025

      Huawei MatePad 12 X (2025) , un tablet per creativi, studenti e professionisti

      24/10/2025

      Xiaomi Pad 7: il miglior tablet Android economico

      22/10/2025
    • Musica
      1. Cuffie
      2. DAC
      3. hi-fi
      4. Teoria
      5. View All

      Edifier Stax Spirit S5: cuffie wireless con driver planari per audiofili esigenti

      20/10/2025

      Powerbeats Fit, auricolari wireless perfetti per lo sport

      15/10/2025

      CMF Headphone Pro: cuffie over-ear economiche che uniscono stile, funzionalità e comfort

      01/10/2025
      Baseus Inspire XH1

      Baseus Inspire XH1: cuffie con ANC e suono firmato Bose sotto i 200 euro

      23/09/2025
      Eversolo Play

      Eversolo Play: il tuttofare hi-fi per chi vuole meno cavi e più musica

      18/08/2025
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      FiiO BTR15

      FiiO BTR15: DAC Bluetooth al prezzo più basso di sempre

      17/05/2025
      DAC ADI-2 DAC FS

      Cosa è un DAC audio

      26/10/2024
      Eversolo Play

      Eversolo Play: il tuttofare hi-fi per chi vuole meno cavi e più musica

      18/08/2025
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      Focal Aria 926

      Componenti per un ottimo impianto stereo

      31/07/2024

      Garmin acquista JL Audio

      16/08/2023
      truffa phishing zalando

      Truffa phishing: in regalo la gift card Zalando da 150€

      06/12/2024
      sim ed esim

      Differenza tra SIM fisica ed eSIM: vantaggi e sicurezza

      02/11/2024

      Malware: cosa sono e come difendersi

      19/10/2024
      crittografia a cosa serve

      Crittografia, come funziona e perchè dobbiamo utilizzarla

      16/10/2024

      Edifier Stax Spirit S5: cuffie wireless con driver planari per audiofili esigenti

      20/10/2025

      Spotify e le etichette musicali collaborano per l’AI responsabile

      16/10/2025

      Powerbeats Fit, auricolari wireless perfetti per lo sport

      15/10/2025

      CMF Headphone Pro: cuffie over-ear economiche che uniscono stile, funzionalità e comfort

      01/10/2025
    • Lifestyle
      1. Criptovalute
      2. EV
      3. Gaming
      4. Trekking
      5. Scienze
      6. View All
      Alpha Arena : trading ai bot

      Alpha Arena : sfida tra modelli AI nel trading di criptovalute

      20/10/2025
      Coinbase

      Coinbase colpita da attacco informatico e minaccia di riscatto

      15/05/2025
      coinbase

      Coinbase : acquisti cripto tramite Apple Pay

      03/12/2024
      criptovalute

      Criptovalute: cosa sono e come funzionano le monete virtuali

      19/10/2024
      Geely Xingyuan

      Auto elettriche: settembre 2025 segna un record con 2,1 milioni di unità vendute

      15/10/2025
      BYD YangWang U9 Extreme

      BYD YangWang U9 Extreme: il nuovo re della velocità tra le auto di serie

      24/09/2025
      Volkswagen ID.1

      Volkswagen ID.1: l’auto elettrica da 20000 euro arriva nel 2027

      05/02/2025
      microvast

      Microvast: l’innovazione nelle batterie allo stato solido

      13/01/2025
      Five Nights at Freddy's: Into the Pit

      Five Nights at Freddy’s: Into the Pit in regalo su Epic Games

      30/10/2025
      Bendy and the Ink Machine

      Bendy and the Ink Machine in regalo su Epic Games

      30/10/2025
      Fear the Spotlight

      Fear the Spotlight è in regalo su Epic Games !

      23/10/2025

      Escape From Duckov: il gioco a piume che ha stregato Steam

      23/10/2025
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      8a Scarpinata della Teverina

      A spasso per i sentieri: 8a Scarpinata della Teverina

      14/05/2024
      Valli e Calanchi

      A spasso per i sentieri: 1a Valli e Calanchi

      27/09/2023
      Maternum Marathon 2023

      A spasso per i sentieri: la 2a edizione di Maternum Marathon

      13/06/2023
      urano

      Le lune esterne di Urano Titania e Oberon, sono scure sul lato anteriore.

      19/06/2025
      Muon g-2

      L’anomalia Muon g-2 segue le leggi del Modello Standard

      13/06/2025
      Neuroplatform finalspark

      Neuroplatform, piattaforma online alimentata dal primo processore biologico al mondo

      27/05/2024
      AlphaFold 3 di Google DeepMind

      AlphaFold 3 di Google DeepMind

      08/05/2024
      hallowen 2025

      Halloween 2025: la nostra selezione di film horror da vedere

      30/10/2025
      A House of Dynamite

      A House of Dynamite: il thriller di Kathryn Bigelow che divide e inquieta

      28/10/2025
      digiuno

      Il digiuno come strategia per rigenerare il sangue e rallentare l’invecchiamento

      27/10/2025
      Geely Xingyuan

      Auto elettriche: settembre 2025 segna un record con 2,1 milioni di unità vendute

      15/10/2025
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    Home»Tech»Intelligenza artificiale»DeepSeek 3.1: disponibile il nuovo gigante AI open-source e low cost
    Intelligenza artificiale

    DeepSeek 3.1: disponibile il nuovo gigante AI open-source e low cost

    DeepSeek 3.1 è disponibile: un LLM open-source da 685 miliardi di parametri che punta su velocità, contesto esteso, performance nel coding e architettura flessibile. Pronto per sviluppatori e aziende con chatbot gratuita.
    GrazianoGraziano22/08/2025Updated:22/08/2025010 Mins Read27 Views
    Share Twitter Facebook Pinterest Reddit Telegram WhatsApp Email
    DeepSeek 3.1
    Share
    Facebook Twitter Pinterest Reddit Telegram WhatsApp Email Threads

    Mentre le grandi aziende americane si contendono la scena con conferenze stampa e promesse roboanti, DeepSeek come suo solito, ha deciso di giocare in silenzio e di sorpresa. Il 19 agosto 2025, senza troppi clamori, il team cinese supportato da High-Flyer Capital Management ha caricato DeepSeek 3.1 su Hugging Face. In poche ore il download è esploso, e la community ha iniziato a condividere benchmark e specifiche. 685 miliardi di parametri, contesto fino a 128 mila token, modalità Think & Non-Think in un unico modello e costi di inferenza quasi 30 volte più bassi rispetto gli altri giganti delle API come OpenAI , Google e Anthropic.

    DeepSeek 3.1

    Il modello combina capacità conversazionali, di ragionamento e di coding in un’unica architettura ibrida. Ciò che distingue ancora una volta il nuovo modello di DeepSeek non è soltanto la sua potenza computazionale a basso costo, ma la filosofia open-source che ne garantisce l’accessibilità globale.

    La disponibilità immediata dei pesi del modello su piattaforme aperte consente a ricercatori, sviluppatori e aziende di tutto il mondo di sperimentare, modificare e implementare liberamente questa tecnologia. Questa scelta strategica contrasta nettamente con l’approccio proprietario e rigidamente controllato adottato dalla maggior parte delle società occidentali, creando un precedente importante per lo sviluppo futuro dell’intelligenza artificiale.

    Architettura ibrida e pensiero flessibile: due anime in un solo modello

    DeepSeek 3.1 introduce quella che l’azienda definisce un’architettura ibrida; una soluzione ingegneristica che risolve finalmente il problema dell’integrazione di diverse capacità cognitive in un unico modello coerente. I precedenti tentativi di combinare funzioni di chat, ragionamento e coding spesso producevano sistemi che eccellevano in un’area a scapito delle altre; con prestazioni disomogenee e poco affidabili. Con DeepSeek 3.1, invece, queste capacità sono confluite in un unico modello in grado di mantenere alte prestazioni in tutti i domini.

    DeepSeek ha di conseguenza rimosso il tag R1 (del modello di ragionamento R1-0528) dal suo chatbot. Ora ogni richiesta è impostata di default sulla versione 3.1.

    Per chi sviluppa applicazioni, questo sistema di inferenza ibrida può diventare un alleato importante. E’ veloce e strategico, nel senso che sa adattarsi ai compiti senza spreco computazionale.

    Il sistema processa fino a 128.000 token di contesto; equivalenti approssimativamente a un libro di 400 pagine, mantenendo velocità di risposta che surclassano i modelli concorrenti basati su ragionamento esteso. Il supporto per multiple precisioni di calcolo, dal BF16 standard allo sperimentale FP8, offre agli sviluppatori la flessibilità necessaria per ottimizzare le prestazioni in base ai vincoli hardware specifici. Questa adattabilità risulta particolarmente di valore per quelle organizzazioni che lavorano con infrastrutture eterogenee o con budget computazionali limitati.

    Benchmark DeepSeek 3.1

    I test prestazionali condotti nelle prime ore successive al rilascio hanno rivelato punteggi che rivaleggiano con i sistemi proprietari di OpenAI e Anthropic; posizionano V3.1 tra i modelli più performanti attualmente disponibili. Sul prestigioso benchmark di coding Aider, il modello ha raggiunto il 71.6%; supera di un punto percentuale Claude Opus 4 mentre risulta 68 volte più economico da utilizzare.

    Le valutazioni su SWE-bench Verified mostrano un tasso di successo del 66% per V3.1 rispetto al 45.4% di V3-0324 e al 44.6% di R1-0528 (il modello di ragionamento di DeepSeek). Un miglioramento importante.

    Nella versione multilingue, V3.1 risolve il 54.5% dei problemi, quasi il doppio del ~30% ottenuto dagli altri modelli. Terminal-Bench, che valuta la capacità di un modello di completare task in una shell Linux live, mostra lo stesso pattern; V3.1 ha successo sul 31.3% dei task contro il 13.3% e il 5.7% dei predecessori.

    Anche nei benchmark di information retrieval (ricerca sul web), DeepSeek 3.1 dimostra netti miglioramenti. Su BrowseComp, che richiede la navigazione e l’estrazione di risposte da pagine web, V3.1 risponde correttamente al 30% delle domande contro solo il 8.9% di R1-0528. Nella versione in lingua cinese, raggiunge il 49.2% di accuratezza rispetto al 35.7% di R1. Su HLE (un esame linguistico avanzato), V3.1 mantiene un leggero vantaggio con il 29.8% contro il 24.8%. In task di ricerca più approfonditi come xbench-DeepSearch, che richiedono la sintesi di informazioni da multiple fonti, V3.1 segna il 71.2% contro il 55.0% di R1.

    DeepSeek 3.1 : oltre i parametri e i benchmark

    Dietro le cifre di V3.1 risiedono innovazioni tecniche sofisticate che meritano approfondimento. Il modello si basa sul foundation di V2 con miglioramenti chiave che aumentano capability e inference speed.

    La Multi-Head Latent Attention (MLA) è una nuova tecnica usata da DeepSeek per migliorare il modo in cui “capiscono” le informazioni. Nei sistemi tradizionali, diversi moduli del modello analizzano parti diverse dei dati per trovare collegamenti e relazioni. Con MLA, però, vengono introdotte delle “caratteristiche latenti”; cioè rappresentazioni intermedie che aiutano questi moduli a concentrarsi sui punti davvero importanti. In questo modo il modello riesce a cogliere schemi più complessi e collegamenti anche tra elementi molto distanti; senza aumentare in modo significativo il carico di calcolo.

    L’architettura di DeepSeek 3.1 è del tipo Mixture-of-Experts (MoE); organizza i 671 miliardi di parametri in modo che solo 37 miliardi siano attivi per token. Questo mantiene il compute di inference vicino a quello di modelli molto più piccoli mentre si raggiunge accuratezza superiore.

    Il pioneering Auxiliary-Loss-Free Load Balancing è una tecnica usata da DeepSeek nell’addestramento del modello 3.1 . In pratica, permette di distribuire meglio il lavoro tra le varie parti del modello senza dover aggiungere un termine di errore extra per guidare l’apprendimento. Questo rende il processo di training più semplice e aiuta il modello a essere più stabile mentre impara.

    Infine il Multi-Token Prediction Objective è una tecnica che cambia il modo in cui il modello impara a prevedere le parole da generare nelle risposte. Nei sistemi tradizionali, l’AI indovina una parola alla volta, passo dopo passo. Con questo approccio invece, il modello viene addestrato per prevedere più parole future in un unico colpo. Questo gli permette di imparare schemi più complessi e di diventare più efficiente quando deve generare testo.

    DeepSeek 3.1: tempi di training del modello

    Le tecniche combinate (citate sopra) hanno permesso al team di DeepSeek di addestrare il modello utilizzando molte meno ore di GPU rispetto al normale; pur lavorando sulla stessa quantità di dati. Inoltre, durante alcune fasi dell’addestramento viene usata la precisione FP8; ovvero un formato di calcolo che occupa meno memoria e riduce la quantità di dati da scambiare. Questo rende il processo molto più leggero rispetto all’uso delle classiche precisioni a 16 o 32 bit. L’intero processo di training ha richiesto circa 2,8 milioni di ore di GPU H800.

    Un risultato notevole considerando le dimensioni e la complessità del modello. Se supponiamo un utilizzo di solo 2000 GPU H800 (molto poche rispetto alle GPU utlizzate per il training di GPT, Grok ed altri modelli chiusi), sarebbero stati necessari solo 58 giorni per il training del modello. Meno tempo e meno consumi.

    Democratizzazione dell’accesso all’IA avanzata

    L’efficienza di DeepSeek V3.1 si traduce in vantaggi economici sostanziali che potrebbero alterare radicalmente il panorama competitivo del settore. A un costo di circa 1.01 dollari per task di coding completo, V3.1 offre risultati comparabili a sistemi che costano quasi 70 dollari per carico di lavoro equivalente. Per utenti enterprise che gestiscono migliaia di interazioni AI giornaliere, queste differenze di costo si traducono in potenziali risparmi.

    DeepSeek 3.1 Chatbot

    Questo approccio sfida le assunzioni fondamentali su come i sistemi AI all’avanguardia dovrebbero essere sviluppati e distribuiti. I tradizionali approcci supportati da venture capital richiedono investimenti massicci in infrastrutture computazionali; talento di ricerca e compliance normativa. Costi che devono essere recuperati attraverso prezzi premium. La strategia open-source di DeepSeek capovolge questo modello; potenzialmente mina la capacità dei concorrenti di mantenere margini elevati su capacità simili.

    Le compagnie americane come OpenAI, Anthropic, xAI con Grok e Google con Gemini considerano i loro modelli come proprietà intellettuale di valore che richiede protezione e monetizzazione. Le aziende cinesi al contrario trattano sempre più l’IA avanzata come bene pubblico che accelera l’innovazione attraverso l’accesso diffuso. Questa divergenza di strategia potrebbe avere implicazioni profonde per il futuro dello sviluppo tecnologico globale. Nel frattempo, anche la competizione interna è feroce. Alibaba con Qwen3, GLM-4.5, Kimi K2… la scena è affollata.

    DeepSeek 3.1: integrazione e accessibilità

    DeepSeek 3.1 offre multiple modalità di accesso che ne facilitano l’adozione attraverso diversi scenari d’uso. L’applicazione web ufficiale su deepseek.com fornisce un’interfaccia chat browser-based dove V3.1 è già impostato come default, senza necessità di configurazione. Al momento il chatbot è completamente gratuito; anche se dopo alcune richieste ripetitive potrebbe rifiutarsi di rispondere con l’errore “Server busy, please try again later“. E’ disponibile anche un chatbot Deepseek per Android e iOS.

    Per gli sviluppatori, l’accesso API attraverso gli endpoint deepseek-chat (per uso generale) e deepseek-reasoner (per modalità ragionamento) offre integrazione semplice con applicazioni esistenti; con un’interfaccia compatibile con OpenAI che garantisce familiarità immediata per chi ha già utilizzato gli SDK di OpenAI.

    L’API supporta contesto fino a 128K token per entrambe le modalità; inoltre, formati API Anthropic compatibili e Strict Function Calling in versione beta. Le risorse API sono state potenziate per garantire un’esperienza più fluida e affidabile. Il pricing aggiornato, effettivo dal 5 settembre 2025, si posiziona a : 0.07 dollari per milioni di token in input (cache hit), 0.56 dollari (cache miss) e 1.68 dollari per milioni di token in output.

    DeepSeek ha promesso sconti in fascia notturna per chi usa l’API in orari di minore traffico. Le soft-cap attuali sono 100 richieste al minuto e 10 mila token al secondo. Se gestisci un servizio ad alta concorrenza, puoi richiedere un aumento del limite compilando un modulo di whitelist. Infine, non esiste paywall; i pesi sono liberi, quindi puoi sempre migrare on-premise se il budget si stringe.

    Esecuzione in locale

    Per chi necessita di maggiore controllo o desidera eseguire il modello localmente, i pesi grezzi di V3.1 sono pubblicati su Hugging Face. La licenza è aperta ed è possibile il download e l’implementazione su hardware proprio.

    Ma non farti illusioni; anche un PC con 256 GB di RAM e la più veloce delle GPU con 24 GB di RAM, potrebbe essere insufficiente ad eseguire localmente DeepSeek 3.1 a velocità accettabili (toker per secondo). Ti serve un cluster multi-GPU per eseguirlo in locale ad oltre 10 sec per token; oppure dovrai optare per versioni del modello distillate ed ottimizzate.

    DeepSeek V3.1 ridefinisce le regole del gioco

    La dimostrazione di DeepSeek che le prestazioni all’avanguardia possono coesistere con l’accesso aperto rivela come le barriere artificiali che una volta definivano la competizione AI si stiano sgretolando. Se la versione V3.1 è solo un passaggio intermedio verso la futura V4, allora i cambiamenti che stiamo vedendo oggi potrebbero sembrare piccoli rispetto a quello che arriverà.

    Ciò che è iniziato come competizione su chi potesse costruire i sistemi più potenti si è evoluto in una contest su chi possa rendere quei sistemi più accessibili.

    Le compagnie AI americane dovranno affrontare una sfida esistenziale; se alternative open-source possono eguagliare le prestazioni proprietarie mentre offrono maggiore flessibilità e costi inferiori, i tradizionali vantaggi dello sviluppo chiuso scompaiono.

    Le aziende dovranno impegnarsi a dimostrare di offrire un valore davvero superiore; al fine di poter giustificare prezzi più alti rispetto alla concorrenza. E GPT-5 non è stato quel cambiamento che tutti si aspettavano, nessun effetto wow.

    La competizione potrebbe favorire l’innovazione, spingendo tutte le aziende a sviluppare nuove capacità in modo ancora più rapido. Allo stesso tempo, però, apre interrogativi su come costruire modelli di business sostenibili; in un settore dove i costi di utilizzo tendono quasi a zero e i vantaggi competitivi possono svanire velocemente. Il successo di DeepSeek mostra che il futuro dell’intelligenza artificiale potrebbe essere più aperto, accessibile e vario di quanto molti immaginavano.

    AI blog Claude deepseek deepseek31 gpt5 ia ibrido LLM MLA moe news picks R2 tech tecnologia token
    Seguici su X (Twitter) Seguici su Bluesky Seguici su WhatsApp
    Share. Facebook Twitter Pinterest
    Previous ArticleStrange Horticulture in regalo su Epic Games
    Next Article Ecosia vuole gestire Chrome: una proposta noprofit contro le offerte miliardarie
    Graziano
    • Website

    Reporter e recensore presso Gomoot, mi occupo di riportare notizie riguardanti la tecnologia. Ho cominciato con C64, Amiga, fino al 486; ora seguo con passione la tecnologia attuale e adoro in particolare i desktop SFF e i mini pc. Appassionato di informatica e linguaggi di programmazione nel tempo libero amo praticare trekking e stare all'aperto.

    Articoli collegati

    GitHub Agent HQ
    Intelligenza artificiale

    GitHub Agent HQ: orchestrazione multi-agente per sviluppatori stanchi di cambiare tool

    29/10/2025
    Qualcomm AI200 e AI250
    Intelligenza artificiale

    Qualcomm presenta i chip AI200 e AI250 e sfida Nvidia e AMD nel mercato dei data center AI

    28/10/2025
    Intelligenza artificiale

    Nuovo Add-in Excel di Claude per Financial Services

    28/10/2025
    Add A Comment
    Leave A Reply Cancel Reply

    Ultimi articoli

    GTBox T1: il mini PC che si traveste da altoparlante Bluetooth

    31/10/202518 Views
    Galaxy Tab S11 Ultra

    Samsung Galaxy Tab S11 Ultra: quando il tablet Android diventa una workstation portatile

    31/10/2025

    Galaxy S25 FE: il flagship mascherato che Samsung non voleva creare

    31/10/2025

    Python 3.14 è ora disponibile su Azure App Service for Linux con base Ubuntu

    30/10/2025

    WhatsApp introduce le chiavi di accesso per backup sicuri

    30/10/2025
    hallowen 2025

    Halloween 2025: la nostra selezione di film horror da vedere

    30/10/202566 Views
    Gomoot : tecnologia e lifestyle
    Mastodon WhatsApp X (Twitter) Instagram Threads
    • Home
    • Tech
    • Mobiles
    • Contatti
    • Privacy
    • ABOUT
    © 2025 GOMOOT.COM

    Type above and press Enter to search. Press Esc to cancel.

    Sign In or Register

    Welcome Back!

    Login to your account below.

    Continua con Google

    Lost password?