Close Menu
    Ultimi Articoli

    Amazfit Helio Strap, il fitness tracker senza display

    28/01/2026223 Views
    Gamesir G7 Pro

    GameSir G7 Pro: precisione e versatilità per il gaming

    28/01/202633 Views

    Garmin Descent G2, lo smartwatch da polso tra mare e montagna

    28/01/202641 Views
    Agentic Vision in Gemini 3 Flash

    Agentic Vision: Gemini 3 Flash ora può vedere meglio

    28/01/2026
    kimi 2.5

    Kimi K2.5: un modello AI multimodale con orchestrazione di agenti

    28/01/202617 Views

    Anker Nano 13-in-1: la Docking Station con modulo rimovibile per lavoro ibrido

    28/01/2026

    Raiju V3 Pro: il controller per PS5 che punta tutto sulla precisione competitiva

    27/01/2026

    PS2Recomp: promette di portare i giochi PlayStation 2 in porte native per PC

    27/01/2026
    giovedì, Gennaio 29
    Trending
    • Amazfit Helio Strap, il fitness tracker senza display
    • GameSir G7 Pro: precisione e versatilità per il gaming
    • Garmin Descent G2, lo smartwatch da polso tra mare e montagna
    • Agentic Vision: Gemini 3 Flash ora può vedere meglio
    • Kimi K2.5: un modello AI multimodale con orchestrazione di agenti
    • Anker Nano 13-in-1: la Docking Station con modulo rimovibile per lavoro ibrido
    • Raiju V3 Pro: il controller per PS5 che punta tutto sulla precisione competitiva
    • PS2Recomp: promette di portare i giochi PlayStation 2 in porte native per PC
    Login
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    • Home
    • Computer
      1. MINI PC
      2. Laptop
      3. Monitor
      4. Teoria
      5. Mouse
      6. GPU
      7. Windows
      8. Motherboard
      9. Tastiere
      10. View All
      AMD Ryzen AI Halo

      AMD Ryzen AI Halo: il mini-PC AMD per l’AI

      14/01/2026
      GMKtec M8

      GMKtec M8: un mini PC Ryzen 5 con USB4 e Oculink

      12/01/2026
      NiPoGi E3B

      Mini PC NiPoGi E3B con Ryzen 7 5700U: potenza compatta ad un prezzo aggressivo

      09/01/2026
      GMKtec NucBox K11

      GMKtec NucBox K11, una soluzione completa per produttività e intrattenimento

      20/12/2025
      Lenovo Chromebook Duet 11

      Lenovo Chromebook Duet 11, un versatile 2-in-1 con 10 anni di aggiornamenti

      24/12/2025
      Legion 5 15IRX10

      Lenovo Legion 5 15IRX10, potenza da workstation e versatilità gaming

      13/10/2025
      Lenovo Yoga Slim 7

      Potenza e autonomia si muovono insieme sul Lenovo Yoga Slim 7

      26/09/2025
      Dell Inspiron 16

      Dell Inspiron 16 5645: un notebook elegante, potente e versatile al prezzo giusto

      27/07/2025
      PG27FFX2A

      ASRock PG27FFX2A 520Hz: zero lag, massima reattività, pura precisione

      24/01/2026
      ROS ASUS XG248QSG ACE

      ASUS ROG Strix XG248QSG Ace: 610 Hz di velocità pura per gli esports

      16/01/2026
      Asus ROG Swift PG27AQDP

      Asus ROG Swift PG27AQDP: il monitor OLED da 480Hz che ridefinisce il gaming

      11/01/2026
      LG UltraGear 27GX790A

      LG UltraGear 27GX790A: il monitor per gaming eSport

      08/01/2026
      Bluetooth 6.1

      Bluetooth 6.1: più privacy e autonomia per i dispositivi wireless

      12/05/2025
      ASUS ProArt Z790

      Evoluzione del bus di sistema PCIe fino al PCIe 7

      16/04/2025
      USB

      USB : l’evoluzione di Universal Serial Bus dagli anni 90 ad oggi

      02/02/2025
      bluetooth

      L’evoluzione del Bluetooth: un viaggio attraverso le versioni fino al 6.2

      13/11/2024
      Mouse NZXT Lift 2

      Mouse NZXT Lift 2, mouse filare ultraleggero e preciso

      21/12/2025
      MX Master 4

      Logitech MX Master 4, feedback aptico e design migliorato

      20/12/2025
      Burst II Air

      Turtle Beach Burst II Air wireless, un mouse gaming di soli 47 gr!

      15/06/2025
      Scimitar Elite Wireless SE

      Corsair Scimitar Elite Wireless SE: un mouse pensato per chi ha bisogno di controllare tutto

      04/06/2025
      OptiScaler

      OptiScaler, cos’è e come attivarlo nei giochi

      03/01/2026
      HBM4E

      Samsung con HBM4E punta a 3.25TB/s entro il 2027, oltre le specifiche JEDEC

      15/10/2025
      OpenAI AMD

      AMD e OpenAI: alleanza strategica da miliardi di dollari

      06/10/2025
      pcie 250watt

      Asus alimenta una RTX 5060 Ti da 250 W su uno slot PCIe potenziato

      23/09/2025
      mu language model

      Mu, un motore AI per gestire le impostazioni di Windows 11

      27/12/2025
      windows 11

      Windows 11 : nuove strategie di resilienza e strumenti di ripristino

      19/11/2025
      Copilot

      Windows 11 si trasforma con Copilot Voice, Vision e Actions

      17/10/2025
      Windows 11 25H2

      Microsoft rilascia Windows 11 25H2 con focus sulla sicurezza

      01/10/2025

      Arduino UNO Q raddoppia RAM e storage

      23/01/2026
      ROG Strix B860-A Gaming

      Asus ROG Strix B860-A Gaming WiFi, motherboard per build ad alte prestazioni.

      17/01/2026
      pcie 250watt

      Asus alimenta una RTX 5060 Ti da 250 W su uno slot PCIe potenziato

      23/09/2025
      MSI MAG Z890 Tomahawk WiFi

      MSI MAG Z890 Tomahawk WiFi: scheda madre top per Intel Ultra

      12/06/2025
      Signature Slim Solar+ K980

      Logitech Signature Slim Solar+ K980: la tastiera che si ricarica con la luce

      22/01/2026
      Epomaker HE75 Mag

      Tastiera magnetica Epomaker HE75 Mag: la scelta giusta per chi pretende il massimo spendendo poco

      23/11/2025
      Keys-To-Go 2

      Logitech Keys-To-Go 2: tastiera wireless per laptop, tablet e smartphone

      14/06/2025
      Logitech G515 TKL

      Logitech G515: tastiera gaming TKL sottile e versatile a prezzo accessibile

      04/06/2025
      PG27FFX2A

      ASRock PG27FFX2A 520Hz: zero lag, massima reattività, pura precisione

      24/01/2026

      Arduino UNO Q raddoppia RAM e storage

      23/01/2026
      Signature Slim Solar+ K980

      Logitech Signature Slim Solar+ K980: la tastiera che si ricarica con la luce

      22/01/2026
      ROG Strix B860-A Gaming

      Asus ROG Strix B860-A Gaming WiFi, motherboard per build ad alte prestazioni.

      17/01/2026
    • Tech
      1. Curiosità
      2. Eventi
      3. memory cards
      4. Powerbank
      5. Smartwatch
      6. Gadgets
      7. Bluetooth speakers
      8. Intelligenza artificiale
      9. Offerte
      10. Software
      11. View All

      Starlink abbassa i satelliti per sicurezza orbitale

      02/01/2026

      Con Nano Banana, Gemini supera ChatGPT tra le app AI

      17/09/2025
      grotta lunare

      Scoperta una grotta lunare sotterranea

      16/07/2024
      Oleg Kononenko

      Oleg Kononenko: 1000 giorni nello spazio

      05/06/2024
      BYD YangWang U9 Extreme

      BYD YangWang U9 Extreme: il nuovo re della velocità tra le auto di serie

      24/09/2025
      Awe Dropping Apple

      Awe Dropping del 9 settembre 2025, Apple svela il suo futuro

      09/09/2025
      Starship Flight 10

      SpaceX Starship Flight 10: il ritorno del gigante spaziale

      27/08/2025
      Made by Google 2025

      Tutto pronto per il Made by Google 2025: il 20 agosto debutta la nuova generazione Pixel

      18/08/2025
      SSD Crucial P310 2TB

      Crucial P310 2TB SSD NVMe: storage ad alta velocità a un ottimo prezzo

      08/06/2025
      V-NAND QLC Samsung

      Il futuro dello storage è pronto: Samsung svela la V-NAND QLC da 1 Tb

      12/09/2024
      microSD SD Express

      Samsung presenta la prima microSD SD Express

      07/03/2024

      ADATA lancia il primo SSD esterno USB4 SE920

      31/10/2023

      Anker Nano Power Bank 5K, il caricatore più sottile con MagSafe e Qi2

      22/01/2026
      power bank

      Power Bank cablati e wireless Qi2 : guida all’acquisto

      28/11/2025
      Sharge ICEMAG 2

      Sharge ICEMAG 2: power bank Qi2 15W con raffreddamento attivo

      12/05/2025
      Baseus Nomos

      Baseus Nomos Power Bank: ricarica wireless veloce e sicura

      11/05/2025

      Garmin Descent G2, lo smartwatch da polso tra mare e montagna

      28/01/2026

      Huawei Watch GT 6 Pro: elegante e sportivo con 21 giorni di autonomia

      22/01/2026

      Apple Watch 11 è il primo smartwatch Apple che dura davvero 24 ore

      20/01/2026
      Garmin Forerunner 255

      Garmin Forerunner 255: un multisport affidabile e completo

      19/01/2026
      Gamesir G7 Pro

      GameSir G7 Pro: precisione e versatilità per il gaming

      28/01/2026

      Raiju V3 Pro: il controller per PS5 che punta tutto sulla precisione competitiva

      27/01/2026
      EERO 7

      Eero 7: sistema mesh Wi-Fi 7 economico, smart e facile da usare

      16/01/2026
      Smart Tracker Aowoka

      Smart Tracker Aowoka per localizzare gli oggetti smarriti

      15/01/2026

      JBL Boombox 4: speaker Bluetooth con AI e USB-C lossless

      23/01/2026
      Ultimate Ears EVERBOOM

      Ultimate Ears Everboom: audio a 360 gradi, design solido e 20 ore di autonomia

      18/01/2026

      JBL Xtreme 3, altoparlante potente e impermeabile

      09/01/2026
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      31/12/2025
      Agentic Vision in Gemini 3 Flash

      Agentic Vision: Gemini 3 Flash ora può vedere meglio

      28/01/2026
      kimi 2.5

      Kimi K2.5: un modello AI multimodale con orchestrazione di agenti

      28/01/2026
      clawdbot

      ClawdBot: un assistente AI che vive sul tuo computer e dialoga sui tuoi social

      26/01/2026
      GitHub Copilot SDK

      GitHub Copilot SDK: agenti AI integrabili in qualsiasi app

      23/01/2026
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      31/12/2025
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      nubia z60 ultra

      Offerte Black Friday Nubia: telefoni premium a prezzi convenienti

      22/11/2024
      Scream Fest 2024

      Steam Scream Fest 2024: sconti horror per Halloween

      29/10/2024

      GStreamer 1.26.10 migliora Flac, Opus, Matroska e streaming adattativo

      29/12/2025
      OpenShot 3.4

      OpenShot 3.4: prestazioni migliorate e nuovi strumenti creativi per l’editing video

      16/12/2025

      Google lancia Emergency Live Video per chiamate d’emergenza

      11/12/2025
      HDMI 2.1

      HDMI 2.1 sulla Steam Machine esiste ma è nascosto

      08/12/2025

      Amazfit Helio Strap, il fitness tracker senza display

      28/01/2026
      Agentic Vision in Gemini 3 Flash

      Agentic Vision: Gemini 3 Flash ora può vedere meglio

      28/01/2026
      kimi 2.5

      Kimi K2.5: un modello AI multimodale con orchestrazione di agenti

      28/01/2026

      Anker Nano 13-in-1: la Docking Station con modulo rimovibile per lavoro ibrido

      28/01/2026
    • Mobiles
      1. Smartphones
      2. View All

      Galaxy S25 Edge: il flagship per chi ama il minimalismo

      26/01/2026

      Oukitel WP35, rugged phone 5G compatto, completo e conveniente

      15/01/2026

      Honor Magic 7 Pro progettato per offrire il massimo in ogni contesto

      11/01/2026
      OnePlus 12R 5G

      OnePlus 12R 5G: un best buy per chi vuole il Wi-Fi 7

      11/01/2026

      DOOGEE U12: il tablet Android con display 2K e super batteria

      22/01/2026
      Teclast T65 Plus

      Il tablet Teclast T65 Plus è un gigante rosso da 13,4 pollici

      20/01/2026
      Galaxy Tab A11+

      Samsung Galaxy Tab A11+: finalmente la serie A permette il gaming

      05/01/2026
      DOOGEE Tab E3 Max

      DOOGEE Tab E3 Max: un maxi-tablet pensato per multimedia e intrattenimento

      01/01/2026
    • Musica
      1. Cuffie
      2. DAC
      3. hi-fi
      4. Teoria
      5. View All

      Bose QuietComfort Ultra 2a gen, auricolari per viaggiare, lavoro e relax

      24/01/2026

      Creative Aurvana Ace 2: tecnologia xMEMS nel mondo TWS

      21/01/2026
      FreeBuds 6

      Huawei FreeBuds 6: audio hi-res e ANC in formato open-fit

      20/01/2026
      EarFun Tune Pro

      EarFun Tune Pro: praticità wireless e autonomia da 120 ore

      19/01/2026
      Eversolo Play

      Eversolo Play: il tuttofare hi-fi per chi vuole meno cavi e più musica

      03/12/2025
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      FiiO BTR15

      FiiO BTR15: DAC Bluetooth al prezzo più basso di sempre

      17/05/2025
      DAC ADI-2 DAC FS

      Cosa è un DAC audio

      26/10/2024
      Eversolo Play

      Eversolo Play: il tuttofare hi-fi per chi vuole meno cavi e più musica

      03/12/2025
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      Focal Aria 926

      Componenti per un ottimo impianto stereo

      31/07/2024

      Garmin acquista JL Audio

      16/08/2023
      truffa phishing zalando

      Truffa phishing: in regalo la gift card Zalando da 150€

      06/12/2024
      sim ed esim

      Differenza tra SIM fisica ed eSIM: vantaggi e sicurezza

      02/11/2024

      Malware: cosa sono e come difendersi

      19/10/2024
      crittografia a cosa serve

      Crittografia, come funziona e perchè dobbiamo utilizzarla

      16/10/2024

      Bose QuietComfort Ultra 2a gen, auricolari per viaggiare, lavoro e relax

      24/01/2026

      Creative Aurvana Ace 2: tecnologia xMEMS nel mondo TWS

      21/01/2026
      FreeBuds 6

      Huawei FreeBuds 6: audio hi-res e ANC in formato open-fit

      20/01/2026
      EarFun Tune Pro

      EarFun Tune Pro: praticità wireless e autonomia da 120 ore

      19/01/2026
    • Lifestyle
      1. Criptovalute
      2. EV
      3. Gaming
      4. Trekking
      5. Scienze
      6. View All
      Alpha Arena : trading ai bot

      Alpha Arena : sfida tra modelli AI nel trading di criptovalute

      20/10/2025
      Coinbase

      Coinbase colpita da attacco informatico e minaccia di riscatto

      15/05/2025
      coinbase

      Coinbase : acquisti cripto tramite Apple Pay

      03/12/2024
      criptovalute

      Criptovalute: cosa sono e come funzionano le monete virtuali

      19/10/2024
      Volvo EX60

      Volvo EX60: la sfida scandinava al dominio tedesco degli elettrici premium

      22/01/2026
      CATL sodium ion

      CATL annuncia la produzione di massa delle batterie agli ioni di sodio nel 2026

      30/12/2025
      Geely Xingyuan

      Auto elettriche: settembre 2025 segna un record con 2,1 milioni di unità vendute

      15/10/2025
      BYD YangWang U9 Extreme

      BYD YangWang U9 Extreme: il nuovo re della velocità tra le auto di serie

      24/09/2025
      Rustler

      Rustler (Grand Theft Horse) in regalo su Epic Games

      22/01/2026
      Styx: Shards of Darkness

      Styx: Shards of Darkness in regalo su Epic Games

      15/01/2026
      Master of Shadows

      Styx: Master of Shadows in regalo su Epic Games

      15/01/2026
      HyperX Cloud III

      HyperX Cloud III: comfort superiore e qualità audio a meno di 100 euro

      04/01/2026
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      8a Scarpinata della Teverina

      A spasso per i sentieri: 8a Scarpinata della Teverina

      14/05/2024
      Valli e Calanchi

      A spasso per i sentieri: 1a Valli e Calanchi

      27/09/2023
      Maternum Marathon 2023

      A spasso per i sentieri: la 2a edizione di Maternum Marathon

      13/06/2023
      urano

      Le lune esterne di Urano Titania e Oberon, sono scure sul lato anteriore.

      19/06/2025
      Muon g-2

      L’anomalia Muon g-2 segue le leggi del Modello Standard

      13/06/2025
      Neuroplatform finalspark

      Neuroplatform, piattaforma online alimentata dal primo processore biologico al mondo

      27/05/2024
      AlphaFold 3 di Google DeepMind

      AlphaFold 3 di Google DeepMind

      08/05/2024
      Volvo EX60

      Volvo EX60: la sfida scandinava al dominio tedesco degli elettrici premium

      22/01/2026
      CATL sodium ion

      CATL annuncia la produzione di massa delle batterie agli ioni di sodio nel 2026

      30/12/2025
      Skechers

      Skechers GO RUN Elevate 2.0, scarpe per bambini con AirTag

      21/11/2025
      hallowen 2025

      Halloween 2025: la nostra selezione di film horror da vedere

      30/10/2025
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    Home»Tech»Intelligenza artificiale»OpenAI presenta i modelli o3 e o3 mini
    Intelligenza artificiale

    OpenAI presenta i modelli o3 e o3 mini

    All'OpenAI Day 12, Sam Altman ha svelato i modelli di ragionamento di nuova generazione dell'azienda: o3 e o3 mini. Ridefiniscono i parametri di riferimento dell'intelligenza artificiale.
    GrazianoGraziano21/12/2024Updated:21/12/202407 Mins Read36 Views
    Share Twitter Facebook Pinterest Reddit Telegram WhatsApp Email
    OpenAI Imodello o3
    Share
    Facebook Twitter Pinterest Reddit Telegram WhatsApp Email Threads

    Ieri durante il docidesimo ed ultimo giorno del suo evento speciale “12 Days of OpenAI”, Sam Altman, ha introdotto due nuovi modelli di “ragionamento” IA o3 e o3 mini; ovvero le versioni successive di o1 e o1 mini. Invece di seguire una nomenclatura sequenziale prevedibile, OpenAI ha saltato o2 a causa di un potenziale conflitto di copyright con il marchio O2; un noto fornitore di servizi di telecomunicazioni britannico.

    OpenAI Imodello o3

    OpenAI svela o3 e o3 mini

    Come in o1 e o1 mini, o3 è il modello principale con ampie capacità; invece o3 mini, è una versione più compatta e veloce ma altrettanto abile. È importante notare che questi nuovi modelli o3 non saranno immediatamente disponibili al pubblico. OpenAI ha delineato un piano per renderli accessibili inizialmente per test di sicurezza pubblici.

    Questo approccio prudente sottolinea l’importanza che OpenAI attribuisce alla sicurezza man mano che i suoi modelli acquisiscono maggiore competenza. OpenAI ha aperto l’accesso a ricercatori esterni che desiderano contribuire al processo di test.

    Sam Altam ha promesso il rilascio pubblico di o3 mini per fine gennaio e o3 subito dopo. Nel video di presentazione ha espresso entusiasmo nel mostrare le potenzialità di questi modelli e ha mostrato dimostrazioni e benchmark per evidenziarne le capacità.

    Abilità tecniche di o3

    Il modello o3 dimostra una notevole competenza in una serie di benchmark tecnici complessi; in particolare in compiti che coinvolgono la programmazione e la matematica. Nei benchmark di programmazione, come il “sweet bench verified”, che valuta le prestazioni su attività di sviluppo software reali, o3 raggiunge un’accuratezza del 71,7%.

    Questo risultato supera di oltre il 20% le prestazioni dei modelli o1; evidenzia un progresso sostanziale nella capacità del modello di affrontare sfide di codifica complesse. Nel contesto della programmazione competitiva, dove i modelli vengono valutati in base alla loro capacità di risolvere problemi algoritmici in competizioni come “code forces”, o3 ha ottenuto un punteggio ELO di circa 2727 nelle impostazioni di calcolo con tempi di test elevati e aggressivi.

    Questo dato è particolarmente degno di nota se confrontato con i punteggi ottenuti da programmatori competitivi umani esperti. Anche in ambito matematico, o3 mostra abilità eccezionali. Nei benchmark di matematica competitiva, il modello raggiunge un’accuratezza del 96,7% nel test Amy, rispetto all’83,3% del modello o1. Questo livello di precisione indica che o3 spesso sbaglia solo una domanda nei test per l’Olimpiade matematica statunitense.

    o3 nei test scientifici

    Le prestazioni di o3 sono altrettanto notevoli in benchmark scientifici di livello di dottorato. Per esempio, nel gpq Diamond ottiene un punteggio dell’87,7%. Questo valore è superiore di circa il 10% rispetto alle prestazioni del modello o1 e supera il tipico punteggio del 70% ottenuto da esperti con dottorato di ricerca nel loro campo.

    o3 è stato testato anche con il benchmark Epic AI Frontier Math; un benchmark creato appositamente per testare a fondo modelli IA. Presenta problemi inediti e particolarmente complessi che richiedono ore o addirittura giorni per essere risolti da matematici professionisti.

    Attualmente, i migliori modelli IA raggiungono un’accuratezza pari al 2% su questo benchmark. o3, con impostazioni di test aggressive, è stato in grado di superare il 25%.

    Il traguardo di o3 nel benchmark Arc AGI

    Un momento saliente del video è stata la discussione sul benchmark Arc Artificial General Intelligence (AGI); è considerato un test fondamentale per l’intelligenza artificiale generale. Creato nel 2019, Arc AGI ha resistito come una sfida irrisolta per cinque anni.

    Il benchmark Arc AGI si concentra sulla capacità di un sistema di comprendere e applicare principi di trasformazione attraverso esempi. Ai partecipanti vengono presentati set di input-output e il compito è dedurre la regola sottostante e applicarla per completare un output incompleto.

    Questi compiti, pur essendo intuitivi per gli esseri umani, si sono dimostrati sorprendentemente difficili per i sistemi di intelligenza artificiale. La difficoltà di Arc AGI risiede nel fatto che ogni compito richiede un insieme distinto di abilità. Inoltre, impedisce ai modelli di fare affidamento su schemi memorizzati in fase di apprendimento. La versione 1 di Arc AGI ha visto progressi lenti; passando dallo 0% al 5% di accuratezza in cinque anni con i principali modelli di IA.

    Tuttavia, o3 ha ottenuto un nuovo punteggio all’avanguardia del 75,7% sul set di holdout semi-privato di Arc AI con risorse computazionali limitate. Ancora più notevole è che, aumentando le risorse computazionali per o3, il modello ha raggiunto un punteggio dell’85,7%.

    Questo risultato è particolarmente significativo perché le prestazioni umane su questo benchmark sono comparabili a una soglia dell’85%. Superare questa soglia seppure di pochissimo indica che o3 ha dimostrato una sorta di capacità di ragionamento a livello umano; un risultato senza precedenti per qualsiasi sistema di intelligenza artificiale testato finora.

    Impegno per la sicurezza e l’accessibilità di OpenAI

    Mentre i punteggi ottenuti da o3 nei vari benchmark sono entusiasmanti, OpenAI riconosce che il lavoro nello sviluppo di un’intelligenza artificiale sicura e affidabile è tutt’altro che completo. L’azienda sottolinea la necessità di benchmark più completi e duraturi, come Arc AGI, per misurare e guidare il progresso. Inoltre, OpenAI ha espresso il suo entusiasmo per la collaborazione con entità esterne per sviluppare benchmark di prossima generazione.

    Inoltre, OpenAI sta lavorando a una nuova tecnica chiamata allineamento deliberativo per migliorare ulteriormente la sicurezza dei suoi modelli. Questo metodo sfrutta le capacità di ragionamento dei modelli stessi per identificare e prevenire potenziali prompt non sicuri; un progresso nello sviluppo di sistemi di intelligenza artificiale più sicuri e affidabili.

    o3 mini

    Parallelamente allo sviluppo del modello o3, OpenAI ha presentato anche o3 mini; un modello di ragionamento efficiente in termini di costi che si unisce alla famiglia o1 mini. o3 mini si distingue per la sua capacità di fornire buone prestazioni a un costo inferiore. Come il modello o3, la versione mini non sarà immediatamente accessibile a tutti. OpenAI sta aprendo l’accesso a o3 mini a ricercatori sulla sicurezza per i test. I ricercatori interessati possono candidarsi tramite un modulo sul sito Web di OpenAI. Le domande si chiuderanno il 10 gennaio.

    Una nuova funzionalità, denominata “tempo di pensiero adattivo” nell’API, consentirà di regolare il tempo dedicato dal modello al ragionamento; offre flessibilità per diversi casi d’uso. Le valutazioni iniziali di o3 mini mostrano risultati promettenti nei benchmark di codifica, con prestazioni che migliorano con tempi di pensiero più lunghi e che superano il modello o1 mini con tempi di pensiero medi. In termini di costi ed efficienza, o3 mini definisce una nuova frontiera. Offre prestazioni di codifica comparabili o migliori a un costo inferiore rispetto a o1 mini.

    Una dimostrazione pratica ha evidenziato la capacità di o3 mini di generare ed eseguire codice Python, inclusa la creazione di un server e di un’interfaccia utente per attività di programmazione interattive. o3 mini dimostra anche competenza in matematica; ottiene prestazioni comparabili a o1 mini con tempi di elaborazione ridotti e prestazioni migliori con tempi di elaborazione medi.

    OpenAI Day 12: conclusione

    Sam Altam ha voluto concludere l’evento speciale “12 Days of OpenAI” con la dimostrazione di due modelli IA non ancora disponibili al pubblico, o3 e o3mini.

    Ne ha evidenziato le prestazioni eccezionali su benchmark impegnativi come Epic AI Frontier Math e Arc AGI; un chiaro segnale dei crescenti livelli di sofisticazione raggiunti da questi sistemi. Il raggiungimento di prestazioni a livello umano sul benchmark Arc AGI in contesti di calcolo elevato è un risultato particolarmente degno di nota. Sottolinea il potenziale di questi modelli per affrontare compiti complessi che richiedono capacità di ragionamento avanzate.

    L’annuncio di o3 e o3 mini segnala una fase promettente nello sviluppo dell’intelligenza artificiale, caratterizzata da progressi significativi nelle capacità di ragionamento e da un continuo impegno per la sicurezza e la collaborazione.

    AI app apps blog canvas ChatGPT LLM news o1 o2 o3 o3mini OpenAI picks tech tecnologia warp xcode
    Seguici su X (Twitter) Seguici su Bluesky Seguici su WhatsApp
    Share. Facebook Twitter Pinterest
    Previous ArticleAnker MagGo 3-in-1: stazione di ricarica wireless Qi2
    Next Article TerraTech è in regalo su Epic Games
    Avatar photo
    Graziano
    • Website

    Giornalista e recensore tech per Gomoot. Ho visto l'informatica nascere con il C64 e oggi seguo con lo stesso entusiasmo l'evoluzione verso mini PC e desktop SFF. Fuori dal lavoro, le mie passioni sono: i film, il trekking, la bici e la corsa. Ma non disdegno mai una buona sessione di gaming 🎮 o programmazione – è il mio modo per ricaricarmi !

    Articoli collegati

    Agentic Vision in Gemini 3 Flash
    Intelligenza artificiale

    Agentic Vision: Gemini 3 Flash ora può vedere meglio

    28/01/2026
    kimi 2.5
    Intelligenza artificiale

    Kimi K2.5: un modello AI multimodale con orchestrazione di agenti

    28/01/202617 Views
    clawdbot
    Intelligenza artificiale

    ClawdBot: un assistente AI che vive sul tuo computer e dialoga sui tuoi social

    26/01/202616 Views
    Add A Comment
    Leave A Reply Cancel Reply

    Ultimi articoli

    Amazfit Helio Strap, il fitness tracker senza display

    28/01/2026223 Views
    Gamesir G7 Pro

    GameSir G7 Pro: precisione e versatilità per il gaming

    28/01/202633 Views

    Garmin Descent G2, lo smartwatch da polso tra mare e montagna

    28/01/202641 Views
    Agentic Vision in Gemini 3 Flash

    Agentic Vision: Gemini 3 Flash ora può vedere meglio

    28/01/2026
    kimi 2.5

    Kimi K2.5: un modello AI multimodale con orchestrazione di agenti

    28/01/202617 Views

    Anker Nano 13-in-1: la Docking Station con modulo rimovibile per lavoro ibrido

    28/01/2026
    Gomoot : tecnologia e lifestyle
    Mastodon WhatsApp X (Twitter) Instagram Threads
    • Home
    • Tech
    • Mobiles
    • Contatti
    • Privacy
    • ABOUT
    © 2026 GOMOOT.COM

    Type above and press Enter to search. Press Esc to cancel.

    Sign In or Register

    Welcome Back!

    Login to your account below.

    Continua con Google

    Lost password?