Close Menu
Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    Ultimi Articoli

    Claude Mythos, il modello AI che non doveva uscire allo scoperto

    22/04/2026

    RingConn Gen 2 Air, smart ring economico che non si sente sul dito

    22/04/2026

    ChatGPT Images 2.0: OpenAI rilancia la generazione visiva

    22/04/2026
    Roomote

    Da Roo Code a Roomote: 3 milioni di installazioni non hanno impedito un cambio di rotta

    22/04/2026
    Mozilla Firefox 150

    Con Firefox 150, Mozilla porta più controllo, più strumenti, più integrazione nativa

    21/04/2026

    GitHub Copilot sospende le iscrizioni per i costi degli agenti

    21/04/2026

    Conversations in Fortnite: gli NPC possono parlare e improvvisare

    21/04/2026
    Kimi K2.6

    Kimi K2.6: il modello open source per il coding che mette pressione ai big dell’AI

    21/04/202616 Views
    mercoledì 22 Aprile 2026
    X (Twitter) Threads Mastodon Bluesky WhatsApp
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    • Home
    • Computer
      1. MINI PC
      2. Laptop
      3. Monitor
      4. Teoria
      5. Mouse
      6. GPU
      7. Windows
      8. Motherboard
      9. Tastiere
      10. View All
      NiPoGi E3B

      Mini PC NiPoGi E3B con Ryzen 7 5700U: potenza compatta ad un prezzo aggressivo

      26/03/2026

      GEEKOM A5: mini pc con buone prestazioni grazie all’AMD Ryzen 7 5800H

      26/03/2026
      Geekom A8

      Recensione Geekom A8: il mini PC AMD che non ti aspetti

      11/03/2026
      ACEMAGICIAN S3A

      ACEMAGICIAN S3A: un mini pc per il gaming ma non solo

      09/03/2026
      MacBook Neo

      MacBook Neo, il portatile entry-level di Apple

      30/03/2026
      Galaxy Book5 Pro

      Il Samsung Galaxy Book5 Pro sfida il MacBook su qualità e autonomia

      18/03/2026
      Lenovo Chromebook Duet 11

      Lenovo Chromebook Duet 11, un versatile 2-in-1 con 10 anni di aggiornamenti

      24/12/2025
      Legion 5 15IRX10

      Lenovo Legion 5 15IRX10, potenza da workstation e versatilità gaming

      13/10/2025

      Philips Evnia 27M2N6501L: il miglior monitor QD-OLED sotto i 500 euro per gaming e color grading

      14/04/2026

      MSI Modern MD272UPSW, il monitor 4K che è anche Smart TV

      13/04/2026
      ASRock Phantom Gaming PGO32UFS

      ASRock Phantom Gaming PGO32UFS: il primo OLED di ASRock punta in alto

      07/04/2026
      odyssey oled g8

      Samsung Odyssey G8 OLED S32DG80: un monitor gaming 4k con Smart tv integrata

      24/03/2026
      Bluetooth 6.1

      Bluetooth 6.1: più privacy e autonomia per i dispositivi wireless

      12/05/2025
      ASUS ProArt Z790

      Evoluzione del bus di sistema PCIe fino al PCIe 7

      16/04/2025
      USB

      USB : l’evoluzione di Universal Serial Bus dagli anni 90 ad oggi

      02/02/2025
      bluetooth

      L’evoluzione del Bluetooth: un viaggio attraverso le versioni fino al 6.2

      13/11/2024

      Logitech G Pro X2 Superstrike, il mouse con tecnologia HITS per click più veloci

      10/02/2026
      Mouse NZXT Lift 2

      Mouse NZXT Lift 2, mouse filare ultraleggero e preciso

      21/12/2025
      MX Master 4

      Logitech MX Master 4, feedback aptico e design migliorato

      20/12/2025
      Burst II Air

      Turtle Beach Burst II Air wireless, un mouse gaming di soli 47 gr!

      15/06/2025
      MatX

      MatX raccoglie 500 milioni di dollari per sfidare Nvidia

      25/02/2026
      nvidia rtx 5090 ti

      Nvidia prepara una RTX 5090 “estrema” per il 2026

      09/02/2026
      dlss45 MFG 6× nvidia

      NVIDIA dynamic MFG e MFG 6×: più intelligenza per i frame generati

      06/02/2026
      OptiScaler

      OptiScaler, cos’è e come attivarlo nei giochi

      03/01/2026
      pannello di controllo windows 11

      Microsoft accelera l’abbandono del Pannello di controllo su Windows 11

      09/04/2026
      Windows 11

      Windows 11 raggiunge un miliardo di utenti: più veloce di Windows 10 nonostante le critiche

      29/01/2026
      mu language model

      Mu, un motore AI per gestire le impostazioni di Windows 11

      27/12/2025
      windows 11

      Windows 11 : nuove strategie di resilienza e strumenti di ripristino

      19/11/2025

      Arduino UNO Q raddoppia RAM e storage

      23/01/2026
      ROG Strix B860-A Gaming

      Asus ROG Strix B860-A Gaming WiFi, motherboard per build ad alte prestazioni.

      17/01/2026
      pcie 250watt

      Asus alimenta una RTX 5060 Ti da 250 W su uno slot PCIe potenziato

      23/09/2025
      MSI MAG Z890 Tomahawk WiFi

      MSI MAG Z890 Tomahawk WiFi: scheda madre top per Intel Ultra

      12/06/2025

      Light Mount di be quiet! porta il silenzio nel gaming

      04/02/2026
      Signature Slim Solar+ K980

      Logitech Signature Slim Solar+ K980: la tastiera che si ricarica con la luce

      22/01/2026
      Epomaker HE75 Mag

      Tastiera magnetica Epomaker HE75 Mag: la scelta giusta per chi pretende il massimo spendendo poco

      23/11/2025
      Keys-To-Go 2

      Logitech Keys-To-Go 2: tastiera wireless per laptop, tablet e smartphone

      14/06/2025
      Mozilla Firefox 150

      Con Firefox 150, Mozilla porta più controllo, più strumenti, più integrazione nativa

      21/04/2026
      Tesla AI5

      Tesla AI5: il chip che Musk definisce esistenziale ha completato il tape-out

      15/04/2026

      Philips Evnia 27M2N6501L: il miglior monitor QD-OLED sotto i 500 euro per gaming e color grading

      14/04/2026

      Linux Foundation lancia Servo 0.1.0, il motore browser in Rust

      14/04/2026
    • Tech
      1. Curiosità
      2. Eventi
      3. memory cards
      4. Powerbank
      5. Smartwatch
      6. Gadgets
      7. Bluetooth speakers
      8. Intelligenza artificiale
      9. Offerte
      10. Software
      11. View All

      Starlink abbassa i satelliti per sicurezza orbitale

      02/01/2026

      Con Nano Banana, Gemini supera ChatGPT tra le app AI

      17/09/2025
      grotta lunare

      Scoperta una grotta lunare sotterranea

      16/07/2024
      Oleg Kononenko

      Oleg Kononenko: 1000 giorni nello spazio

      05/06/2024
      Google I/O 2026

      La conferenza Google I/O 2026 sarà a maggio

      18/02/2026

      NASA rinvia Artemis II per perdite di idrogeno

      03/02/2026
      BYD YangWang U9 Extreme

      BYD YangWang U9 Extreme: il nuovo re della velocità tra le auto di serie

      24/09/2025
      Awe Dropping Apple

      Awe Dropping del 9 settembre 2025, Apple svela il suo futuro

      09/09/2025
      SSD Crucial P310 2TB

      Crucial P310 2TB SSD NVMe: storage ad alta velocità a un ottimo prezzo

      08/06/2025
      V-NAND QLC Samsung

      Il futuro dello storage è pronto: Samsung svela la V-NAND QLC da 1 Tb

      12/09/2024
      microSD SD Express

      Samsung presenta la prima microSD SD Express

      07/03/2024

      ADATA lancia il primo SSD esterno USB4 SE920

      31/10/2023
      power bank

      Power Bank cablati e wireless Qi2 : guida all’acquisto

      03/03/2026

      Anker Nano Power Bank 5K, il caricatore più sottile con MagSafe e Qi2

      22/01/2026
      Sharge ICEMAG 2

      Sharge ICEMAG 2: power bank Qi2 15W con raffreddamento attivo

      12/05/2025
      Baseus Nomos

      Baseus Nomos Power Bank: ricarica wireless veloce e sicura

      11/05/2025

      Watch GT Runner 2 è il running watch più completo di Huawei

      30/03/2026

      WhatsApp arriva sugli smartwatch Garmin

      17/03/2026

      CMF Watch 3 Pro, lo smartwatch con ChatGPT integrato a meno di 100 euro

      04/03/2026
      Honor Watch 4

      Honor Watch 4, lo smartwatch per tutti i giorni, con anima sportiva

      03/03/2026
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      24/03/2026

      Xiaomi Smart Tag offre Find My e Find Hub in un solo tracker

      12/03/2026
      Hollyland Lark A1

      Hollyland Lark A1: uno dei migliori microfoni lavalier per smartphone e vlogging

      03/03/2026
      Elgato Stream Deck

      Elgato Stream Deck MK.2: molto più di un pannello per streamer

      19/02/2026

      Sonos Play: lo speaker portatile che Sonos stava aspettando

      20/04/2026
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      24/03/2026

      Pebble X Plus: speakers 2.1 da scrivania con subwoofer

      09/02/2026

      JBL Boombox 4: speaker Bluetooth con AI e USB-C lossless

      23/01/2026

      Claude Mythos, il modello AI che non doveva uscire allo scoperto

      22/04/2026

      ChatGPT Images 2.0: OpenAI rilancia la generazione visiva

      22/04/2026
      Roomote

      Da Roo Code a Roomote: 3 milioni di installazioni non hanno impedito un cambio di rotta

      22/04/2026

      GitHub Copilot sospende le iscrizioni per i costi degli agenti

      21/04/2026
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      24/03/2026
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      nubia z60 ultra

      Offerte Black Friday Nubia: telefoni premium a prezzi convenienti

      22/11/2024
      Scream Fest 2024

      Steam Scream Fest 2024: sconti horror per Halloween

      29/10/2024
      Roomote

      Da Roo Code a Roomote: 3 milioni di installazioni non hanno impedito un cambio di rotta

      22/04/2026

      Thunderbolt è il nuovo client AI open source di Mozilla per le aziende

      16/04/2026
      davinci resolve 21

      DaVinci Resolve 21: il software di editing video decide di competere con Adobe Lightroom

      14/04/2026

      Vivaldi per Android: arriva il lettore PDF nativo

      13/04/2026

      Claude Mythos, il modello AI che non doveva uscire allo scoperto

      22/04/2026

      RingConn Gen 2 Air, smart ring economico che non si sente sul dito

      22/04/2026

      ChatGPT Images 2.0: OpenAI rilancia la generazione visiva

      22/04/2026
      Roomote

      Da Roo Code a Roomote: 3 milioni di installazioni non hanno impedito un cambio di rotta

      22/04/2026
    • Mobiles
      1. Smartphones
      2. View All
      POCO M8 5G

      Il POCO M8 5G con display AMOLED da 3200 nits cambia le aspettative sulla fascia entry

      10/04/2026

      OPPO Reno13 Pro, il mid-range con ambizioni da flagship

      01/04/2026

      Samsung Galaxy A57 5G: il mid-range sottile, solido e duraturo

      27/03/2026

      OPPO Find X9 e X9 Pro: la gamma Find X ridefinisce l’autonomia dei flagship Android

      26/03/2026
      Galaxy Tab S10 FE

      Da Samsung due valide alternative all’ iPad, Galaxy Tab S10 FE e S10 FE+

      10/03/2026
      OPPO Pad SE

      OPPO Pad SE: tablet economico con autonomia record e corpo in alluminio

      09/03/2026

      Poco Pad, un tablet economico con schermo grande e buona autonomia

      09/03/2026
      MatePad Pro 12.2

      Il MatePad Pro 12.2 di Huawei convince su display e ricarica lampo

      05/03/2026
    • Musica
      1. Cuffie
      2. DAC
      3. hi-fi
      4. Teoria
      5. View All

      Apple AirPods Max 2: sei anni di attesa per un aggiornamento che (quasi) vale il prezzo

      15/04/2026
      FiiO EH130

      FiiO EH13: cuffie Bluetooth con ANC, LDAC e doppio DAC

      09/04/2026

      Soundcore AeroFit 2 Pro: un concept nuovo in un mercato TWS già affollato

      03/04/2026
      FreeBuds Pro 5

      Huawei FreeBuds Pro 5: auricolari senza compromessi

      02/04/2026
      Eversolo Play

      Eversolo Play: il tuttofare hi-fi per chi vuole meno cavi e più musica

      03/12/2025
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      FiiO BTR15

      FiiO BTR15: DAC Bluetooth al prezzo più basso di sempre

      17/05/2025
      DAC ADI-2 DAC FS

      Cosa è un DAC audio

      26/10/2024
      Eversolo Play

      Eversolo Play: il tuttofare hi-fi per chi vuole meno cavi e più musica

      03/12/2025
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      Focal Aria 926

      Componenti per un ottimo impianto stereo

      31/07/2024

      Garmin acquista JL Audio

      16/08/2023
      truffa phishing zalando

      Truffa phishing: in regalo la gift card Zalando da 150€

      06/12/2024
      sim ed esim

      Differenza tra SIM fisica ed eSIM: vantaggi e sicurezza

      02/11/2024

      Malware: cosa sono e come difendersi

      19/10/2024
      crittografia a cosa serve

      Crittografia, come funziona e perchè dobbiamo utilizzarla

      16/10/2024

      Apple AirPods Max 2: sei anni di attesa per un aggiornamento che (quasi) vale il prezzo

      15/04/2026
      FiiO EH130

      FiiO EH13: cuffie Bluetooth con ANC, LDAC e doppio DAC

      09/04/2026

      Soundcore AeroFit 2 Pro: un concept nuovo in un mercato TWS già affollato

      03/04/2026
      FreeBuds Pro 5

      Huawei FreeBuds Pro 5: auricolari senza compromessi

      02/04/2026
    • Lifestyle
      1. Criptovalute
      2. EV
      3. Gaming
      4. Trekking
      5. Scienze
      6. View All
      Alpha Arena : trading ai bot

      Alpha Arena : sfida tra modelli AI nel trading di criptovalute

      20/10/2025
      Coinbase

      Coinbase colpita da attacco informatico e minaccia di riscatto

      15/05/2025
      coinbase

      Coinbase : acquisti cripto tramite Apple Pay

      03/12/2024
      criptovalute

      Criptovalute: cosa sono e come funzionano le monete virtuali

      19/10/2024
      tesla

      Tesla dice addio a Model S e Model X ma accelera sugli EV autonomi e i robot umanoidi

      29/01/2026
      Volvo EX60

      Volvo EX60: la sfida scandinava al dominio tedesco degli elettrici premium

      22/01/2026
      CATL sodium ion

      CATL annuncia la produzione di massa delle batterie agli ioni di sodio nel 2026

      30/12/2025
      Geely Xingyuan

      Auto elettriche: settembre 2025 segna un record con 2,1 milioni di unità vendute

      15/10/2025
      the stone of madness

      The Stone of Madness, fuga da un monastero inquisitoriale del Settecento

      16/04/2026
      Clone Drone in the Danger Zone

      Clone Drone in the Danger Zone mette alla prova riflessi e strategia

      02/04/2026
      Havendock

      Havendock in regalo su Epic Games

      26/03/2026
      Electrician Simulator

      Come funziona Electrician Simulator, il simulatore di elettricista

      19/03/2026
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      8a Scarpinata della Teverina

      A spasso per i sentieri: 8a Scarpinata della Teverina

      14/05/2024
      Valli e Calanchi

      A spasso per i sentieri: 1a Valli e Calanchi

      27/09/2023
      Maternum Marathon 2023

      A spasso per i sentieri: la 2a edizione di Maternum Marathon

      13/06/2023
      urano

      Le lune esterne di Urano Titania e Oberon, sono scure sul lato anteriore.

      19/06/2025
      Muon g-2

      L’anomalia Muon g-2 segue le leggi del Modello Standard

      13/06/2025
      Neuroplatform finalspark

      Neuroplatform, piattaforma online alimentata dal primo processore biologico al mondo

      27/05/2024
      AlphaFold 3 di Google DeepMind

      AlphaFold 3 di Google DeepMind

      08/05/2024
      tesla

      Tesla dice addio a Model S e Model X ma accelera sugli EV autonomi e i robot umanoidi

      29/01/2026
      Volvo EX60

      Volvo EX60: la sfida scandinava al dominio tedesco degli elettrici premium

      22/01/2026
      CATL sodium ion

      CATL annuncia la produzione di massa delle batterie agli ioni di sodio nel 2026

      30/12/2025
      Skechers

      Skechers GO RUN Elevate 2.0, scarpe per bambini con AirTag

      21/11/2025
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    Home»Tech»Intelligenza artificiale»OpenAI presenta i modelli o3 e o3 mini
    Intelligenza artificiale

    OpenAI presenta i modelli o3 e o3 mini

    All'OpenAI Day 12, Sam Altman ha svelato i modelli di ragionamento di nuova generazione dell'azienda: o3 e o3 mini. Ridefiniscono i parametri di riferimento dell'intelligenza artificiale.
    GrazianoGraziano21/12/2024Updated:21/12/202436
    Share Twitter WhatsApp Bluesky Threads
    OpenAI Imodello o3

    Ieri durante il docidesimo ed ultimo giorno del suo evento speciale “12 Days of OpenAI”, Sam Altman, ha introdotto due nuovi modelli di “ragionamento” IA o3 e o3 mini; ovvero le versioni successive di o1 e o1 mini. Invece di seguire una nomenclatura sequenziale prevedibile, OpenAI ha saltato o2 a causa di un potenziale conflitto di copyright con il marchio O2; un noto fornitore di servizi di telecomunicazioni britannico.

    OpenAI Imodello o3

    OpenAI svela o3 e o3 mini

    Come in o1 e o1 mini, o3 è il modello principale con ampie capacità; invece o3 mini, è una versione più compatta e veloce ma altrettanto abile. È importante notare che questi nuovi modelli o3 non saranno immediatamente disponibili al pubblico. OpenAI ha delineato un piano per renderli accessibili inizialmente per test di sicurezza pubblici.

    Questo approccio prudente sottolinea l’importanza che OpenAI attribuisce alla sicurezza man mano che i suoi modelli acquisiscono maggiore competenza. OpenAI ha aperto l’accesso a ricercatori esterni che desiderano contribuire al processo di test.

    Sam Altam ha promesso il rilascio pubblico di o3 mini per fine gennaio e o3 subito dopo. Nel video di presentazione ha espresso entusiasmo nel mostrare le potenzialità di questi modelli e ha mostrato dimostrazioni e benchmark per evidenziarne le capacità.

    Abilità tecniche di o3

    Il modello o3 dimostra una notevole competenza in una serie di benchmark tecnici complessi; in particolare in compiti che coinvolgono la programmazione e la matematica. Nei benchmark di programmazione, come il “sweet bench verified”, che valuta le prestazioni su attività di sviluppo software reali, o3 raggiunge un’accuratezza del 71,7%.

    Questo risultato supera di oltre il 20% le prestazioni dei modelli o1; evidenzia un progresso sostanziale nella capacità del modello di affrontare sfide di codifica complesse. Nel contesto della programmazione competitiva, dove i modelli vengono valutati in base alla loro capacità di risolvere problemi algoritmici in competizioni come “code forces”, o3 ha ottenuto un punteggio ELO di circa 2727 nelle impostazioni di calcolo con tempi di test elevati e aggressivi.

    Questo dato è particolarmente degno di nota se confrontato con i punteggi ottenuti da programmatori competitivi umani esperti. Anche in ambito matematico, o3 mostra abilità eccezionali. Nei benchmark di matematica competitiva, il modello raggiunge un’accuratezza del 96,7% nel test Amy, rispetto all’83,3% del modello o1. Questo livello di precisione indica che o3 spesso sbaglia solo una domanda nei test per l’Olimpiade matematica statunitense.

    o3 nei test scientifici

    Le prestazioni di o3 sono altrettanto notevoli in benchmark scientifici di livello di dottorato. Per esempio, nel gpq Diamond ottiene un punteggio dell’87,7%. Questo valore è superiore di circa il 10% rispetto alle prestazioni del modello o1 e supera il tipico punteggio del 70% ottenuto da esperti con dottorato di ricerca nel loro campo.

    o3 è stato testato anche con il benchmark Epic AI Frontier Math; un benchmark creato appositamente per testare a fondo modelli IA. Presenta problemi inediti e particolarmente complessi che richiedono ore o addirittura giorni per essere risolti da matematici professionisti.

    Attualmente, i migliori modelli IA raggiungono un’accuratezza pari al 2% su questo benchmark. o3, con impostazioni di test aggressive, è stato in grado di superare il 25%.

    Il traguardo di o3 nel benchmark Arc AGI

    Un momento saliente del video è stata la discussione sul benchmark Arc Artificial General Intelligence (AGI); è considerato un test fondamentale per l’intelligenza artificiale generale. Creato nel 2019, Arc AGI ha resistito come una sfida irrisolta per cinque anni.

    Il benchmark Arc AGI si concentra sulla capacità di un sistema di comprendere e applicare principi di trasformazione attraverso esempi. Ai partecipanti vengono presentati set di input-output e il compito è dedurre la regola sottostante e applicarla per completare un output incompleto.

    Questi compiti, pur essendo intuitivi per gli esseri umani, si sono dimostrati sorprendentemente difficili per i sistemi di intelligenza artificiale. La difficoltà di Arc AGI risiede nel fatto che ogni compito richiede un insieme distinto di abilità. Inoltre, impedisce ai modelli di fare affidamento su schemi memorizzati in fase di apprendimento. La versione 1 di Arc AGI ha visto progressi lenti; passando dallo 0% al 5% di accuratezza in cinque anni con i principali modelli di IA.

    Tuttavia, o3 ha ottenuto un nuovo punteggio all’avanguardia del 75,7% sul set di holdout semi-privato di Arc AI con risorse computazionali limitate. Ancora più notevole è che, aumentando le risorse computazionali per o3, il modello ha raggiunto un punteggio dell’85,7%.

    Questo risultato è particolarmente significativo perché le prestazioni umane su questo benchmark sono comparabili a una soglia dell’85%. Superare questa soglia seppure di pochissimo indica che o3 ha dimostrato una sorta di capacità di ragionamento a livello umano; un risultato senza precedenti per qualsiasi sistema di intelligenza artificiale testato finora.

    Impegno per la sicurezza e l’accessibilità di OpenAI

    Mentre i punteggi ottenuti da o3 nei vari benchmark sono entusiasmanti, OpenAI riconosce che il lavoro nello sviluppo di un’intelligenza artificiale sicura e affidabile è tutt’altro che completo. L’azienda sottolinea la necessità di benchmark più completi e duraturi, come Arc AGI, per misurare e guidare il progresso. Inoltre, OpenAI ha espresso il suo entusiasmo per la collaborazione con entità esterne per sviluppare benchmark di prossima generazione.

    Inoltre, OpenAI sta lavorando a una nuova tecnica chiamata allineamento deliberativo per migliorare ulteriormente la sicurezza dei suoi modelli. Questo metodo sfrutta le capacità di ragionamento dei modelli stessi per identificare e prevenire potenziali prompt non sicuri; un progresso nello sviluppo di sistemi di intelligenza artificiale più sicuri e affidabili.

    o3 mini

    Parallelamente allo sviluppo del modello o3, OpenAI ha presentato anche o3 mini; un modello di ragionamento efficiente in termini di costi che si unisce alla famiglia o1 mini. o3 mini si distingue per la sua capacità di fornire buone prestazioni a un costo inferiore. Come il modello o3, la versione mini non sarà immediatamente accessibile a tutti. OpenAI sta aprendo l’accesso a o3 mini a ricercatori sulla sicurezza per i test. I ricercatori interessati possono candidarsi tramite un modulo sul sito Web di OpenAI. Le domande si chiuderanno il 10 gennaio.

    Una nuova funzionalità, denominata “tempo di pensiero adattivo” nell’API, consentirà di regolare il tempo dedicato dal modello al ragionamento; offre flessibilità per diversi casi d’uso. Le valutazioni iniziali di o3 mini mostrano risultati promettenti nei benchmark di codifica, con prestazioni che migliorano con tempi di pensiero più lunghi e che superano il modello o1 mini con tempi di pensiero medi. In termini di costi ed efficienza, o3 mini definisce una nuova frontiera. Offre prestazioni di codifica comparabili o migliori a un costo inferiore rispetto a o1 mini.

    Una dimostrazione pratica ha evidenziato la capacità di o3 mini di generare ed eseguire codice Python, inclusa la creazione di un server e di un’interfaccia utente per attività di programmazione interattive. o3 mini dimostra anche competenza in matematica; ottiene prestazioni comparabili a o1 mini con tempi di elaborazione ridotti e prestazioni migliori con tempi di elaborazione medi.

    OpenAI Day 12: conclusione

    Sam Altam ha voluto concludere l’evento speciale “12 Days of OpenAI” con la dimostrazione di due modelli IA non ancora disponibili al pubblico, o3 e o3mini.

    Ne ha evidenziato le prestazioni eccezionali su benchmark impegnativi come Epic AI Frontier Math e Arc AGI; un chiaro segnale dei crescenti livelli di sofisticazione raggiunti da questi sistemi. Il raggiungimento di prestazioni a livello umano sul benchmark Arc AGI in contesti di calcolo elevato è un risultato particolarmente degno di nota. Sottolinea il potenziale di questi modelli per affrontare compiti complessi che richiedono capacità di ragionamento avanzate.

    L’annuncio di o3 e o3 mini segnala una fase promettente nello sviluppo dell’intelligenza artificiale, caratterizzata da progressi significativi nelle capacità di ragionamento e da un continuo impegno per la sicurezza e la collaborazione.

    AI app apps blog canvas ChatGPT LLM news o1 o2 o3 o3mini OpenAI picks tech tecnologia warp xcode
    Previous ArticleAnker MagGo 3-in-1: stazione di ricarica wireless Qi2
    Next Article TerraTech è in regalo su Epic Games
    Avatar photo
    Graziano
    • Website

    Ho visto l'informatica nascere con il C64 e oggi seguo con lo stesso entusiasmo l'evoluzione verso mini PC e desktop SFF. Fuori dal lavoro, le mie passioni sono i film, il trekking, la bici e la corsa. Ma non disdegno una sessione di gaming o programmazione!

    Articoli collegati

    Intelligenza artificiale

    Claude Mythos, il modello AI che non doveva uscire allo scoperto

    22/04/2026
    Intelligenza artificiale

    ChatGPT Images 2.0: OpenAI rilancia la generazione visiva

    22/04/2026
    Roomote
    Intelligenza artificiale

    Da Roo Code a Roomote: 3 milioni di installazioni non hanno impedito un cambio di rotta

    22/04/2026
    Add A Comment
    Leave A Reply Cancel Reply

    Ultimi articoli

    Claude Mythos, il modello AI che non doveva uscire allo scoperto

    22/04/2026

    RingConn Gen 2 Air, smart ring economico che non si sente sul dito

    22/04/2026

    ChatGPT Images 2.0: OpenAI rilancia la generazione visiva

    22/04/2026
    Roomote

    Da Roo Code a Roomote: 3 milioni di installazioni non hanno impedito un cambio di rotta

    22/04/2026
    Mozilla Firefox 150

    Con Firefox 150, Mozilla porta più controllo, più strumenti, più integrazione nativa

    21/04/2026

    GitHub Copilot sospende le iscrizioni per i costi degli agenti

    21/04/2026
    Gomoot : tecnologia e lifestyle
    X (Twitter) Bluesky WhatsApp Threads Mastodon
    • Home
    • Tech
    • Mobiles
    • Contatti
    • Privacy
    • ABOUT
    © 2026 GOMOOT.COM

    Type above and press Enter to search. Press Esc to cancel.