Close Menu
    Ultimi Articoli
    sleepFM

    Il modello AI SleepFM interpreta il sonno e predice le malattie

    07/01/2026
    SmartPower HDR

    Samsung Display e Intel riducono i consumi degli OLED con SmartPower HDR

    07/01/2026
    Galaxy Tab A11+

    Samsung Galaxy Tab A11+: finalmente la serie A permette il gaming

    05/01/2026265 Views
    HyperX Cloud III

    HyperX Cloud III: comfort superiore e qualità audio a meno di 100 euro

    04/01/2026
    GameSir G8 Galileo

    GameSir G8 Galileo, una console gaming per Android e iPhone ora al prezzo più basso di sempre

    04/01/202666 Views
    Redmi Watch 5 Active

    Redmi Watch 5 Active: lo smartwatch economico di Xiaomi

    04/01/202671 Views
    Moondrop Space Travel

    Moondrop Space Travel, auricolari TWS con ANC e buon suono a meno di 50 euro

    03/01/2026133 Views
    Amazfit T-Rex 3

    Amazfit T-Rex 3: lo smartwatch robusto ed economico

    03/01/2026149 Views
    giovedì, Gennaio 8
    Trending
    • Il modello AI SleepFM interpreta il sonno e predice le malattie
    • Samsung Display e Intel riducono i consumi degli OLED con SmartPower HDR
    • Samsung Galaxy Tab A11+: finalmente la serie A permette il gaming
    • HyperX Cloud III: comfort superiore e qualità audio a meno di 100 euro
    • GameSir G8 Galileo, una console gaming per Android e iPhone ora al prezzo più basso di sempre
    • Redmi Watch 5 Active: lo smartwatch economico di Xiaomi
    • Moondrop Space Travel, auricolari TWS con ANC e buon suono a meno di 50 euro
    • Amazfit T-Rex 3: lo smartwatch robusto ed economico
    Login
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    • Home
    • Computer
      1. MINI PC
      2. Laptop
      3. Monitor
      4. Teoria
      5. Mouse
      6. GPU
      7. Windows
      8. Motherboard
      9. Tastiere
      10. View All
      GMKtec NucBox K11

      GMKtec NucBox K11, una soluzione completa per produttività e intrattenimento

      20/12/2025

      Minisforum X1 Lite-255: un mini pc con Ryzen 7 255 e Oculink su M.2

      24/11/2025
      ACEMAGICIAN S3A

      ACEMAGICIAN S3A: un mini pc per il gaming ma non solo

      11/11/2025
      GMKtec NucBox K10

      GMKtec NucBox K10: mini PC Intel i9 per produttività e multimedia

      04/11/2025
      Lenovo Chromebook Duet 11

      Lenovo Chromebook Duet 11, un versatile 2-in-1 con 10 anni di aggiornamenti

      24/12/2025
      Legion 5 15IRX10

      Lenovo Legion 5 15IRX10, potenza da workstation e versatilità gaming

      13/10/2025
      Lenovo Yoga Slim 7

      Potenza e autonomia si muovono insieme sul Lenovo Yoga Slim 7

      26/09/2025
      Dell Inspiron 16

      Dell Inspiron 16 5645: un notebook elegante, potente e versatile al prezzo giusto

      27/07/2025
      Asus VA279QG

      ASUS VA279QG, monitor 27″ per lavoro, svago e gaming

      31/12/2025
      KTC H32S25E

      KTC H32S25E: monitor curvo 32” QHD per il gaming, alte prestazioni e prezzo contenuto

      28/12/2025

      Philips Evnia 32M2N8900: monitor QD-OLED 4K per gamer esigenti

      24/12/2025
      Alienware AW2725DF

      Alienware AW2725DF: monitor gaming QD-OLED da 27 pollici

      21/12/2025
      Bluetooth 6.1

      Bluetooth 6.1: più privacy e autonomia per i dispositivi wireless

      12/05/2025
      ASUS ProArt Z790

      Evoluzione del bus di sistema PCIe fino al PCIe 7

      16/04/2025
      USB

      USB : l’evoluzione di Universal Serial Bus dagli anni 90 ad oggi

      02/02/2025
      bluetooth

      L’evoluzione del Bluetooth: un viaggio attraverso le versioni fino al 6.2

      13/11/2024
      Mouse NZXT Lift 2

      Mouse NZXT Lift 2, mouse filare ultraleggero e preciso

      21/12/2025
      MX Master 4

      Logitech MX Master 4, feedback aptico e design migliorato

      20/12/2025
      Burst II Air

      Turtle Beach Burst II Air wireless, un mouse gaming di soli 47 gr!

      15/06/2025
      Scimitar Elite Wireless SE

      Corsair Scimitar Elite Wireless SE: un mouse pensato per chi ha bisogno di controllare tutto

      04/06/2025
      OptiScaler

      OptiScaler, cos’è e come attivarlo nei giochi

      03/01/2026
      HBM4E

      Samsung con HBM4E punta a 3.25TB/s entro il 2027, oltre le specifiche JEDEC

      15/10/2025
      OpenAI AMD

      AMD e OpenAI: alleanza strategica da miliardi di dollari

      06/10/2025
      pcie 250watt

      Asus alimenta una RTX 5060 Ti da 250 W su uno slot PCIe potenziato

      23/09/2025
      mu language model

      Mu, un motore AI per gestire le impostazioni di Windows 11

      27/12/2025
      windows 11

      Windows 11 : nuove strategie di resilienza e strumenti di ripristino

      19/11/2025
      Copilot

      Windows 11 si trasforma con Copilot Voice, Vision e Actions

      17/10/2025
      Windows 11 25H2

      Microsoft rilascia Windows 11 25H2 con focus sulla sicurezza

      01/10/2025
      pcie 250watt

      Asus alimenta una RTX 5060 Ti da 250 W su uno slot PCIe potenziato

      23/09/2025
      ROG Strix B860-A Gaming

      Asus ROG Strix B860-A Gaming WiFi, motherboard per build ad alte prestazioni.

      10/08/2025
      MSI MAG Z890 Tomahawk WiFi

      MSI MAG Z890 Tomahawk WiFi: scheda madre top per Intel Ultra

      12/06/2025
      CVN Z790D5

      Colorful presenta la nuova mobo gaming CVN Z790D5 ARK FROZEN

      22/08/2024
      Epomaker HE75 Mag

      Tastiera magnetica Epomaker HE75 Mag: la scelta giusta per chi pretende il massimo spendendo poco

      23/11/2025
      Signature Slim Solar+ K980

      Logitech Signature Slim Solar+ K980: la tastiera che si ricarica con la luce

      24/09/2025
      Keys-To-Go 2

      Logitech Keys-To-Go 2: tastiera wireless per laptop, tablet e smartphone

      14/06/2025
      Logitech G515 TKL

      Logitech G515: tastiera gaming TKL sottile e versatile a prezzo accessibile

      04/06/2025
      OptiScaler

      OptiScaler, cos’è e come attivarlo nei giochi

      03/01/2026
      linux steam

      Linux gaming al 3% su Steam: il ruolo di AMD e Steam Deck

      02/01/2026
      Asus VA279QG

      ASUS VA279QG, monitor 27″ per lavoro, svago e gaming

      31/12/2025
      KTC H32S25E

      KTC H32S25E: monitor curvo 32” QHD per il gaming, alte prestazioni e prezzo contenuto

      28/12/2025
    • Tech
      1. Curiosità
      2. Eventi
      3. memory cards
      4. Powerbank
      5. Smartwatch
      6. Gadgets
      7. Bluetooth speakers
      8. Intelligenza artificiale
      9. Offerte
      10. Software
      11. View All

      Starlink abbassa i satelliti per sicurezza orbitale

      02/01/2026

      Con Nano Banana, Gemini supera ChatGPT tra le app AI

      17/09/2025
      grotta lunare

      Scoperta una grotta lunare sotterranea

      16/07/2024
      Oleg Kononenko

      Oleg Kononenko: 1000 giorni nello spazio

      05/06/2024
      BYD YangWang U9 Extreme

      BYD YangWang U9 Extreme: il nuovo re della velocità tra le auto di serie

      24/09/2025
      Awe Dropping Apple

      Awe Dropping del 9 settembre 2025, Apple svela il suo futuro

      09/09/2025
      Starship Flight 10

      SpaceX Starship Flight 10: il ritorno del gigante spaziale

      27/08/2025
      Made by Google 2025

      Tutto pronto per il Made by Google 2025: il 20 agosto debutta la nuova generazione Pixel

      18/08/2025
      SSD Crucial P310 2TB

      Crucial P310 2TB SSD NVMe: storage ad alta velocità a un ottimo prezzo

      08/06/2025
      V-NAND QLC Samsung

      Il futuro dello storage è pronto: Samsung svela la V-NAND QLC da 1 Tb

      12/09/2024
      microSD SD Express

      Samsung presenta la prima microSD SD Express

      07/03/2024

      ADATA lancia il primo SSD esterno USB4 SE920

      31/10/2023
      power bank

      Power Bank cablati e wireless Qi2 : guida all’acquisto

      28/11/2025

      Anker Nano Power Bank 5K, il caricatore più sottile con MagSafe e Qi2

      26/09/2025
      Sharge ICEMAG 2

      Sharge ICEMAG 2: power bank Qi2 15W con raffreddamento attivo

      12/05/2025
      Baseus Nomos

      Baseus Nomos Power Bank: ricarica wireless veloce e sicura

      11/05/2025
      Redmi Watch 5 Active

      Redmi Watch 5 Active: lo smartwatch economico di Xiaomi

      04/01/2026
      Amazfit T-Rex 3

      Amazfit T-Rex 3: lo smartwatch robusto ed economico

      03/01/2026
      Amazfit Bip 6

      Amazfit Bip 6: autonomia, salute e sport a basso prezzo

      01/01/2026

      Amazfit Active Max, lo smartwatch sportivo di fascia media

      30/12/2025
      GameSir G8 Galileo

      GameSir G8 Galileo, una console gaming per Android e iPhone ora al prezzo più basso di sempre

      04/01/2026
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      31/12/2025
      Chipolo Pop

      Chipolo Pop, il miglior tracker Bluetooth compatibile con Find My e Find Hub

      28/12/2025
      MiLi MiTag Go

      MiLi MiTag Go: il tracker Android con privacy garantita

      27/12/2025
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      31/12/2025
      Beats Pill

      Beats Pill (2024): altoparlante Bluetooth compatto e resistente

      25/12/2025

      JBL Flip 7, lo speaker Bluetooth portatile solido e versatile

      25/12/2025

      Sony ULT Field 1 speaker Bluetooth compatto e versatile

      19/12/2025
      sleepFM

      Il modello AI SleepFM interpreta il sonno e predice le malattie

      07/01/2026
      meta manus

      Meta acquisisce la startup Manus per 2 miliardi di dollari

      31/12/2025
      nitrogen

      NitroGen: il modello AI per il gaming costruito dai video degli streamer

      29/12/2025
      mu language model

      Mu, un motore AI per gestire le impostazioni di Windows 11

      27/12/2025
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      31/12/2025
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      nubia z60 ultra

      Offerte Black Friday Nubia: telefoni premium a prezzi convenienti

      22/11/2024
      Scream Fest 2024

      Steam Scream Fest 2024: sconti horror per Halloween

      29/10/2024

      GStreamer 1.26.10 migliora Flac, Opus, Matroska e streaming adattativo

      29/12/2025
      OpenShot 3.4

      OpenShot 3.4: prestazioni migliorate e nuovi strumenti creativi per l’editing video

      16/12/2025

      Google lancia Emergency Live Video per chiamate d’emergenza

      11/12/2025
      HDMI 2.1

      HDMI 2.1 sulla Steam Machine esiste ma è nascosto

      08/12/2025
      sleepFM

      Il modello AI SleepFM interpreta il sonno e predice le malattie

      07/01/2026
      SmartPower HDR

      Samsung Display e Intel riducono i consumi degli OLED con SmartPower HDR

      07/01/2026

      OPPO A5 Pro 5G, uno smartphone di fascia media completo ed equilibrato

      03/01/2026

      Starlink abbassa i satelliti per sicurezza orbitale

      02/01/2026
    • Mobiles
      1. Smartphones
      2. View All

      OPPO A5 Pro 5G, uno smartphone di fascia media completo ed equilibrato

      03/01/2026
      Galaxy A16 5G

      Samsung Galaxy A16 5G: un budget phone con aggiornamenti fino al 2030 !

      01/01/2026
      HMD skyline

      HMD Skyline: lo smartphone riparabile e con Qi2

      31/12/2025
      Blade GT

      DOOGEE Blade GT: un rugged fuori dagli schemi

      31/12/2025
      Galaxy Tab A11+

      Samsung Galaxy Tab A11+: finalmente la serie A permette il gaming

      05/01/2026
      DOOGEE Tab E3 Max

      DOOGEE Tab E3 Max: un maxi-tablet pensato per multimedia e intrattenimento

      01/01/2026
      KOBO Clara Colour

      Kobo Clara Colour: eReader 6″ a colori per le tue letture estive, con Wi-Fi e audio

      29/12/2025
      Exynos 2600

      Samsung Exynos 2600: il primo processore mobile a 2nm è ufficiale

      19/12/2025
    • Musica
      1. Cuffie
      2. DAC
      3. hi-fi
      4. Teoria
      5. View All
      Moondrop Space Travel

      Moondrop Space Travel, auricolari TWS con ANC e buon suono a meno di 50 euro

      03/01/2026
      EarFun Wave Pro

      EarFun Wave Pro, cuffie over-ear wireless

      01/01/2026
      Xiaomi Buds 5

      Xiaomi Buds 5: nuovo riferimento per gli auricolari TWS di fascia media

      31/12/2025
      Studio Max 1

      OneOdio Studio Max 1: cuffie wireless per DJ, studio e uso quotidiano

      30/12/2025
      Eversolo Play

      Eversolo Play: il tuttofare hi-fi per chi vuole meno cavi e più musica

      03/12/2025
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      FiiO BTR15

      FiiO BTR15: DAC Bluetooth al prezzo più basso di sempre

      17/05/2025
      DAC ADI-2 DAC FS

      Cosa è un DAC audio

      26/10/2024
      Eversolo Play

      Eversolo Play: il tuttofare hi-fi per chi vuole meno cavi e più musica

      03/12/2025
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      Focal Aria 926

      Componenti per un ottimo impianto stereo

      31/07/2024

      Garmin acquista JL Audio

      16/08/2023
      truffa phishing zalando

      Truffa phishing: in regalo la gift card Zalando da 150€

      06/12/2024
      sim ed esim

      Differenza tra SIM fisica ed eSIM: vantaggi e sicurezza

      02/11/2024

      Malware: cosa sono e come difendersi

      19/10/2024
      crittografia a cosa serve

      Crittografia, come funziona e perchè dobbiamo utilizzarla

      16/10/2024
      Moondrop Space Travel

      Moondrop Space Travel, auricolari TWS con ANC e buon suono a meno di 50 euro

      03/01/2026
      EarFun Wave Pro

      EarFun Wave Pro, cuffie over-ear wireless

      01/01/2026
      Xiaomi Buds 5

      Xiaomi Buds 5: nuovo riferimento per gli auricolari TWS di fascia media

      31/12/2025
      Studio Max 1

      OneOdio Studio Max 1: cuffie wireless per DJ, studio e uso quotidiano

      30/12/2025
    • Lifestyle
      1. Criptovalute
      2. EV
      3. Gaming
      4. Trekking
      5. Scienze
      6. View All
      Alpha Arena : trading ai bot

      Alpha Arena : sfida tra modelli AI nel trading di criptovalute

      20/10/2025
      Coinbase

      Coinbase colpita da attacco informatico e minaccia di riscatto

      15/05/2025
      coinbase

      Coinbase : acquisti cripto tramite Apple Pay

      03/12/2024
      criptovalute

      Criptovalute: cosa sono e come funzionano le monete virtuali

      19/10/2024
      CATL sodium ion

      CATL annuncia la produzione di massa delle batterie agli ioni di sodio nel 2026

      30/12/2025
      Geely Xingyuan

      Auto elettriche: settembre 2025 segna un record con 2,1 milioni di unità vendute

      15/10/2025
      BYD YangWang U9 Extreme

      BYD YangWang U9 Extreme: il nuovo re della velocità tra le auto di serie

      24/09/2025
      Volkswagen ID.1

      Volkswagen ID.1: l’auto elettrica da 20000 euro arriva nel 2027

      05/02/2025
      HyperX Cloud III

      HyperX Cloud III: comfort superiore e qualità audio a meno di 100 euro

      04/01/2026
      GOG

      GOG lascia CD PROJEKT: Michał Kiciński riporta la piattaforma DRM-free alle sue radici indie

      30/12/2025
      Bloodstained: Ritual of the Night

      Bloodstained: Ritual of the Night in regalo su Epic Games

      23/12/2025
      paradise killer

      Paradise Killer in regalo su Epic Games

      22/12/2025
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      8a Scarpinata della Teverina

      A spasso per i sentieri: 8a Scarpinata della Teverina

      14/05/2024
      Valli e Calanchi

      A spasso per i sentieri: 1a Valli e Calanchi

      27/09/2023
      Maternum Marathon 2023

      A spasso per i sentieri: la 2a edizione di Maternum Marathon

      13/06/2023
      urano

      Le lune esterne di Urano Titania e Oberon, sono scure sul lato anteriore.

      19/06/2025
      Muon g-2

      L’anomalia Muon g-2 segue le leggi del Modello Standard

      13/06/2025
      Neuroplatform finalspark

      Neuroplatform, piattaforma online alimentata dal primo processore biologico al mondo

      27/05/2024
      AlphaFold 3 di Google DeepMind

      AlphaFold 3 di Google DeepMind

      08/05/2024
      CATL sodium ion

      CATL annuncia la produzione di massa delle batterie agli ioni di sodio nel 2026

      30/12/2025
      Skechers

      Skechers GO RUN Elevate 2.0, scarpe per bambini con AirTag

      21/11/2025
      hallowen 2025

      Halloween 2025: la nostra selezione di film horror da vedere

      30/10/2025
      A House of Dynamite

      A House of Dynamite: il thriller di Kathryn Bigelow che divide e inquieta

      28/10/2025
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    Home»Tech»Intelligenza artificiale»OpenAI presenta i modelli o3 e o3 mini
    Intelligenza artificiale

    OpenAI presenta i modelli o3 e o3 mini

    All'OpenAI Day 12, Sam Altman ha svelato i modelli di ragionamento di nuova generazione dell'azienda: o3 e o3 mini. Ridefiniscono i parametri di riferimento dell'intelligenza artificiale.
    GrazianoGraziano21/12/2024Updated:21/12/202407 Mins Read36 Views
    Share Twitter Facebook Pinterest Reddit Telegram WhatsApp Email
    OpenAI Imodello o3
    Share
    Facebook Twitter Pinterest Reddit Telegram WhatsApp Email Threads

    Ieri durante il docidesimo ed ultimo giorno del suo evento speciale “12 Days of OpenAI”, Sam Altman, ha introdotto due nuovi modelli di “ragionamento” IA o3 e o3 mini; ovvero le versioni successive di o1 e o1 mini. Invece di seguire una nomenclatura sequenziale prevedibile, OpenAI ha saltato o2 a causa di un potenziale conflitto di copyright con il marchio O2; un noto fornitore di servizi di telecomunicazioni britannico.

    OpenAI Imodello o3

    OpenAI svela o3 e o3 mini

    Come in o1 e o1 mini, o3 è il modello principale con ampie capacità; invece o3 mini, è una versione più compatta e veloce ma altrettanto abile. È importante notare che questi nuovi modelli o3 non saranno immediatamente disponibili al pubblico. OpenAI ha delineato un piano per renderli accessibili inizialmente per test di sicurezza pubblici.

    Questo approccio prudente sottolinea l’importanza che OpenAI attribuisce alla sicurezza man mano che i suoi modelli acquisiscono maggiore competenza. OpenAI ha aperto l’accesso a ricercatori esterni che desiderano contribuire al processo di test.

    Sam Altam ha promesso il rilascio pubblico di o3 mini per fine gennaio e o3 subito dopo. Nel video di presentazione ha espresso entusiasmo nel mostrare le potenzialità di questi modelli e ha mostrato dimostrazioni e benchmark per evidenziarne le capacità.

    Abilità tecniche di o3

    Il modello o3 dimostra una notevole competenza in una serie di benchmark tecnici complessi; in particolare in compiti che coinvolgono la programmazione e la matematica. Nei benchmark di programmazione, come il “sweet bench verified”, che valuta le prestazioni su attività di sviluppo software reali, o3 raggiunge un’accuratezza del 71,7%.

    Questo risultato supera di oltre il 20% le prestazioni dei modelli o1; evidenzia un progresso sostanziale nella capacità del modello di affrontare sfide di codifica complesse. Nel contesto della programmazione competitiva, dove i modelli vengono valutati in base alla loro capacità di risolvere problemi algoritmici in competizioni come “code forces”, o3 ha ottenuto un punteggio ELO di circa 2727 nelle impostazioni di calcolo con tempi di test elevati e aggressivi.

    Questo dato è particolarmente degno di nota se confrontato con i punteggi ottenuti da programmatori competitivi umani esperti. Anche in ambito matematico, o3 mostra abilità eccezionali. Nei benchmark di matematica competitiva, il modello raggiunge un’accuratezza del 96,7% nel test Amy, rispetto all’83,3% del modello o1. Questo livello di precisione indica che o3 spesso sbaglia solo una domanda nei test per l’Olimpiade matematica statunitense.

    o3 nei test scientifici

    Le prestazioni di o3 sono altrettanto notevoli in benchmark scientifici di livello di dottorato. Per esempio, nel gpq Diamond ottiene un punteggio dell’87,7%. Questo valore è superiore di circa il 10% rispetto alle prestazioni del modello o1 e supera il tipico punteggio del 70% ottenuto da esperti con dottorato di ricerca nel loro campo.

    o3 è stato testato anche con il benchmark Epic AI Frontier Math; un benchmark creato appositamente per testare a fondo modelli IA. Presenta problemi inediti e particolarmente complessi che richiedono ore o addirittura giorni per essere risolti da matematici professionisti.

    Attualmente, i migliori modelli IA raggiungono un’accuratezza pari al 2% su questo benchmark. o3, con impostazioni di test aggressive, è stato in grado di superare il 25%.

    Il traguardo di o3 nel benchmark Arc AGI

    Un momento saliente del video è stata la discussione sul benchmark Arc Artificial General Intelligence (AGI); è considerato un test fondamentale per l’intelligenza artificiale generale. Creato nel 2019, Arc AGI ha resistito come una sfida irrisolta per cinque anni.

    Il benchmark Arc AGI si concentra sulla capacità di un sistema di comprendere e applicare principi di trasformazione attraverso esempi. Ai partecipanti vengono presentati set di input-output e il compito è dedurre la regola sottostante e applicarla per completare un output incompleto.

    Questi compiti, pur essendo intuitivi per gli esseri umani, si sono dimostrati sorprendentemente difficili per i sistemi di intelligenza artificiale. La difficoltà di Arc AGI risiede nel fatto che ogni compito richiede un insieme distinto di abilità. Inoltre, impedisce ai modelli di fare affidamento su schemi memorizzati in fase di apprendimento. La versione 1 di Arc AGI ha visto progressi lenti; passando dallo 0% al 5% di accuratezza in cinque anni con i principali modelli di IA.

    Tuttavia, o3 ha ottenuto un nuovo punteggio all’avanguardia del 75,7% sul set di holdout semi-privato di Arc AI con risorse computazionali limitate. Ancora più notevole è che, aumentando le risorse computazionali per o3, il modello ha raggiunto un punteggio dell’85,7%.

    Questo risultato è particolarmente significativo perché le prestazioni umane su questo benchmark sono comparabili a una soglia dell’85%. Superare questa soglia seppure di pochissimo indica che o3 ha dimostrato una sorta di capacità di ragionamento a livello umano; un risultato senza precedenti per qualsiasi sistema di intelligenza artificiale testato finora.

    Impegno per la sicurezza e l’accessibilità di OpenAI

    Mentre i punteggi ottenuti da o3 nei vari benchmark sono entusiasmanti, OpenAI riconosce che il lavoro nello sviluppo di un’intelligenza artificiale sicura e affidabile è tutt’altro che completo. L’azienda sottolinea la necessità di benchmark più completi e duraturi, come Arc AGI, per misurare e guidare il progresso. Inoltre, OpenAI ha espresso il suo entusiasmo per la collaborazione con entità esterne per sviluppare benchmark di prossima generazione.

    Inoltre, OpenAI sta lavorando a una nuova tecnica chiamata allineamento deliberativo per migliorare ulteriormente la sicurezza dei suoi modelli. Questo metodo sfrutta le capacità di ragionamento dei modelli stessi per identificare e prevenire potenziali prompt non sicuri; un progresso nello sviluppo di sistemi di intelligenza artificiale più sicuri e affidabili.

    o3 mini

    Parallelamente allo sviluppo del modello o3, OpenAI ha presentato anche o3 mini; un modello di ragionamento efficiente in termini di costi che si unisce alla famiglia o1 mini. o3 mini si distingue per la sua capacità di fornire buone prestazioni a un costo inferiore. Come il modello o3, la versione mini non sarà immediatamente accessibile a tutti. OpenAI sta aprendo l’accesso a o3 mini a ricercatori sulla sicurezza per i test. I ricercatori interessati possono candidarsi tramite un modulo sul sito Web di OpenAI. Le domande si chiuderanno il 10 gennaio.

    Una nuova funzionalità, denominata “tempo di pensiero adattivo” nell’API, consentirà di regolare il tempo dedicato dal modello al ragionamento; offre flessibilità per diversi casi d’uso. Le valutazioni iniziali di o3 mini mostrano risultati promettenti nei benchmark di codifica, con prestazioni che migliorano con tempi di pensiero più lunghi e che superano il modello o1 mini con tempi di pensiero medi. In termini di costi ed efficienza, o3 mini definisce una nuova frontiera. Offre prestazioni di codifica comparabili o migliori a un costo inferiore rispetto a o1 mini.

    Una dimostrazione pratica ha evidenziato la capacità di o3 mini di generare ed eseguire codice Python, inclusa la creazione di un server e di un’interfaccia utente per attività di programmazione interattive. o3 mini dimostra anche competenza in matematica; ottiene prestazioni comparabili a o1 mini con tempi di elaborazione ridotti e prestazioni migliori con tempi di elaborazione medi.

    OpenAI Day 12: conclusione

    Sam Altam ha voluto concludere l’evento speciale “12 Days of OpenAI” con la dimostrazione di due modelli IA non ancora disponibili al pubblico, o3 e o3mini.

    Ne ha evidenziato le prestazioni eccezionali su benchmark impegnativi come Epic AI Frontier Math e Arc AGI; un chiaro segnale dei crescenti livelli di sofisticazione raggiunti da questi sistemi. Il raggiungimento di prestazioni a livello umano sul benchmark Arc AGI in contesti di calcolo elevato è un risultato particolarmente degno di nota. Sottolinea il potenziale di questi modelli per affrontare compiti complessi che richiedono capacità di ragionamento avanzate.

    L’annuncio di o3 e o3 mini segnala una fase promettente nello sviluppo dell’intelligenza artificiale, caratterizzata da progressi significativi nelle capacità di ragionamento e da un continuo impegno per la sicurezza e la collaborazione.

    AI app apps blog canvas ChatGPT LLM news o1 o2 o3 o3mini OpenAI picks tech tecnologia warp xcode
    Seguici su X (Twitter) Seguici su Bluesky Seguici su WhatsApp
    Share. Facebook Twitter Pinterest
    Previous ArticleAnker MagGo 3-in-1: stazione di ricarica wireless Qi2
    Next Article TerraTech è in regalo su Epic Games
    Avatar photo
    Graziano
    • Website

    Giornalista e recensore tech per Gomoot. Ho visto l'informatica nascere con il C64 e oggi seguo con lo stesso entusiasmo l'evoluzione verso mini PC e desktop SFF. Fuori dal lavoro, le mie passioni sono: i film, il trekking, la bici e la corsa. Ma non disdegno mai una buona sessione di gaming 🎮 o programmazione – è il mio modo per ricaricarmi !

    Articoli collegati

    sleepFM
    Intelligenza artificiale

    Il modello AI SleepFM interpreta il sonno e predice le malattie

    07/01/2026
    meta manus
    Intelligenza artificiale

    Meta acquisisce la startup Manus per 2 miliardi di dollari

    31/12/2025
    nitrogen
    Intelligenza artificiale

    NitroGen: il modello AI per il gaming costruito dai video degli streamer

    29/12/202523 Views
    Add A Comment
    Leave A Reply Cancel Reply

    Ultimi articoli
    sleepFM

    Il modello AI SleepFM interpreta il sonno e predice le malattie

    07/01/2026
    SmartPower HDR

    Samsung Display e Intel riducono i consumi degli OLED con SmartPower HDR

    07/01/2026
    Galaxy Tab A11+

    Samsung Galaxy Tab A11+: finalmente la serie A permette il gaming

    05/01/2026265 Views
    HyperX Cloud III

    HyperX Cloud III: comfort superiore e qualità audio a meno di 100 euro

    04/01/2026
    GameSir G8 Galileo

    GameSir G8 Galileo, una console gaming per Android e iPhone ora al prezzo più basso di sempre

    04/01/202666 Views
    Redmi Watch 5 Active

    Redmi Watch 5 Active: lo smartwatch economico di Xiaomi

    04/01/202671 Views
    Gomoot : tecnologia e lifestyle
    Mastodon WhatsApp X (Twitter) Instagram Threads
    • Home
    • Tech
    • Mobiles
    • Contatti
    • Privacy
    • ABOUT
    © 2026 GOMOOT.COM

    Type above and press Enter to search. Press Esc to cancel.

    Sign In or Register

    Welcome Back!

    Login to your account below.

    Continua con Google

    Lost password?