Close Menu
    Ultimi Articoli
    Oscars on YouTube

    YouTube in trattativa per trasmettere gli Oscar

    18/08/2025
    Eversolo Play

    Eversolo Play: il tuttofare hi-fi per chi vuole meno cavi e più musica

    18/08/2025
    Made by Google 2025

    Tutto pronto per il Made by Google 2025: il 20 agosto debutta la nuova generazione Pixel

    18/08/202547 Views
    Windows 11 24H2

    Windows 11 24H2 rende inutilizzabili SSD e HDD dopo l’aggiornamento

    18/08/202538 Views
    Totally Reliable Delivery Service

    Totally Reliable Delivery Service in regalo su Epic Games

    16/08/2025

    Kaisen Linux 3.0: l’ultima versione prima della chiusura

    14/08/2025

    Excel analizza le immagini con Python

    14/08/2025
    Hidden Folks

    Hidden Folks in regalo su Epic Games

    14/08/2025
    martedì, Agosto 19
    Trending
    • YouTube in trattativa per trasmettere gli Oscar
    • Eversolo Play: il tuttofare hi-fi per chi vuole meno cavi e più musica
    • Tutto pronto per il Made by Google 2025: il 20 agosto debutta la nuova generazione Pixel
    • Windows 11 24H2 rende inutilizzabili SSD e HDD dopo l’aggiornamento
    • Totally Reliable Delivery Service in regalo su Epic Games
    • Kaisen Linux 3.0: l’ultima versione prima della chiusura
    • Excel analizza le immagini con Python
    • Hidden Folks in regalo su Epic Games
    Login
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    • Home
    • Computer
      1. MINI PC
      2. Laptop
      3. Monitor
      4. Teoria
      5. Mouse
      6. GPU
      7. Windows
      8. Motherboard
      9. Tastiere
      10. View All
      Minisforum UM690L Slim

      Minisforum UM690L Slim: prestazioni desktop in dimensioni ultra compatte

      10/08/2025
      GMKtec NucBox K11

      GMKtec NucBox K11, una soluzione completa per produttività e intrattenimento

      28/07/2025
      geekom a6

      Geekom A6 il migliore mini-pc di fascia media

      21/07/2025
      NiPoGi E3B

      Mini PC NiPoGi E3B con Ryzen 7 5700U: potenza compatta ad un prezzo aggressivo

      16/07/2025
      Dell Inspiron 16

      Dell Inspiron 16 5645: un notebook elegante, potente e versatile al prezzo giusto

      27/07/2025
      Acer Aspire 3 A315-44P

      Acer Aspire 3 A315-44P: Potenza e versatilità a buon prezzo

      25/07/2025

      Samsung Galaxy Book4 Pro 360, un elegante tuttofare

      27/06/2025
      Lenovo Chromebook Duet 11

      Lenovo Chromebook Duet 11, un versatile 2-in-1 con 10 anni di aggiornamenti

      24/06/2025
      BenQ MA320U

      BenQ MA320U, monitor 4K ideale per Mac

      01/08/2025
      ROG Strix XG27ACDNG

      ASUS ROG Strix XG27ACDNG: un monitor per gamer competitivi e professionisti della grafica

      28/07/2025
      Alienware AW2725DF

      Alienware AW2725DF: monitor gaming QD-OLED da 27 pollici

      20/07/2025
      LG UltraGear 27GX790A

      LG UltraGear 27GX790A: il monitor per gaming eSport

      16/07/2025
      Bluetooth 6.1

      Bluetooth 6.1: più privacy e autonomia per i dispositivi wireless

      12/05/2025
      ASUS ProArt Z790

      Evoluzione del bus di sistema PCIe fino al PCIe 7

      16/04/2025
      USB

      USB : l’evoluzione di Universal Serial Bus dagli anni 90 ad oggi

      02/02/2025
      bluetooth

      L’evoluzione del Bluetooth: un viaggio attraverso le versioni fino al 6.1

      13/11/2024
      Mouse NZXT Lift 2

      Mouse NZXT Lift 2, mouse filare ultraleggero e preciso

      19/07/2025
      Burst II Air

      Turtle Beach Burst II Air wireless, un mouse gaming di soli 47 gr!

      15/06/2025
      Scimitar Elite Wireless SE

      Corsair Scimitar Elite Wireless SE: un mouse pensato per chi ha bisogno di controllare tutto

      04/06/2025
      Corsair M55

      Mouse Corsair M55 e M55 Wireless: performance top a prezzi accessibili

      19/05/2025
      OptiScaler

      OptiScaler, cos’è e come attivarlo nei giochi

      24/07/2025
      amd udna

      UDNA 5, la nuova identità di AMD nel ray tracing: un cambio di rotta molto atteso

      06/05/2025
      RX 9070 XT

      La GPU Radeon RX 9070 XT va a ruba, successo di vendite per AMD

      25/03/2025
      Radeon 8060S

      La Radeon 8060S nelle APU AMD Strix Halo sarà una nuova frontiera per laptop e mini pc

      19/02/2025
      kernel windows

      Antivirus fuori dal kernel: Microsoft cambia le regole su Windows

      27/06/2025
      mu language model

      Mu, un motore AI per gestire le impostazioni di Windows 11

      24/06/2025
      Microsoft passkey

      Microsoft: nuovi account senza password e con passkey di default

      02/05/2025
      windows

      Fine supporto Windows 10: cosa scegliere tra Windows 11 e Linux

      09/01/2025
      ROG Strix B860-A Gaming

      Asus ROG Strix B860-A Gaming WiFi, motherboard per build ad alte prestazioni.

      10/08/2025
      MSI MAG Z890 Tomahawk WiFi

      MSI MAG Z890 Tomahawk WiFi: scheda madre top per Intel Ultra

      12/06/2025
      CVN Z790D5

      Colorful presenta la nuova mobo gaming CVN Z790D5 ARK FROZEN

      22/08/2024
      Z790 Project Zero Plus

      La motherboard Z790 Project Zero Plus porta le DDR5 CAMM2 sui PC desktop

      24/05/2024
      Epomaker HE75 Mag

      Tastiera magnetica Epomaker HE75 Mag: la scelta giusta per chi pretende il massimo spendendo poco

      26/07/2025
      Keys-To-Go 2

      Logitech Keys-To-Go 2: tastiera wireless per laptop, tablet e smartphone

      14/06/2025
      Logitech G515 TKL

      Logitech G515: tastiera gaming TKL sottile e versatile a prezzo accessibile

      04/06/2025
      G915 Lightspeed TKL

      Logitech G915 X LIGHTSPEED TKL: tastiera multiuso con profilo premium

      12/05/2025
      Windows 11 24H2

      Windows 11 24H2 rende inutilizzabili SSD e HDD dopo l’aggiornamento

      18/08/2025

      Kaisen Linux 3.0: l’ultima versione prima della chiusura

      14/08/2025

      Excel analizza le immagini con Python

      14/08/2025
      Minisforum UM690L Slim

      Minisforum UM690L Slim: prestazioni desktop in dimensioni ultra compatte

      10/08/2025
    • Tech
      1. Curiosità
      2. Eventi
      3. memory cards
      4. Powerbank
      5. Smartwatch
      6. Gadgets
      7. Bluetooth speakers
      8. Intelligenza artificiale
      9. Offerte
      10. Software
      11. View All
      grotta lunare

      Scoperta una grotta lunare sotterranea

      16/07/2024
      Oleg Kononenko

      Oleg Kononenko: 1000 giorni nello spazio

      05/06/2024

      GPT-4 supera gli analisti finanziari nella previsione degli utili aziendali

      28/05/2024
      alimenti ultra-processati

      Alimenti ultra-processati collegati a 32 effetti negativi sulla salute

      28/05/2024
      Made by Google 2025

      Tutto pronto per il Made by Google 2025: il 20 agosto debutta la nuova generazione Pixel

      18/08/2025
      Pwn2Own

      Pwn2Own 2025: Meta offre 1 milione per un exploit zero-click su WhatsApp

      04/08/2025
      volo elettrico Alia CX300

      Alia CX300: primo volo elettrico passeggeri atterra al JFK

      05/06/2025
      TIM Summer Hits 2025

      Tim Summer Hits 2025 a Roma: Piazza del Popolo si accende anche quest’estate

      31/05/2025
      SSD Crucial P310 2TB

      Crucial P310 2TB SSD NVMe: storage ad alta velocità a un ottimo prezzo

      08/06/2025
      V-NAND QLC Samsung

      Il futuro dello storage è pronto: Samsung svela la V-NAND QLC da 1 Tb

      12/09/2024
      microSD SD Express

      Samsung presenta la prima microSD SD Express

      07/03/2024

      ADATA lancia il primo SSD esterno USB4 SE920

      31/10/2023
      Sharge ICEMAG 2

      Sharge ICEMAG 2: power bank Qi2 15W con raffreddamento attivo

      12/05/2025
      Baseus Nomos

      Baseus Nomos Power Bank: ricarica wireless veloce e sicura

      11/05/2025

      Xiaomi Power Bank da 165W: ricarica ultra-rapida e design compatto

      10/04/2025
      belkin

      Belkin Power Bank da 5.000 mAh compatibile con MagSafe e Qi2

      03/11/2024

      Garmin Forerunner 970: il top della tecnologia Fenix in un design più leggero

      07/08/2025
      Garmin Forerunner 255

      Garmin Forerunner 255: un multisport affidabile e completo

      02/08/2025
      SensorLM

      Google SensorLM: un nuovo modo di comprendere i dati dei wearable

      29/07/2025
      Amazfit Bip 5

      Amazfit Bip 5, uno smartwatch completo ed economico

      27/07/2025
      8BitDo Ultimate 2C Controller

      8BitDo Ultimate 2C Wireless Controller, il migliore sotto i 50 euro

      10/08/2025
      8BitDo Ultimate

      8BitDo Ultimate Mobile Gaming Controller: massimo controllo per i gamer su Android

      27/07/2025
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      25/07/2025
      Ugreen Fine Tracker

      UGREEN FineTrack Smart Finder: l’alternativa economica agli AirTag compatibile con Find My

      24/07/2025
      Ultimate Ears EVERBOOM

      Ultimate Ears Everboom: audio a 360 gradi, design solido e 20 ore di autonomia

      09/08/2025
      EarFun Uboom L

      EarFun UBoom L, l’altoparlante economico, pratico e di qualità

      27/07/2025
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      25/07/2025
      Marshall Middleton II

      Marshall Middleton II, potenza e stile dal look retrò

      22/07/2025

      Arm porta l’AI nelle GPU mobile con Neural Super Sampling

      13/08/2025

      Claude Sonnet 4 ora supporta 1 milione di token di contesto, ma solo per sviluppatori

      13/08/2025
      GitHub

      GitHub entra nella CoreAI di Microsoft dopo l’addio del CEO

      12/08/2025
      nvidia amd

      Nvidia e AMD dovranno pagare al governo USA il 15% delle vendite di chip AI in Cina

      11/08/2025
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      25/07/2025
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      nubia z60 ultra

      Offerte Black Friday Nubia: telefoni premium a prezzi convenienti

      22/11/2024
      Scream Fest 2024

      Steam Scream Fest 2024: sconti horror per Halloween

      29/10/2024
      Staan

      Ecosia e Qwant lanciano il nuovo motore europeo: Staan

      08/08/2025
      Proton Authenticator

      Proton Authenticator: autenticazione a 2 fattori gratis, sicura e open source

      31/07/2025
      lorenzo foti

      Lorenzo Foti, intervista al protagonista italiano dell’eSport di Excel

      25/07/2025
      Google Web Guide

      Google Web Guide riorganizza le ricerche con Gemini AI

      25/07/2025
      Made by Google 2025

      Tutto pronto per il Made by Google 2025: il 20 agosto debutta la nuova generazione Pixel

      18/08/2025

      Arm porta l’AI nelle GPU mobile con Neural Super Sampling

      13/08/2025

      Claude Sonnet 4 ora supporta 1 milione di token di contesto, ma solo per sviluppatori

      13/08/2025
      Apple mac 5 chip futuristico

      Apple M5: il passaggio a LMC spiana la strada ai chip multi-die

      13/08/2025
    • Mobiles
      1. Smartphones
      2. View All
      Samsung Galaxy A34 5G

      Samsung Galaxy A34 5G: tecnologia e stile

      01/08/2025
      Huawei

      Huawei torna al vertice del mercato smartphone cinese

      29/07/2025
      Honor 400 Pro

      Honor 400 Pro: hardware da top di gamma con aggiornamenti fino al 2031

      29/07/2025
      Motorola Edge 50 Neo

      Motorola Edge 50 Neo: mid-range compatto e accessibile

      28/07/2025
      Proton Authenticator

      Proton Authenticator: autenticazione a 2 fattori gratis, sicura e open source

      31/07/2025
      Qi2 25W

      Qi2 25W sarà lo standard globale per la ricarica wireless

      24/07/2025
      DOOGEE Tab E3 Max

      DOOGEE Tab E3 Max: un maxi-tablet pensato per multimedia e intrattenimento

      23/07/2025
      OnePlus Pad 3

      OnePlus Pad 3: un’alternativa valida al Galaxy Tab S10+

      11/07/2025
    • Musica
      1. Cuffie
      2. DAC
      3. hi-fi
      4. Teoria
      5. View All
      realme Buds T200

      realme Buds T200: TWS economici con ANC, LDAC e 50 ore di autonomia

      11/08/2025
      JBL Tour Pro 3

      JBL Tour Pro 3: auricolari con touchscreen e driver ibridi

      09/08/2025
      EarFun Air Pro 4

      EarFun Air Pro 4: l’alternativa smart per chi cerca funzionalità premium sotto i 100 euro

      05/08/2025
      EarFun Tune Pro

      EarFun Tune Pro: praticità wireless e autonomia da 120 ore

      04/08/2025
      Eversolo Play

      Eversolo Play: il tuttofare hi-fi per chi vuole meno cavi e più musica

      18/08/2025
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      FiiO BTR15

      FiiO BTR15: DAC Bluetooth al prezzo più basso di sempre

      17/05/2025
      DAC ADI-2 DAC FS

      Cosa è un DAC audio

      26/10/2024
      Eversolo Play

      Eversolo Play: il tuttofare hi-fi per chi vuole meno cavi e più musica

      18/08/2025
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      Focal Aria 926

      Componenti per un ottimo impianto stereo

      31/07/2024

      Garmin acquista JL Audio

      16/08/2023
      truffa phishing zalando

      Truffa phishing: in regalo la gift card Zalando da 150€

      06/12/2024
      sim ed esim

      Differenza tra SIM fisica ed eSIM: vantaggi e sicurezza

      02/11/2024

      Malware: cosa sono e come difendersi

      19/10/2024
      crittografia a cosa serve

      Crittografia, come funziona e perchè dobbiamo utilizzarla

      16/10/2024
      Eversolo Play

      Eversolo Play: il tuttofare hi-fi per chi vuole meno cavi e più musica

      18/08/2025
      realme Buds T200

      realme Buds T200: TWS economici con ANC, LDAC e 50 ore di autonomia

      11/08/2025
      JBL Tour Pro 3

      JBL Tour Pro 3: auricolari con touchscreen e driver ibridi

      09/08/2025
      EarFun Air Pro 4

      EarFun Air Pro 4: l’alternativa smart per chi cerca funzionalità premium sotto i 100 euro

      05/08/2025
    • Lifestyle
      1. Criptovalute
      2. EV
      3. Gaming
      4. Trekking
      5. Scienze
      6. View All
      Coinbase

      Coinbase colpita da attacco informatico e minaccia di riscatto

      15/05/2025
      coinbase

      Coinbase : acquisti cripto tramite Apple Pay

      03/12/2024
      criptovalute

      Criptovalute: cosa sono e come funzionano le monete virtuali

      19/10/2024
      Solana

      Visa punta sulla blockchain Solana: i motivi della partnership

      18/09/2023
      Volkswagen ID.1

      Volkswagen ID.1: l’auto elettrica da 20000 euro arriva nel 2027

      05/02/2025
      microvast

      Microvast: l’innovazione nelle batterie allo stato solido

      13/01/2025
      BYD

      BYD e Tesla: sfida per il primato nel mercato EV

      03/01/2025
      batterie 4680

      Panasonic sfida il mercato EV con le batterie 4680: cosa cambia?

      09/09/2024
      Totally Reliable Delivery Service

      Totally Reliable Delivery Service in regalo su Epic Games

      16/08/2025
      Hidden Folks

      Hidden Folks in regalo su Epic Games

      14/08/2025
      steam per chromebook

      Google chiude il supporto a Steam per Chromebook

      09/08/2025
      Road Redemption

      Road Redemption in regalo su Epic Games

      07/08/2025
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      8a Scarpinata della Teverina

      A spasso per i sentieri: 8a Scarpinata della Teverina

      14/05/2024
      Valli e Calanchi

      A spasso per i sentieri: 1a Valli e Calanchi

      27/09/2023
      Maternum Marathon 2023

      A spasso per i sentieri: la 2a edizione di Maternum Marathon

      13/06/2023
      urano

      Le lune esterne di Urano Titania e Oberon, sono scure sul lato anteriore.

      19/06/2025
      Muon g-2

      L’anomalia Muon g-2 segue le leggi del Modello Standard

      13/06/2025
      Neuroplatform finalspark

      Neuroplatform, piattaforma online alimentata dal primo processore biologico al mondo

      27/05/2024
      AlphaFold 3 di Google DeepMind

      AlphaFold 3 di Google DeepMind

      08/05/2024
      Oscars on YouTube

      YouTube in trattativa per trasmettere gli Oscar

      18/08/2025
      WhatsApp

      WhatsApp: nuove funzioni contro truffe e messaggi sospetti

      06/08/2025
      Skechers

      Skechers GO RUN Elevate 2.0, scarpe per bambini con AirTag

      31/07/2025
      Stranger Things 5

      Stranger Things 5: il trailer preannuncia la battaglia finale

      16/07/2025
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    Home»Tech»Intelligenza artificiale»OpenAI presenta i modelli o3 e o3 mini
    Intelligenza artificiale

    OpenAI presenta i modelli o3 e o3 mini

    All'OpenAI Day 12, Sam Altman ha svelato i modelli di ragionamento di nuova generazione dell'azienda: o3 e o3 mini. Ridefiniscono i parametri di riferimento dell'intelligenza artificiale.
    GrazianoGraziano21/12/2024Updated:21/12/202407 Mins Read36 Views
    Share Twitter Facebook Pinterest Reddit Telegram WhatsApp Email
    OpenAI Imodello o3
    Share
    Facebook Twitter Pinterest Reddit Telegram WhatsApp Email Threads

    Ieri durante il docidesimo ed ultimo giorno del suo evento speciale “12 Days of OpenAI”, Sam Altman, ha introdotto due nuovi modelli di “ragionamento” IA o3 e o3 mini; ovvero le versioni successive di o1 e o1 mini. Invece di seguire una nomenclatura sequenziale prevedibile, OpenAI ha saltato o2 a causa di un potenziale conflitto di copyright con il marchio O2; un noto fornitore di servizi di telecomunicazioni britannico.

    OpenAI Imodello o3

    OpenAI svela o3 e o3 mini

    Come in o1 e o1 mini, o3 è il modello principale con ampie capacità; invece o3 mini, è una versione più compatta e veloce ma altrettanto abile. È importante notare che questi nuovi modelli o3 non saranno immediatamente disponibili al pubblico. OpenAI ha delineato un piano per renderli accessibili inizialmente per test di sicurezza pubblici.

    Questo approccio prudente sottolinea l’importanza che OpenAI attribuisce alla sicurezza man mano che i suoi modelli acquisiscono maggiore competenza. OpenAI ha aperto l’accesso a ricercatori esterni che desiderano contribuire al processo di test.

    Sam Altam ha promesso il rilascio pubblico di o3 mini per fine gennaio e o3 subito dopo. Nel video di presentazione ha espresso entusiasmo nel mostrare le potenzialità di questi modelli e ha mostrato dimostrazioni e benchmark per evidenziarne le capacità.

    Abilità tecniche di o3

    Il modello o3 dimostra una notevole competenza in una serie di benchmark tecnici complessi; in particolare in compiti che coinvolgono la programmazione e la matematica. Nei benchmark di programmazione, come il “sweet bench verified”, che valuta le prestazioni su attività di sviluppo software reali, o3 raggiunge un’accuratezza del 71,7%.

    Questo risultato supera di oltre il 20% le prestazioni dei modelli o1; evidenzia un progresso sostanziale nella capacità del modello di affrontare sfide di codifica complesse. Nel contesto della programmazione competitiva, dove i modelli vengono valutati in base alla loro capacità di risolvere problemi algoritmici in competizioni come “code forces”, o3 ha ottenuto un punteggio ELO di circa 2727 nelle impostazioni di calcolo con tempi di test elevati e aggressivi.

    Questo dato è particolarmente degno di nota se confrontato con i punteggi ottenuti da programmatori competitivi umani esperti. Anche in ambito matematico, o3 mostra abilità eccezionali. Nei benchmark di matematica competitiva, il modello raggiunge un’accuratezza del 96,7% nel test Amy, rispetto all’83,3% del modello o1. Questo livello di precisione indica che o3 spesso sbaglia solo una domanda nei test per l’Olimpiade matematica statunitense.

    o3 nei test scientifici

    Le prestazioni di o3 sono altrettanto notevoli in benchmark scientifici di livello di dottorato. Per esempio, nel gpq Diamond ottiene un punteggio dell’87,7%. Questo valore è superiore di circa il 10% rispetto alle prestazioni del modello o1 e supera il tipico punteggio del 70% ottenuto da esperti con dottorato di ricerca nel loro campo.

    o3 è stato testato anche con il benchmark Epic AI Frontier Math; un benchmark creato appositamente per testare a fondo modelli IA. Presenta problemi inediti e particolarmente complessi che richiedono ore o addirittura giorni per essere risolti da matematici professionisti.

    Attualmente, i migliori modelli IA raggiungono un’accuratezza pari al 2% su questo benchmark. o3, con impostazioni di test aggressive, è stato in grado di superare il 25%.

    Il traguardo di o3 nel benchmark Arc AGI

    Un momento saliente del video è stata la discussione sul benchmark Arc Artificial General Intelligence (AGI); è considerato un test fondamentale per l’intelligenza artificiale generale. Creato nel 2019, Arc AGI ha resistito come una sfida irrisolta per cinque anni.

    Il benchmark Arc AGI si concentra sulla capacità di un sistema di comprendere e applicare principi di trasformazione attraverso esempi. Ai partecipanti vengono presentati set di input-output e il compito è dedurre la regola sottostante e applicarla per completare un output incompleto.

    Questi compiti, pur essendo intuitivi per gli esseri umani, si sono dimostrati sorprendentemente difficili per i sistemi di intelligenza artificiale. La difficoltà di Arc AGI risiede nel fatto che ogni compito richiede un insieme distinto di abilità. Inoltre, impedisce ai modelli di fare affidamento su schemi memorizzati in fase di apprendimento. La versione 1 di Arc AGI ha visto progressi lenti; passando dallo 0% al 5% di accuratezza in cinque anni con i principali modelli di IA.

    Tuttavia, o3 ha ottenuto un nuovo punteggio all’avanguardia del 75,7% sul set di holdout semi-privato di Arc AI con risorse computazionali limitate. Ancora più notevole è che, aumentando le risorse computazionali per o3, il modello ha raggiunto un punteggio dell’85,7%.

    Questo risultato è particolarmente significativo perché le prestazioni umane su questo benchmark sono comparabili a una soglia dell’85%. Superare questa soglia seppure di pochissimo indica che o3 ha dimostrato una sorta di capacità di ragionamento a livello umano; un risultato senza precedenti per qualsiasi sistema di intelligenza artificiale testato finora.

    Impegno per la sicurezza e l’accessibilità di OpenAI

    Mentre i punteggi ottenuti da o3 nei vari benchmark sono entusiasmanti, OpenAI riconosce che il lavoro nello sviluppo di un’intelligenza artificiale sicura e affidabile è tutt’altro che completo. L’azienda sottolinea la necessità di benchmark più completi e duraturi, come Arc AGI, per misurare e guidare il progresso. Inoltre, OpenAI ha espresso il suo entusiasmo per la collaborazione con entità esterne per sviluppare benchmark di prossima generazione.

    Inoltre, OpenAI sta lavorando a una nuova tecnica chiamata allineamento deliberativo per migliorare ulteriormente la sicurezza dei suoi modelli. Questo metodo sfrutta le capacità di ragionamento dei modelli stessi per identificare e prevenire potenziali prompt non sicuri; un progresso nello sviluppo di sistemi di intelligenza artificiale più sicuri e affidabili.

    o3 mini

    Parallelamente allo sviluppo del modello o3, OpenAI ha presentato anche o3 mini; un modello di ragionamento efficiente in termini di costi che si unisce alla famiglia o1 mini. o3 mini si distingue per la sua capacità di fornire buone prestazioni a un costo inferiore. Come il modello o3, la versione mini non sarà immediatamente accessibile a tutti. OpenAI sta aprendo l’accesso a o3 mini a ricercatori sulla sicurezza per i test. I ricercatori interessati possono candidarsi tramite un modulo sul sito Web di OpenAI. Le domande si chiuderanno il 10 gennaio.

    Una nuova funzionalità, denominata “tempo di pensiero adattivo” nell’API, consentirà di regolare il tempo dedicato dal modello al ragionamento; offre flessibilità per diversi casi d’uso. Le valutazioni iniziali di o3 mini mostrano risultati promettenti nei benchmark di codifica, con prestazioni che migliorano con tempi di pensiero più lunghi e che superano il modello o1 mini con tempi di pensiero medi. In termini di costi ed efficienza, o3 mini definisce una nuova frontiera. Offre prestazioni di codifica comparabili o migliori a un costo inferiore rispetto a o1 mini.

    Una dimostrazione pratica ha evidenziato la capacità di o3 mini di generare ed eseguire codice Python, inclusa la creazione di un server e di un’interfaccia utente per attività di programmazione interattive. o3 mini dimostra anche competenza in matematica; ottiene prestazioni comparabili a o1 mini con tempi di elaborazione ridotti e prestazioni migliori con tempi di elaborazione medi.

    OpenAI Day 12: conclusione

    Sam Altam ha voluto concludere l’evento speciale “12 Days of OpenAI” con la dimostrazione di due modelli IA non ancora disponibili al pubblico, o3 e o3mini.

    Ne ha evidenziato le prestazioni eccezionali su benchmark impegnativi come Epic AI Frontier Math e Arc AGI; un chiaro segnale dei crescenti livelli di sofisticazione raggiunti da questi sistemi. Il raggiungimento di prestazioni a livello umano sul benchmark Arc AGI in contesti di calcolo elevato è un risultato particolarmente degno di nota. Sottolinea il potenziale di questi modelli per affrontare compiti complessi che richiedono capacità di ragionamento avanzate.

    L’annuncio di o3 e o3 mini segnala una fase promettente nello sviluppo dell’intelligenza artificiale, caratterizzata da progressi significativi nelle capacità di ragionamento e da un continuo impegno per la sicurezza e la collaborazione.

    AI app apps blog canvas ChatGPT LLM news o1 o2 o3 o3mini OpenAI picks tech tecnologia warp xcode
    Seguici su X (Twitter) Seguici su Bluesky Seguici su WhatsApp
    Share. Facebook Twitter Pinterest
    Previous ArticleAnker MagGo 3-in-1: stazione di ricarica wireless Qi2
    Next Article TerraTech è in regalo su Epic Games
    Graziano
    • Website

    Reporter e recensore presso Gomoot, mi occupo di riportare notizie riguardanti la tecnologia. Ho cominciato con C64, Amiga, fino al 486; ora seguo con passione la tecnologia attuale e adoro in particolare i desktop SFF e i mini pc. Appassionato di informatica e linguaggi di programmazione nel tempo libero amo praticare trekking e stare all'aperto.

    Articoli collegati

    Intelligenza artificiale

    Arm porta l’AI nelle GPU mobile con Neural Super Sampling

    13/08/2025
    Intelligenza artificiale

    Claude Sonnet 4 ora supporta 1 milione di token di contesto, ma solo per sviluppatori

    13/08/2025
    GitHub
    Intelligenza artificiale

    GitHub entra nella CoreAI di Microsoft dopo l’addio del CEO

    12/08/2025
    Add A Comment
    Leave A Reply Cancel Reply

    Ultimi articoli
    Oscars on YouTube

    YouTube in trattativa per trasmettere gli Oscar

    18/08/2025
    Eversolo Play

    Eversolo Play: il tuttofare hi-fi per chi vuole meno cavi e più musica

    18/08/2025
    Made by Google 2025

    Tutto pronto per il Made by Google 2025: il 20 agosto debutta la nuova generazione Pixel

    18/08/202547 Views
    Windows 11 24H2

    Windows 11 24H2 rende inutilizzabili SSD e HDD dopo l’aggiornamento

    18/08/202538 Views
    Totally Reliable Delivery Service

    Totally Reliable Delivery Service in regalo su Epic Games

    16/08/2025

    Kaisen Linux 3.0: l’ultima versione prima della chiusura

    14/08/2025
    Gomoot : tecnologia e lifestyle
    Mastodon WhatsApp X (Twitter) Instagram Threads
    • Home
    • Tech
    • Mobiles
    • Contatti
    • Privacy
    • ABOUT
    © 2025 GOMOOT.COM

    Type above and press Enter to search. Press Esc to cancel.

    Sign In or Register

    Welcome Back!

    Login below or Register Now.

    Continua con Google
    Lost password?

    Register Now!

    Already registered? Login.

    Continua con Google

    A password will be e-mailed to you.