Close Menu
    Ultimi Articoli
    Enermax PlatiGemini 1200W

    Enermax PlatiGemini 1200W: alimentatore Dual-ATX Premium

    29/06/2025
    nubia z70 ultra

    Nubia Z70 Ultra, il top per le foto con camera da 35 mm

    29/06/202530 Views
    Realme GT 7 Pro

    Realme GT 7 Pro: potenza e stile in un tutt’uno

    29/06/2025308 Views
    Belkin SoundForm Isolate

    Belkin SoundForm Isolate: cuffie wireless con ANC ibrida e 60 ore di autonomia

    29/06/202519 Views
    Gigabyte AORUS FI32Q X

    Gigabyte AORUS FI32Q X: un best buy per il QHD a 32 pollici

    28/06/202564 Views

    Poco M7 Pro conquista la fascia entry con display a 90Hz e fotocamera da 64MP

    28/06/202538 Views
    Acemagic K1

    Acemagic K1 mini PC, potenza e risparmio energetico

    28/06/20251.283 Views

    Pagamenti NFC minacciati dal malware NGate

    28/06/202521 Views
    domenica, Giugno 29
    Trending
    • Enermax PlatiGemini 1200W: alimentatore Dual-ATX Premium
    • Nubia Z70 Ultra, il top per le foto con camera da 35 mm
    • Realme GT 7 Pro: potenza e stile in un tutt’uno
    • Belkin SoundForm Isolate: cuffie wireless con ANC ibrida e 60 ore di autonomia
    • Gigabyte AORUS FI32Q X: un best buy per il QHD a 32 pollici
    • Poco M7 Pro conquista la fascia entry con display a 90Hz e fotocamera da 64MP
    • Acemagic K1 mini PC, potenza e risparmio energetico
    • Pagamenti NFC minacciati dal malware NGate
    Login
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    • Home
    • Computer
      1. MINI PC
      2. Laptop
      3. Monitor
      4. Teoria
      5. Mouse
      6. GPU
      7. Windows
      8. Motherboard
      9. Tastiere
      10. View All
      Acemagic K1

      Acemagic K1 mini PC, potenza e risparmio energetico

      28/06/2025
      UM870 Slim

      Minisforum UM870 Slim: potenza AMD Ryzen in un design compatto

      22/06/2025
      Beelink SER8

      Beelink SER8, un mini PC con Radeon 780M e USB4, pronto (quasi) a tutto.

      16/06/2025
      Beelink EQR6

      Beelink EQR6 con Ryzen 6900HX: un mini PC potente e silenzioso

      11/06/2025

      Samsung Galaxy Book4 Pro 360, un elegante tuttofare

      27/06/2025
      Lenovo Chromebook Duet 11

      Lenovo Chromebook Duet 11, un versatile 2-in-1 con 10 anni di aggiornamenti

      24/06/2025
      Lenovo IdeaPad Slim 3

      Lenovo IdeaPad Slim 3: un laptop ideale per studenti

      21/06/2025
      IdeaPad Flex 5

      Lenovo IdeaPad Flex 5 un convertibile 2-in-1 con pen inclusa

      10/06/2025
      Gigabyte AORUS FI32Q X

      Gigabyte AORUS FI32Q X: un best buy per il QHD a 32 pollici

      28/06/2025

      Philips Evnia 32M2N8900: monitor QD-OLED 4K per gamer esigenti

      23/06/2025
      Gigabyte M27UA

      Gigabyte M27UA: monitor per gaming e design creativo

      20/06/2025
      KTC H32S25E

      KTC H32S25E: monitor curvo 32” QHD per il gaming, alte prestazioni e prezzo contenuto

      19/06/2025
      Bluetooth 6.1

      Bluetooth 6.1: più privacy e autonomia per i dispositivi wireless

      12/05/2025
      ASUS ProArt Z790

      Evoluzione del bus di sistema PCIe fino al PCIe 7

      16/04/2025
      USB

      USB : l’evoluzione di Universal Serial Bus dagli anni 90 ad oggi

      02/02/2025
      bluetooth

      L’evoluzione del Bluetooth: un viaggio attraverso le versioni fino al 6.1

      13/11/2024
      Burst II Air

      Turtle Beach Burst II Air wireless, un mouse gaming di soli 47 gr!

      15/06/2025
      Scimitar Elite Wireless SE

      Corsair Scimitar Elite Wireless SE: un mouse pensato per chi ha bisogno di controllare tutto

      04/06/2025
      Corsair M55

      Mouse Corsair M55 e M55 Wireless: performance top a prezzi accessibili

      19/05/2025
      Logitech G309

      Logitech G309: mouse gaming wireless versatile e potente

      17/05/2025
      amd udna

      UDNA 5, la nuova identità di AMD nel ray tracing: un cambio di rotta molto atteso

      06/05/2025
      RX 9070 XT

      La GPU Radeon RX 9070 XT va a ruba, successo di vendite per AMD

      25/03/2025
      Radeon 8060S

      La Radeon 8060S nelle APU AMD Strix Halo sarà una nuova frontiera per laptop e mini pc

      19/02/2025
      fsr4

      In arrivo l’upscaling con AMD FSR 4, ma solo per GPU RDNA 4

      11/01/2025
      kernel windows

      Antivirus fuori dal kernel: Microsoft cambia le regole su Windows

      27/06/2025
      mu language model

      Mu, un motore AI per gestire le impostazioni di Windows 11

      24/06/2025
      Microsoft passkey

      Microsoft: nuovi account senza password e con passkey di default

      02/05/2025
      windows

      Fine supporto Windows 10: cosa scegliere tra Windows 11 e Linux

      09/01/2025
      MSI MAG Z890 Tomahawk WiFi

      MSI MAG Z890 Tomahawk WiFi: scheda madre top per Intel Ultra

      12/06/2025
      ROG Strix B860-A Gaming

      Asus ROG Strix B860-A Gaming WiFi, motherboard per build ad alte prestazioni.

      25/05/2025
      CVN Z790D5

      Colorful presenta la nuova mobo gaming CVN Z790D5 ARK FROZEN

      22/08/2024
      Z790 Project Zero Plus

      La motherboard Z790 Project Zero Plus porta le DDR5 CAMM2 sui PC desktop

      24/05/2024
      Keys-To-Go 2

      Logitech Keys-To-Go 2: tastiera wireless per laptop, tablet e smartphone

      14/06/2025
      Logitech G515 TKL

      Logitech G515: tastiera gaming TKL sottile e versatile a prezzo accessibile

      04/06/2025
      G915 Lightspeed TKL

      Logitech G915 X LIGHTSPEED TKL: tastiera multiuso con profilo premium

      12/05/2025
      Keychron Q1 HE: tastiera meccanica

      Keychron Q1 HE: tastiera meccanica con switch magnetici Hall Effect

      02/02/2025
      Enermax PlatiGemini 1200W

      Enermax PlatiGemini 1200W: alimentatore Dual-ATX Premium

      29/06/2025
      Gigabyte AORUS FI32Q X

      Gigabyte AORUS FI32Q X: un best buy per il QHD a 32 pollici

      28/06/2025
      Acemagic K1

      Acemagic K1 mini PC, potenza e risparmio energetico

      28/06/2025
      kernel windows

      Antivirus fuori dal kernel: Microsoft cambia le regole su Windows

      27/06/2025
    • Tech
      1. Curiosità
      2. Eventi
      3. memory cards
      4. Powerbank
      5. Smartwatch
      6. Gadgets
      7. Bluetooth speakers
      8. Intelligenza artificiale
      9. Offerte
      10. Software
      11. View All
      grotta lunare

      Scoperta una grotta lunare sotterranea

      16/07/2024
      Oleg Kononenko

      Oleg Kononenko: 1000 giorni nello spazio

      05/06/2024

      GPT-4 supera gli analisti finanziari nella previsione degli utili aziendali

      28/05/2024
      alimenti ultra-processati

      Alimenti ultra-processati collegati a 32 effetti negativi sulla salute

      28/05/2024
      volo elettrico Alia CX300

      Alia CX300: primo volo elettrico passeggeri atterra al JFK

      05/06/2025
      TIM Summer Hits 2025

      Tim Summer Hits 2025 a Roma: Piazza del Popolo si accende anche quest’estate

      31/05/2025
      Starship Flight 9

      Starship Flight 9: una missione tra successi parziali e limiti tecnici

      28/05/2025
      IFT-9

      Starship IFT-9: il test chiave per il riuso del booster Super Heavy

      27/05/2025
      SSD Crucial P310 2TB

      Crucial P310 2TB SSD NVMe: storage ad alta velocità a un ottimo prezzo

      08/06/2025
      V-NAND QLC Samsung

      Il futuro dello storage è pronto: Samsung svela la V-NAND QLC da 1 Tb

      12/09/2024
      microSD SD Express

      Samsung presenta la prima microSD SD Express

      07/03/2024

      ADATA lancia il primo SSD esterno USB4 SE920

      31/10/2023
      Sharge ICEMAG 2

      Sharge ICEMAG 2: power bank Qi2 15W con raffreddamento attivo

      12/05/2025
      Baseus Nomos

      Baseus Nomos Power Bank: ricarica wireless veloce e sicura

      11/05/2025

      Xiaomi Power Bank da 165W: ricarica ultra-rapida e design compatto

      10/04/2025
      belkin

      Belkin Power Bank da 5.000 mAh compatibile con MagSafe e Qi2

      03/11/2024
      Amazfit Balance 2

      Amazfit Balance 2, smartwatch multisport senza abbonamenti

      26/06/2025
      Suunto Run

      Suunto Run, lo smartwatch per chi ama correre

      23/06/2025
      Amazfit Bip 6

      Amazfit Bip 6: autonomia, salute e sport a basso prezzo

      23/06/2025
      Honor Watch 5

      Honor Watch 5: un mix perfetto di stile, funzionalità e innovazione tecnologica

      22/06/2025
      Wicked Ball M3

      Il tuo gatto si annoia ? Prova la Cheerble Wicked Ball M3 !

      22/06/2025
      8BitDo Ultimate Mobile Gaming Controller

      8BitDo Ultimate Mobile Gaming Controller porta il gaming su Android

      22/06/2025
      Chipolo Pop

      Chipolo Pop, il miglior tracker Bluetooth compatibile con Find My e Find Hub

      20/06/2025
      MiLi MiTag Go

      MiLi MiTag Go: il tracker Android con privacy garantita

      17/06/2025

      JBL Flip 7, lo speaker Bluetooth portatile solido e versatile

      22/06/2025
      Beats Pill

      Beats Pill (2024): altoparlante Bluetooth compatto e resistente

      22/06/2025
      JBL Flip 6

      JBL Flip 6: speaker Bluetooth compatto, potente e impermeabile

      21/06/2025
      Marshall Killburn III

      Marshall Kilburn III: altoparlante robusto, stereo e vintage

      21/06/2025
      gemma 3n

      Gemma 3n, l’AI open source di Google pensata per dispositivi mobili

      27/06/2025
      Gemini CLI

      Gemini CLI: Google lancia l’AI open source e gratuita per il terminale

      26/06/2025
      ChatGPT Record

      ChatGPT Record per Mac: registra la voce, e riassume tutto in testo

      24/06/2025
      mu language model

      Mu, un motore AI per gestire le impostazioni di Windows 11

      24/06/2025
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      12/04/2025
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      nubia z60 ultra

      Offerte Black Friday Nubia: telefoni premium a prezzi convenienti

      22/11/2024
      Scream Fest 2024

      Steam Scream Fest 2024: sconti horror per Halloween

      29/10/2024
      kernel windows

      Antivirus fuori dal kernel: Microsoft cambia le regole su Windows

      27/06/2025
      Firefox 140

      Firefox 140, un aggiornamento raffinato, pensato per tutti

      24/06/2025
      3DMark

      3DMark arriva su macOS: benchmark grafico completo per i dispositivi Apple

      16/06/2025
      OBS Studio 31.1

      OBS Studio 31.1 porta Multitrack Video anche su Linux

      30/05/2025
      nubia z70 ultra

      Nubia Z70 Ultra, il top per le foto con camera da 35 mm

      29/06/2025
      Realme GT 7 Pro

      Realme GT 7 Pro: potenza e stile in un tutt’uno

      29/06/2025

      Poco M7 Pro conquista la fascia entry con display a 90Hz e fotocamera da 64MP

      28/06/2025

      Pagamenti NFC minacciati dal malware NGate

      28/06/2025
    • Mobiles
      1. Smartphones
      2. View All
      nubia z70 ultra

      Nubia Z70 Ultra, il top per le foto con camera da 35 mm

      29/06/2025
      Realme GT 7 Pro

      Realme GT 7 Pro: potenza e stile in un tutt’uno

      29/06/2025

      Poco M7 Pro conquista la fascia entry con display a 90Hz e fotocamera da 64MP

      28/06/2025

      CMF Phone 2 Pro: scopri lo smartphone Nothing con pannelli intercambiabili e chip Helio

      28/06/2025
      Apple Swift

      Swift arriva su Android con supporto ufficiale da Apple

      27/06/2025

      Honor Pad X9a, un tablet low cost ma ricco di funzionalità

      27/06/2025
      RedMagic Nova

      RedMagic Nova: potenza estrema con Snapdragon 8 Gen 3

      17/06/2025
      KOBO Clara Colour

      Kobo Clara Colour: eReader 6″ a colori per le tue letture estive, con Wi-Fi e audio

      16/06/2025
    • Musica
      1. Cuffie
      2. DAC
      3. hi-fi
      4. Teoria
      5. View All
      Belkin SoundForm Isolate

      Belkin SoundForm Isolate: cuffie wireless con ANC ibrida e 60 ore di autonomia

      29/06/2025
      Denon PerL Pro

      Denon PerL Pro: auricolari wireless con suono su misura

      28/06/2025
      Kiwi Ears Aventus

      Kiwi Ears Aventus: cuffie Bluetooth versatili e robuste per DJ e gamers

      23/06/2025

      Xiaomi Buds 5 Pro Wi-Fi: le prime TWS con tecnologia XPAN

      23/06/2025
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      FiiO BTR15

      FiiO BTR15: DAC Bluetooth al prezzo più basso di sempre

      17/05/2025
      DAC ADI-2 DAC FS

      Cosa è un DAC audio

      26/10/2024
      iFi go bar

      Ascolta audio ad alta fedeltà sul tuo Iphone con l’amp/DAC Hi-Res portatile iFi GO bar.

      03/08/2024
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      Focal Aria 926

      Componenti per un ottimo impianto stereo

      31/07/2024

      Garmin acquista JL Audio

      16/08/2023
      Credits Technics : amplificatore digitale SE-R1

      Come ascoltare musica allo stereo con la qualità più alta possibile

      06/05/2023
      truffa phishing zalando

      Truffa phishing: in regalo la gift card Zalando da 150€

      06/12/2024
      sim ed esim

      Differenza tra SIM fisica ed eSIM: vantaggi e sicurezza

      02/11/2024

      Malware: cosa sono e come difendersi

      19/10/2024
      crittografia a cosa serve

      Crittografia, come funziona e perchè dobbiamo utilizzarla

      16/10/2024
      Belkin SoundForm Isolate

      Belkin SoundForm Isolate: cuffie wireless con ANC ibrida e 60 ore di autonomia

      29/06/2025
      Denon PerL Pro

      Denon PerL Pro: auricolari wireless con suono su misura

      28/06/2025
      Kiwi Ears Aventus

      Kiwi Ears Aventus: cuffie Bluetooth versatili e robuste per DJ e gamers

      23/06/2025

      Xiaomi Buds 5 Pro Wi-Fi: le prime TWS con tecnologia XPAN

      23/06/2025
    • Lifestyle
      1. Criptovalute
      2. EV
      3. Gaming
      4. Trekking
      5. Scienze
      6. View All
      Coinbase

      Coinbase colpita da attacco informatico e minaccia di riscatto

      15/05/2025
      coinbase

      Coinbase : acquisti cripto tramite Apple Pay

      03/12/2024
      criptovalute

      Criptovalute: cosa sono e come funzionano le monete virtuali

      19/10/2024
      Solana

      Visa punta sulla blockchain Solana: i motivi della partnership

      18/09/2023
      Volkswagen ID.1

      Volkswagen ID.1: l’auto elettrica da 20000 euro arriva nel 2027

      05/02/2025
      microvast

      Microvast: l’innovazione nelle batterie allo stato solido

      13/01/2025
      BYD

      BYD e Tesla: sfida per il primato nel mercato EV

      03/01/2025
      batterie 4680

      Panasonic sfida il mercato EV con le batterie 4680: cosa cambia?

      09/09/2024
      Sable

      Sable è in regalo su Epic Games

      26/06/2025
      Jurassic World Evolution 3

      Jurassic World Evolution 3 rimuove l’uso dell’AI generativa

      25/06/2025
      giochi in uscita death stranding 2

      I giochi in uscita dal 23 al 29 giugno: una settimana tra grandi ritorni e nuove sorprese

      23/06/2025
      The Alters

      The Alters: un viaggio introspettivo nello spazio

      20/06/2025
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      8a Scarpinata della Teverina

      A spasso per i sentieri: 8a Scarpinata della Teverina

      14/05/2024
      Valli e Calanchi

      A spasso per i sentieri: 1a Valli e Calanchi

      27/09/2023
      Maternum Marathon 2023

      A spasso per i sentieri: la 2a edizione di Maternum Marathon

      13/06/2023
      urano

      Le lune esterne di Urano Titania e Oberon, sono scure sul lato anteriore.

      19/06/2025
      Muon g-2

      L’anomalia Muon g-2 segue le leggi del Modello Standard

      13/06/2025
      Neuroplatform finalspark

      Neuroplatform, piattaforma online alimentata dal primo processore biologico al mondo

      27/05/2024
      AlphaFold 3 di Google DeepMind

      AlphaFold 3 di Google DeepMind

      08/05/2024
      audiolibri

      Il mercato degli audiolibri è in crescita: numeri e tendenze

      27/06/2025
      urano

      Le lune esterne di Urano Titania e Oberon, sono scure sul lato anteriore.

      19/06/2025
      Spaceballs 2

      Spaceballs 2: Mel Brooks torna nel sequel satirico del 2027

      15/06/2025
      Muon g-2

      L’anomalia Muon g-2 segue le leggi del Modello Standard

      13/06/2025
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    Home»Tech»Intelligenza artificiale»OpenAI presenta i modelli o3 e o3 mini
    Intelligenza artificiale

    OpenAI presenta i modelli o3 e o3 mini

    All'OpenAI Day 12, Sam Altman ha svelato i modelli di ragionamento di nuova generazione dell'azienda: o3 e o3 mini. Ridefiniscono i parametri di riferimento dell'intelligenza artificiale.
    GrazianoGraziano21/12/2024Updated:21/12/202407 Mins Read36 Views
    Share Twitter Facebook Pinterest Reddit Telegram WhatsApp Email
    OpenAI Imodello o3
    Share
    Facebook Twitter Pinterest Reddit Telegram WhatsApp Email Threads

    Ieri durante il docidesimo ed ultimo giorno del suo evento speciale “12 Days of OpenAI”, Sam Altman, ha introdotto due nuovi modelli di “ragionamento” IA o3 e o3 mini; ovvero le versioni successive di o1 e o1 mini. Invece di seguire una nomenclatura sequenziale prevedibile, OpenAI ha saltato o2 a causa di un potenziale conflitto di copyright con il marchio O2; un noto fornitore di servizi di telecomunicazioni britannico.

    OpenAI Imodello o3

    OpenAI svela o3 e o3 mini

    Come in o1 e o1 mini, o3 è il modello principale con ampie capacità; invece o3 mini, è una versione più compatta e veloce ma altrettanto abile. È importante notare che questi nuovi modelli o3 non saranno immediatamente disponibili al pubblico. OpenAI ha delineato un piano per renderli accessibili inizialmente per test di sicurezza pubblici.

    Questo approccio prudente sottolinea l’importanza che OpenAI attribuisce alla sicurezza man mano che i suoi modelli acquisiscono maggiore competenza. OpenAI ha aperto l’accesso a ricercatori esterni che desiderano contribuire al processo di test.

    Sam Altam ha promesso il rilascio pubblico di o3 mini per fine gennaio e o3 subito dopo. Nel video di presentazione ha espresso entusiasmo nel mostrare le potenzialità di questi modelli e ha mostrato dimostrazioni e benchmark per evidenziarne le capacità.

    Abilità tecniche di o3

    Il modello o3 dimostra una notevole competenza in una serie di benchmark tecnici complessi; in particolare in compiti che coinvolgono la programmazione e la matematica. Nei benchmark di programmazione, come il “sweet bench verified”, che valuta le prestazioni su attività di sviluppo software reali, o3 raggiunge un’accuratezza del 71,7%.

    Questo risultato supera di oltre il 20% le prestazioni dei modelli o1; evidenzia un progresso sostanziale nella capacità del modello di affrontare sfide di codifica complesse. Nel contesto della programmazione competitiva, dove i modelli vengono valutati in base alla loro capacità di risolvere problemi algoritmici in competizioni come “code forces”, o3 ha ottenuto un punteggio ELO di circa 2727 nelle impostazioni di calcolo con tempi di test elevati e aggressivi.

    Questo dato è particolarmente degno di nota se confrontato con i punteggi ottenuti da programmatori competitivi umani esperti. Anche in ambito matematico, o3 mostra abilità eccezionali. Nei benchmark di matematica competitiva, il modello raggiunge un’accuratezza del 96,7% nel test Amy, rispetto all’83,3% del modello o1. Questo livello di precisione indica che o3 spesso sbaglia solo una domanda nei test per l’Olimpiade matematica statunitense.

    o3 nei test scientifici

    Le prestazioni di o3 sono altrettanto notevoli in benchmark scientifici di livello di dottorato. Per esempio, nel gpq Diamond ottiene un punteggio dell’87,7%. Questo valore è superiore di circa il 10% rispetto alle prestazioni del modello o1 e supera il tipico punteggio del 70% ottenuto da esperti con dottorato di ricerca nel loro campo.

    o3 è stato testato anche con il benchmark Epic AI Frontier Math; un benchmark creato appositamente per testare a fondo modelli IA. Presenta problemi inediti e particolarmente complessi che richiedono ore o addirittura giorni per essere risolti da matematici professionisti.

    Attualmente, i migliori modelli IA raggiungono un’accuratezza pari al 2% su questo benchmark. o3, con impostazioni di test aggressive, è stato in grado di superare il 25%.

    Il traguardo di o3 nel benchmark Arc AGI

    Un momento saliente del video è stata la discussione sul benchmark Arc Artificial General Intelligence (AGI); è considerato un test fondamentale per l’intelligenza artificiale generale. Creato nel 2019, Arc AGI ha resistito come una sfida irrisolta per cinque anni.

    Il benchmark Arc AGI si concentra sulla capacità di un sistema di comprendere e applicare principi di trasformazione attraverso esempi. Ai partecipanti vengono presentati set di input-output e il compito è dedurre la regola sottostante e applicarla per completare un output incompleto.

    Questi compiti, pur essendo intuitivi per gli esseri umani, si sono dimostrati sorprendentemente difficili per i sistemi di intelligenza artificiale. La difficoltà di Arc AGI risiede nel fatto che ogni compito richiede un insieme distinto di abilità. Inoltre, impedisce ai modelli di fare affidamento su schemi memorizzati in fase di apprendimento. La versione 1 di Arc AGI ha visto progressi lenti; passando dallo 0% al 5% di accuratezza in cinque anni con i principali modelli di IA.

    Tuttavia, o3 ha ottenuto un nuovo punteggio all’avanguardia del 75,7% sul set di holdout semi-privato di Arc AI con risorse computazionali limitate. Ancora più notevole è che, aumentando le risorse computazionali per o3, il modello ha raggiunto un punteggio dell’85,7%.

    Questo risultato è particolarmente significativo perché le prestazioni umane su questo benchmark sono comparabili a una soglia dell’85%. Superare questa soglia seppure di pochissimo indica che o3 ha dimostrato una sorta di capacità di ragionamento a livello umano; un risultato senza precedenti per qualsiasi sistema di intelligenza artificiale testato finora.

    Impegno per la sicurezza e l’accessibilità di OpenAI

    Mentre i punteggi ottenuti da o3 nei vari benchmark sono entusiasmanti, OpenAI riconosce che il lavoro nello sviluppo di un’intelligenza artificiale sicura e affidabile è tutt’altro che completo. L’azienda sottolinea la necessità di benchmark più completi e duraturi, come Arc AGI, per misurare e guidare il progresso. Inoltre, OpenAI ha espresso il suo entusiasmo per la collaborazione con entità esterne per sviluppare benchmark di prossima generazione.

    Inoltre, OpenAI sta lavorando a una nuova tecnica chiamata allineamento deliberativo per migliorare ulteriormente la sicurezza dei suoi modelli. Questo metodo sfrutta le capacità di ragionamento dei modelli stessi per identificare e prevenire potenziali prompt non sicuri; un progresso nello sviluppo di sistemi di intelligenza artificiale più sicuri e affidabili.

    o3 mini

    Parallelamente allo sviluppo del modello o3, OpenAI ha presentato anche o3 mini; un modello di ragionamento efficiente in termini di costi che si unisce alla famiglia o1 mini. o3 mini si distingue per la sua capacità di fornire buone prestazioni a un costo inferiore. Come il modello o3, la versione mini non sarà immediatamente accessibile a tutti. OpenAI sta aprendo l’accesso a o3 mini a ricercatori sulla sicurezza per i test. I ricercatori interessati possono candidarsi tramite un modulo sul sito Web di OpenAI. Le domande si chiuderanno il 10 gennaio.

    Una nuova funzionalità, denominata “tempo di pensiero adattivo” nell’API, consentirà di regolare il tempo dedicato dal modello al ragionamento; offre flessibilità per diversi casi d’uso. Le valutazioni iniziali di o3 mini mostrano risultati promettenti nei benchmark di codifica, con prestazioni che migliorano con tempi di pensiero più lunghi e che superano il modello o1 mini con tempi di pensiero medi. In termini di costi ed efficienza, o3 mini definisce una nuova frontiera. Offre prestazioni di codifica comparabili o migliori a un costo inferiore rispetto a o1 mini.

    Una dimostrazione pratica ha evidenziato la capacità di o3 mini di generare ed eseguire codice Python, inclusa la creazione di un server e di un’interfaccia utente per attività di programmazione interattive. o3 mini dimostra anche competenza in matematica; ottiene prestazioni comparabili a o1 mini con tempi di elaborazione ridotti e prestazioni migliori con tempi di elaborazione medi.

    OpenAI Day 12: conclusione

    Sam Altam ha voluto concludere l’evento speciale “12 Days of OpenAI” con la dimostrazione di due modelli IA non ancora disponibili al pubblico, o3 e o3mini.

    Ne ha evidenziato le prestazioni eccezionali su benchmark impegnativi come Epic AI Frontier Math e Arc AGI; un chiaro segnale dei crescenti livelli di sofisticazione raggiunti da questi sistemi. Il raggiungimento di prestazioni a livello umano sul benchmark Arc AGI in contesti di calcolo elevato è un risultato particolarmente degno di nota. Sottolinea il potenziale di questi modelli per affrontare compiti complessi che richiedono capacità di ragionamento avanzate.

    L’annuncio di o3 e o3 mini segnala una fase promettente nello sviluppo dell’intelligenza artificiale, caratterizzata da progressi significativi nelle capacità di ragionamento e da un continuo impegno per la sicurezza e la collaborazione.

    AI app apps blog canvas ChatGPT LLM news o1 o2 o3 o3mini OpenAI picks tech tecnologia warp xcode
    Seguici su X (Twitter) Seguici su Bluesky Seguici su WhatsApp
    Share. Facebook Twitter Pinterest
    Previous ArticleAnker MagGo 3-in-1: stazione di ricarica wireless Qi2
    Next Article TerraTech è in regalo su Epic Games
    Graziano
    • Website

    Reporter e recensore presso Gomoot, mi occupo di riportare notizie riguardanti la tecnologia. Ho cominciato con C64, Amiga, fino al 486; ora seguo con passione la tecnologia attuale e adoro in particolare i desktop SFF e i mini pc. Appassionato di informatica e linguaggi di programmazione nel tempo libero amo praticare trekking e stare all'aperto.

    Articoli collegati

    gemma 3n
    Intelligenza artificiale

    Gemma 3n, l’AI open source di Google pensata per dispositivi mobili

    27/06/2025
    Gemini CLI
    Intelligenza artificiale

    Gemini CLI: Google lancia l’AI open source e gratuita per il terminale

    26/06/202525 Views
    ChatGPT Record
    Intelligenza artificiale

    ChatGPT Record per Mac: registra la voce, e riassume tutto in testo

    24/06/2025
    Add A Comment
    Leave A Reply Cancel Reply

    Ultimi articoli
    Enermax PlatiGemini 1200W

    Enermax PlatiGemini 1200W: alimentatore Dual-ATX Premium

    29/06/2025
    nubia z70 ultra

    Nubia Z70 Ultra, il top per le foto con camera da 35 mm

    29/06/202530 Views
    Realme GT 7 Pro

    Realme GT 7 Pro: potenza e stile in un tutt’uno

    29/06/2025308 Views
    Belkin SoundForm Isolate

    Belkin SoundForm Isolate: cuffie wireless con ANC ibrida e 60 ore di autonomia

    29/06/202519 Views
    Gigabyte AORUS FI32Q X

    Gigabyte AORUS FI32Q X: un best buy per il QHD a 32 pollici

    28/06/202564 Views

    Poco M7 Pro conquista la fascia entry con display a 90Hz e fotocamera da 64MP

    28/06/202538 Views
    Gomoot : tecnologia e lifestyle
    Mastodon WhatsApp X (Twitter) Instagram Threads
    • Home
    • Tech
    • Mobiles
    • Contatti
    • Privacy
    • ABOUT
    © 2025 GOMOOT.COM

    Type above and press Enter to search. Press Esc to cancel.

    Sign In or Register

    Welcome Back!

    Login below or Register Now.

    Continua con Google
    Lost password?

    Register Now!

    Already registered? Login.

    Continua con Google

    A password will be e-mailed to you.