Close Menu
    Ultimi Articoli

    Oukitel WP35, rugged phone 5G compatto, completo e conveniente

    03/07/2025
    figment

    Figment in regalo su Epic Games

    03/07/2025
    Backpack Hero

    Backpack Hero in regalo su Epic Games

    03/07/2025
    Moondrop Pill

    Moondrop Pill: auricolari a clip OWS dal design fuori dagli schemi e suono piacevole

    02/07/2025
    Smart Tracker Aowoka

    Smart Tracker Aowoka per localizzare gli oggetti smarriti

    02/07/2025
    EERO 7

    Eero 7: sistema mesh Wi-Fi 7 economico, smart e facile da usare

    02/07/2025
    BenQ GW2486TC

    BenQ GW2486TC : monitor IPS perfetto per uffici e postazioni smart working

    02/07/2025
    TCL Tab 11 Gen2 FE

    TCL Tab 11 NXTVISION per studio, lavoro o intrattenimento

    01/07/2025
    venerdì, Luglio 4
    Trending
    • Oukitel WP35, rugged phone 5G compatto, completo e conveniente
    • Figment in regalo su Epic Games
    • Backpack Hero in regalo su Epic Games
    • Moondrop Pill: auricolari a clip OWS dal design fuori dagli schemi e suono piacevole
    • Smart Tracker Aowoka per localizzare gli oggetti smarriti
    • Eero 7: sistema mesh Wi-Fi 7 economico, smart e facile da usare
    • BenQ GW2486TC : monitor IPS perfetto per uffici e postazioni smart working
    • TCL Tab 11 NXTVISION per studio, lavoro o intrattenimento
    Login
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    • Home
    • Computer
      1. MINI PC
      2. Laptop
      3. Monitor
      4. Teoria
      5. Mouse
      6. GPU
      7. Windows
      8. Motherboard
      9. Tastiere
      10. View All
      Acemagic K1

      Acemagic K1 mini PC, potenza e risparmio energetico

      28/06/2025
      UM870 Slim

      Minisforum UM870 Slim: potenza AMD Ryzen in un design compatto

      22/06/2025
      Beelink SER8

      Beelink SER8, un mini PC con Radeon 780M e USB4, pronto (quasi) a tutto.

      16/06/2025
      Beelink EQR6

      Beelink EQR6 con Ryzen 6900HX: un mini PC potente e silenzioso

      11/06/2025

      Samsung Galaxy Book4 Pro 360, un elegante tuttofare

      27/06/2025
      Lenovo Chromebook Duet 11

      Lenovo Chromebook Duet 11, un versatile 2-in-1 con 10 anni di aggiornamenti

      24/06/2025
      Lenovo IdeaPad Slim 3

      Lenovo IdeaPad Slim 3: un laptop ideale per studenti

      21/06/2025
      IdeaPad Flex 5

      Lenovo IdeaPad Flex 5 un convertibile 2-in-1 con pen inclusa

      10/06/2025
      BenQ GW2486TC

      BenQ GW2486TC : monitor IPS perfetto per uffici e postazioni smart working

      02/07/2025
      Gigabyte AORUS FI32Q X

      Gigabyte AORUS FI32Q X: un best buy per il QHD a 32 pollici

      28/06/2025

      Philips Evnia 32M2N8900: monitor QD-OLED 4K per gamer esigenti

      23/06/2025
      Gigabyte M27UA

      Gigabyte M27UA: monitor per gaming e design creativo

      20/06/2025
      Bluetooth 6.1

      Bluetooth 6.1: più privacy e autonomia per i dispositivi wireless

      12/05/2025
      ASUS ProArt Z790

      Evoluzione del bus di sistema PCIe fino al PCIe 7

      16/04/2025
      USB

      USB : l’evoluzione di Universal Serial Bus dagli anni 90 ad oggi

      02/02/2025
      bluetooth

      L’evoluzione del Bluetooth: un viaggio attraverso le versioni fino al 6.1

      13/11/2024
      Burst II Air

      Turtle Beach Burst II Air wireless, un mouse gaming di soli 47 gr!

      15/06/2025
      Scimitar Elite Wireless SE

      Corsair Scimitar Elite Wireless SE: un mouse pensato per chi ha bisogno di controllare tutto

      04/06/2025
      Corsair M55

      Mouse Corsair M55 e M55 Wireless: performance top a prezzi accessibili

      19/05/2025
      Logitech G309

      Logitech G309: mouse gaming wireless versatile e potente

      17/05/2025
      amd udna

      UDNA 5, la nuova identità di AMD nel ray tracing: un cambio di rotta molto atteso

      06/05/2025
      RX 9070 XT

      La GPU Radeon RX 9070 XT va a ruba, successo di vendite per AMD

      25/03/2025
      Radeon 8060S

      La Radeon 8060S nelle APU AMD Strix Halo sarà una nuova frontiera per laptop e mini pc

      19/02/2025
      fsr4

      In arrivo l’upscaling con AMD FSR 4, ma solo per GPU RDNA 4

      11/01/2025
      kernel windows

      Antivirus fuori dal kernel: Microsoft cambia le regole su Windows

      27/06/2025
      mu language model

      Mu, un motore AI per gestire le impostazioni di Windows 11

      24/06/2025
      Microsoft passkey

      Microsoft: nuovi account senza password e con passkey di default

      02/05/2025
      windows

      Fine supporto Windows 10: cosa scegliere tra Windows 11 e Linux

      09/01/2025
      MSI MAG Z890 Tomahawk WiFi

      MSI MAG Z890 Tomahawk WiFi: scheda madre top per Intel Ultra

      12/06/2025
      ROG Strix B860-A Gaming

      Asus ROG Strix B860-A Gaming WiFi, motherboard per build ad alte prestazioni.

      25/05/2025
      CVN Z790D5

      Colorful presenta la nuova mobo gaming CVN Z790D5 ARK FROZEN

      22/08/2024
      Z790 Project Zero Plus

      La motherboard Z790 Project Zero Plus porta le DDR5 CAMM2 sui PC desktop

      24/05/2024
      Keys-To-Go 2

      Logitech Keys-To-Go 2: tastiera wireless per laptop, tablet e smartphone

      14/06/2025
      Logitech G515 TKL

      Logitech G515: tastiera gaming TKL sottile e versatile a prezzo accessibile

      04/06/2025
      G915 Lightspeed TKL

      Logitech G915 X LIGHTSPEED TKL: tastiera multiuso con profilo premium

      12/05/2025
      Keychron Q1 HE: tastiera meccanica

      Keychron Q1 HE: tastiera meccanica con switch magnetici Hall Effect

      02/02/2025
      BenQ GW2486TC

      BenQ GW2486TC : monitor IPS perfetto per uffici e postazioni smart working

      02/07/2025
      Enermax PlatiGemini 1200W

      Enermax PlatiGemini 1200W: alimentatore Dual-ATX Premium

      29/06/2025
      Gigabyte AORUS FI32Q X

      Gigabyte AORUS FI32Q X: un best buy per il QHD a 32 pollici

      28/06/2025
      Acemagic K1

      Acemagic K1 mini PC, potenza e risparmio energetico

      28/06/2025
    • Tech
      1. Curiosità
      2. Eventi
      3. memory cards
      4. Powerbank
      5. Smartwatch
      6. Gadgets
      7. Bluetooth speakers
      8. Intelligenza artificiale
      9. Offerte
      10. Software
      11. View All
      grotta lunare

      Scoperta una grotta lunare sotterranea

      16/07/2024
      Oleg Kononenko

      Oleg Kononenko: 1000 giorni nello spazio

      05/06/2024

      GPT-4 supera gli analisti finanziari nella previsione degli utili aziendali

      28/05/2024
      alimenti ultra-processati

      Alimenti ultra-processati collegati a 32 effetti negativi sulla salute

      28/05/2024
      volo elettrico Alia CX300

      Alia CX300: primo volo elettrico passeggeri atterra al JFK

      05/06/2025
      TIM Summer Hits 2025

      Tim Summer Hits 2025 a Roma: Piazza del Popolo si accende anche quest’estate

      31/05/2025
      Starship Flight 9

      Starship Flight 9: una missione tra successi parziali e limiti tecnici

      28/05/2025
      IFT-9

      Starship IFT-9: il test chiave per il riuso del booster Super Heavy

      27/05/2025
      SSD Crucial P310 2TB

      Crucial P310 2TB SSD NVMe: storage ad alta velocità a un ottimo prezzo

      08/06/2025
      V-NAND QLC Samsung

      Il futuro dello storage è pronto: Samsung svela la V-NAND QLC da 1 Tb

      12/09/2024
      microSD SD Express

      Samsung presenta la prima microSD SD Express

      07/03/2024

      ADATA lancia il primo SSD esterno USB4 SE920

      31/10/2023
      Sharge ICEMAG 2

      Sharge ICEMAG 2: power bank Qi2 15W con raffreddamento attivo

      12/05/2025
      Baseus Nomos

      Baseus Nomos Power Bank: ricarica wireless veloce e sicura

      11/05/2025

      Xiaomi Power Bank da 165W: ricarica ultra-rapida e design compatto

      10/04/2025
      belkin

      Belkin Power Bank da 5.000 mAh compatibile con MagSafe e Qi2

      03/11/2024
      Amazfit Balance 2

      Amazfit Balance 2, smartwatch multisport senza abbonamenti

      26/06/2025
      Suunto Run

      Suunto Run, lo smartwatch per chi ama correre

      23/06/2025
      Amazfit Bip 6

      Amazfit Bip 6: autonomia, salute e sport a basso prezzo

      23/06/2025
      Honor Watch 5

      Honor Watch 5: un mix perfetto di stile, funzionalità e innovazione tecnologica

      22/06/2025
      Smart Tracker Aowoka

      Smart Tracker Aowoka per localizzare gli oggetti smarriti

      02/07/2025
      EERO 7

      Eero 7: sistema mesh Wi-Fi 7 economico, smart e facile da usare

      02/07/2025
      Wicked Ball M3

      Il tuo gatto si annoia ? Prova la Cheerble Wicked Ball M3 !

      22/06/2025
      8BitDo Ultimate Mobile Gaming Controller

      8BitDo Ultimate Mobile Gaming Controller porta il gaming su Android

      22/06/2025

      JBL Flip 7, lo speaker Bluetooth portatile solido e versatile

      22/06/2025
      Beats Pill

      Beats Pill (2024): altoparlante Bluetooth compatto e resistente

      22/06/2025
      JBL Flip 6

      JBL Flip 6: speaker Bluetooth compatto, potente e impermeabile

      21/06/2025
      Marshall Killburn III

      Marshall Kilburn III: altoparlante robusto, stereo e vintage

      21/06/2025
      gemma 3n

      Gemma 3n, l’AI open source di Google pensata per dispositivi mobili

      27/06/2025
      Gemini CLI

      Gemini CLI: Google lancia l’AI open source e gratuita per il terminale

      26/06/2025
      ChatGPT Record

      ChatGPT Record per Mac: registra la voce, e riassume tutto in testo

      24/06/2025
      mu language model

      Mu, un motore AI per gestire le impostazioni di Windows 11

      24/06/2025
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      12/04/2025
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      nubia z60 ultra

      Offerte Black Friday Nubia: telefoni premium a prezzi convenienti

      22/11/2024
      Scream Fest 2024

      Steam Scream Fest 2024: sconti horror per Halloween

      29/10/2024
      kernel windows

      Antivirus fuori dal kernel: Microsoft cambia le regole su Windows

      27/06/2025
      Firefox 140

      Firefox 140, un aggiornamento raffinato, pensato per tutti

      24/06/2025
      3DMark

      3DMark arriva su macOS: benchmark grafico completo per i dispositivi Apple

      16/06/2025
      OBS Studio 31.1

      OBS Studio 31.1 porta Multitrack Video anche su Linux

      30/05/2025

      Oukitel WP35, rugged phone 5G compatto, completo e conveniente

      03/07/2025
      Realme P3

      Realme P3 5G, un medio gamma completo sotto i 300 euro

      01/07/2025
      Maxell MXCP-P100

      Maxell MXCP-P100: lettore cassette retrò con Bluetooth 5.4

      30/06/2025
      Xiaomi Smart Band 10

      Xiaomi Smart Band 10: fitness tracker completo ed economico

      30/06/2025
    • Mobiles
      1. Smartphones
      2. View All

      Oukitel WP35, rugged phone 5G compatto, completo e conveniente

      03/07/2025
      Realme P3

      Realme P3 5G, un medio gamma completo sotto i 300 euro

      01/07/2025
      nubia z70 ultra

      Nubia Z70 Ultra, il top per le foto con camera da 35 mm

      29/06/2025
      Realme GT 7 Pro

      Realme GT 7 Pro: potenza e stile in un tutt’uno

      29/06/2025
      TCL Tab 11 Gen2 FE

      TCL Tab 11 NXTVISION per studio, lavoro o intrattenimento

      01/07/2025
      Honor Pad X8a

      Honor Pad X8a: il tablet economico che non delude

      01/07/2025
      Apple Swift

      Swift arriva su Android con supporto ufficiale da Apple

      27/06/2025

      Honor Pad X9a, un tablet low cost ma ricco di funzionalità

      27/06/2025
    • Musica
      1. Cuffie
      2. DAC
      3. hi-fi
      4. Teoria
      5. View All
      Moondrop Pill

      Moondrop Pill: auricolari a clip OWS dal design fuori dagli schemi e suono piacevole

      02/07/2025
      Edifier Comfo C R1

      Auricolari Edifier Comfo C R1: comfort e autonomia 28h

      01/07/2025
      Anker Soundcore A30i

      Soundcore A30i: auricolari TWS compatti ed economici di Anker

      01/07/2025
      JVC Nearphones HA-NP1T

      JVC HA-NP1T Nearphones: auricolari wireless open-ear eleganti con connettività multipoint

      29/06/2025
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      FiiO BTR15

      FiiO BTR15: DAC Bluetooth al prezzo più basso di sempre

      17/05/2025
      DAC ADI-2 DAC FS

      Cosa è un DAC audio

      26/10/2024
      iFi go bar

      Ascolta audio ad alta fedeltà sul tuo Iphone con l’amp/DAC Hi-Res portatile iFi GO bar.

      03/08/2024
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      Focal Aria 926

      Componenti per un ottimo impianto stereo

      31/07/2024

      Garmin acquista JL Audio

      16/08/2023
      Credits Technics : amplificatore digitale SE-R1

      Come ascoltare musica allo stereo con la qualità più alta possibile

      06/05/2023
      truffa phishing zalando

      Truffa phishing: in regalo la gift card Zalando da 150€

      06/12/2024
      sim ed esim

      Differenza tra SIM fisica ed eSIM: vantaggi e sicurezza

      02/11/2024

      Malware: cosa sono e come difendersi

      19/10/2024
      crittografia a cosa serve

      Crittografia, come funziona e perchè dobbiamo utilizzarla

      16/10/2024
      Moondrop Pill

      Moondrop Pill: auricolari a clip OWS dal design fuori dagli schemi e suono piacevole

      02/07/2025
      Edifier Comfo C R1

      Auricolari Edifier Comfo C R1: comfort e autonomia 28h

      01/07/2025
      Anker Soundcore A30i

      Soundcore A30i: auricolari TWS compatti ed economici di Anker

      01/07/2025
      JVC Nearphones HA-NP1T

      JVC HA-NP1T Nearphones: auricolari wireless open-ear eleganti con connettività multipoint

      29/06/2025
    • Lifestyle
      1. Criptovalute
      2. EV
      3. Gaming
      4. Trekking
      5. Scienze
      6. View All
      Coinbase

      Coinbase colpita da attacco informatico e minaccia di riscatto

      15/05/2025
      coinbase

      Coinbase : acquisti cripto tramite Apple Pay

      03/12/2024
      criptovalute

      Criptovalute: cosa sono e come funzionano le monete virtuali

      19/10/2024
      Solana

      Visa punta sulla blockchain Solana: i motivi della partnership

      18/09/2023
      Volkswagen ID.1

      Volkswagen ID.1: l’auto elettrica da 20000 euro arriva nel 2027

      05/02/2025
      microvast

      Microvast: l’innovazione nelle batterie allo stato solido

      13/01/2025
      BYD

      BYD e Tesla: sfida per il primato nel mercato EV

      03/01/2025
      batterie 4680

      Panasonic sfida il mercato EV con le batterie 4680: cosa cambia?

      09/09/2024
      figment

      Figment in regalo su Epic Games

      03/07/2025
      Backpack Hero

      Backpack Hero in regalo su Epic Games

      03/07/2025
      Pipistrello and the Cursed Yoyo

      Pipistrello and the Cursed Yoyo: un’avventura retrò tra satira e dungeon

      01/07/2025
      Sable

      Sable è in regalo su Epic Games

      26/06/2025
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      8a Scarpinata della Teverina

      A spasso per i sentieri: 8a Scarpinata della Teverina

      14/05/2024
      Valli e Calanchi

      A spasso per i sentieri: 1a Valli e Calanchi

      27/09/2023
      Maternum Marathon 2023

      A spasso per i sentieri: la 2a edizione di Maternum Marathon

      13/06/2023
      urano

      Le lune esterne di Urano Titania e Oberon, sono scure sul lato anteriore.

      19/06/2025
      Muon g-2

      L’anomalia Muon g-2 segue le leggi del Modello Standard

      13/06/2025
      Neuroplatform finalspark

      Neuroplatform, piattaforma online alimentata dal primo processore biologico al mondo

      27/05/2024
      AlphaFold 3 di Google DeepMind

      AlphaFold 3 di Google DeepMind

      08/05/2024
      audiolibri

      Il mercato degli audiolibri è in crescita: numeri e tendenze

      27/06/2025
      urano

      Le lune esterne di Urano Titania e Oberon, sono scure sul lato anteriore.

      19/06/2025
      Spaceballs 2

      Spaceballs 2: Mel Brooks torna nel sequel satirico del 2027

      15/06/2025
      Muon g-2

      L’anomalia Muon g-2 segue le leggi del Modello Standard

      13/06/2025
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    Home»Tech»Intelligenza artificiale»OpenAI o1, il modello che ragiona prima di rispondere
    Intelligenza artificiale

    OpenAI o1, il modello che ragiona prima di rispondere

    OpenAI o1: l'IA che ragiona prima di rispondere, un salto importante nelle capacità di ragionamento artificiale, un nuovo paradigma per l'IA nel problem solving
    GrazianoGraziano13/09/2024Updated:13/09/2024012 Mins Read30 Views
    Share Twitter Facebook Pinterest Reddit Telegram WhatsApp Email
    OpenAI o1
    Share
    Facebook Twitter Pinterest Reddit Telegram WhatsApp Email Threads

    OpenAI ha presentato qualche ora fa 2 nuovi modelli di intelligenza artificiale denominati “o1-preview” e “o1-mini“; sono progettati per affrontare problemi complessi. Questi modelli si distinguono per la loro capacità di “ragionare” prima di fornire una risposta. No, OpenAI o1 non è ancora un’AGI! Anche se OpenAI sembra essere sulla strada giusta per arrivarci.

    OpenAI o1

    Questa tecnologia il cui nome in codice è il tanto vociferato Strawberry è un significativo passo avanti; supera le prestazioni dei modelli precedenti soprattutto in ambiti come la scienza, la programmazione e la matematica. L’obiettivo principale di OpenAI con questa nuova serie è quello di creare un’intelligenza artificiale in grado di emulare il processo di pensiero umano; analizzando attentamente i problemi, considerando diverse strategie e correggendo eventuali errori durante il processo di ragionamento.

    We're releasing a preview of OpenAI o1—a new series of AI models designed to spend more time thinking before they respond.

    These models can reason through complex tasks and solve harder problems than previous models in science, coding, and math. https://t.co/peKzzKX1bu

    — OpenAI (@OpenAI) September 12, 2024

    Questa nuova serie di modelli offre una capacità di problem-solving che durante test di benchmark supera quella di molti esperti umani. Il lancio di questi modelli potrebbe essere una svolta non solo per OpenAI, ma per l’intero campo dell’IA; apre nuove possibilità in settori che richiedono un ragionamento e una comprensione profonda.

    Il funzionamento tecnico di OpenAI o1

    Il cuore del funzionamento di OpenAI o1-preview risiede in un algoritmo di apprendimento per rinforzo su larga scala. Questo metodo consente al modello di apprendere come utilizzare efficacemente il “Chain of Thought“; ovvero la catena di pensiero, per affrontare problemi in modo produttivo. Durante il processo di addestramento, il modello ottimizza continuamente la sua catena di pensiero attraverso l’apprendimento per rinforzo; migliora progressivamente la sua capacità di risolvere problemi complessi.

    OpenAI ha osservato che le prestazioni del modello o1 migliorano significativamente con l’aumento del tempo dedicato all’apprendimento per rinforzo durante l’addestramento e del tempo di inferenza durante i test. Questo approccio basato sull’inferenza si differenzia notevolmente dai metodi tradizionali di pre-addestramento dei modelli linguistici di grandi dimensioni (LLM); offre vantaggi unici in termini di scalabilità e adattabilità a diverse tipologie di problemi.

    Il modello o1-preview potenzia notevolmente la sua capacità di affrontare compiti di ragionamento complessi attraverso l’implementazione della Chain of Thought . Questo concetto si ispira al processo cognitivo umano nell’affrontare problemi difficili; scomporre il problema in passaggi più piccoli, sperimenta strategie diverse e corregge gli errori lungo il percorso.

    Grazie all’addestramento basato sull’apprendimento per rinforzo, o1-preview è in grado di riflettere approfonditamente prima di fornire una risposta; raffinando progressivamente i passaggi del suo ragionamento. Questo metodo di ragionamento migliora significativamente le prestazioni di o1-preview in compiti complessi. Il modello o1-preview è in grado di scomporre gradualmente la difficoltà di un problema, giungendo infine alla soluzione corretta; un processo che rispecchia il modo in cui gli esseri umani affrontano sfide cognitive impegnative.

    Se vuoi approfondire il funzionamento di OpenAI o1 puoi leggere questo pdf.

    Valutazione e benchmark di OpenAI o1

    Per valutare le prestazioni del nuovo modello o1-preview, OpenAI ha condotto una serie di test, confrontandoli solo con il suo predecessore GPT-4o e con esperti umani in vari campi. OpenAI ha evitato ogni confronto con altri modelli IA come Claude Sonnet 3.5, Gemini, LLama, Grok ed altri.

    I risultati di questi test hanno dimostrato un notevole miglioramento delle capacità di ragionamento e problem-solving del nuovo modello.

    Uno dei test più significativi è stato l’AIME (American Invitational Mathematics Examination); un esame di matematica avanzata per studenti delle scuole superiori negli Stati Uniti. In questo contesto, il modello o1-preview ha risolto il 93% dei problemi; il modello si posiziona tra i migliori 500 studenti a livello nazionale e supera la soglia per la qualificazione all’Olimpiade Matematica degli Stati Uniti. Questo risultato è notevole se si considera che il modello GPT-4o ha risolto solo il 12% dei problemi nello stesso test.

    OpenAI o1

    o1 è valido anche in altri settori

    Anche se o1 eccelle in matematica e nel coding, il modello si fa valere anche in altri settori. E’ stato testato sul benchmark MMLU (Massive Multitask Language Understanding); un test che copre 57 diverse materie che vanno dalla storia e letteratura all’economia e alla chimica. In questo test o1 ha sovraperformato GPT-4o in 54 aree su 57 .

    OpenAI o1
    Comparazione tra gpt-4o e il modello o1

    Nel benchmark GPQA, che valuta la conoscenza in fisica, chimica e biologia, o1-preview ha superato le prestazioni di esperti con dottorato di ricerca; diventa così il primo modello di IA a raggiungere questo traguardo.

    LSAT è l’esame che viene tradizionalmente utilizzato per valutare le capacità di ragionamento logico e analitico degli aspiranti studenti di giurisprudenza. Questo tipo di test può essere utilizzato per valutare le abilità di comprensione del linguaggio naturale, il ragionamento e la capacità di risolvere problemi complessi di un modello di IA. Nel test LSAT (Law School Admission Test) o1 raggiunge il valore di 98.9% ! GPT-4o non andava oltre il 69.5% .

    In termini di programmazione, OpenAI o1 ha ottenuto un punteggio Elo di 1807 nei concorsi di programmazione simulati di Codeforces; ha superando il 93% dei concorrenti umani. Questo risultato segna un miglioramento significativo rispetto a GPT-4o, che ottiene un punteggio Elo di 808.

    Questi benchmark indicano che OpenAI o1 è in grado di risolvere attività di routine e affrontare problemi altamente complessi in più domini.

    Sebbene questi risultati non significhino che o1-preview sia superiore agli esperti umani in tutti i compiti, dimostra un livello di capacità di risoluzione dei problemi che si avvicina o supera quello dei dottori di ricerca in determinati ambiti specifici.

    Applicazioni pratiche nella scienza e nella ricerca

    Il nuovo modello di ragionamento o1-preview si presta particolarmente bene alla gestione di problemi complessi in ambiti scientifici, di programmazione e matematici. Le sue potenziali applicazioni spaziano in diversi settori cruciali per l’innovazione e la ricerca.

    Nel campo medico, i ricercatori possono utilizzare o1-preview per annotare dati complessi di sequenziamento cellulare; si aprono nuove strade per la comprensione di malattie e lo sviluppo di terapie mirate.

    Nel settore della fisica, il modello può assistere gli scienziati nella generazione di formule matematiche complesse; particolarmente utili per calcoli nel campo dell’ottica quantistica. Questo potrebbe accelerare la ricerca in aree di frontiera della fisica teorica e applicata.

    Per gli sviluppatori software, o1-preview offre un supporto prezioso nella costruzione ed esecuzione di flussi di lavoro multi-step; semplifica la gestione di compiti di programmazione complessi. Questa capacità potrebbe rivoluzionare e velocizzare il modo in cui il software viene sviluppato, debuggato e ottimizzato; porterà a un’efficienza senza precedenti nel ciclo di sviluppo del software.

    Applicazioni pratiche alla portata di tutti

    Il modello OpenAI o1 può essere di grande aiuto anche per gli utilizzatori comuni. Grazie alle sue avanzate capacità di ragionamento, il modello può essere utilizzato in diversi contesti quotidiani. Ad esempio, potrebbe essere impiegato per analizzare referti medici, fornendo spiegazioni dettagliate e comprensibili delle terminologie mediche complesse; un aiuto a comprendere meglio la propria salute.

    Inoltre, il modello può essere utilizzato per supportare l’apprendimento; oppure spiegazioni dettagliate su concetti complessi in matematica o scienze; per rendere più accessibili argomenti che potrebbero risultare difficili da comprendere attraverso i metodi tradizionali.

    Un altro esempio pratico è l’uso del modello per la gestione finanziaria personale. Grazie alla sua capacità di analizzare dati complessi ed allegati, il modello potrebbe aiutare a interpretare estratti conto bancari, identificare modelli di spesa e suggerire modi per ottimizzare il budget personale.

    Inoltre, il modello potrebbe essere utilizzato per generare idee creative o per assistere nella scrittura di documenti; con suggerimenti di miglioramento stilistico o grammaticale. In ambito educativo, potrebbe supportare gli studenti nello studio; può aiutarli a risolvere problemi matematici o a comprendere meglio i concetti scientifici attraverso spiegazioni passo-passo.

    Qui sotto vediamo come sia semplice e alla portata di tutti creare un semplice gioco, il noto Snake, facendosi assistere da o1.

    OpenAI o1-mini: una versione più agile e veloce

    Parallelamente al lancio di o1-preview, OpenAI ha introdotto o1-mini. E’ una versione più compatta e veloce del modello, focalizzata sulla generazione e il debug di codice. o1-mini si distingue per la sua efficienza in termini di costi, con una riduzione dell’80% rispetto a o1-preview, mantenendo al contempo prestazioni elevate in ambiti STEM (Scienza, Tecnologia, Ingegneria e Matematica).

    Il modello eccelle particolarmente in compiti di programmazione, matematica e scienze, offrendo un equilibrio ottimale tra prestazioni e costo computazionale. o1-mini utilizza lo stesso pipeline di apprendimento per rinforzo computazionalmente intensivo di o1 durante il pre-addestramento; genera prestazioni simili su molti compiti di ragionamento, ma a un costo significativamente inferiore. Sebbene le sue prestazioni siano inferiori in compiti che richiedono conoscenze non-STEM, o1-mini si avvicina molto alle capacità di o1-preview e o1 nel campo del ragionamento STEM.

    Entrambi i modelli supportano una modesta finestra di contesto fino a 128k token (circa 4 file pdf di poche pagine). In conclusione, l’utilizzo del modello OpenAI o1 richiede una comprensione delle proprie esigenze specifiche e delle capacità del modello. Con la sua capacità di ragionare prima di rispondere, il modello o1 offre un’opportunità unica per affrontare problemi complessi in modo più efficace rispetto ai modelli precedenti.

    Come accedere al modello OpenAI o1

    L’acesso ai modelli OpenAI o1, noti anche come “Strawberry” per il momento non è gratuito; come lo è invece GPT-4o da browser o da app Android/iOS. Si può accedere già da oggi ai modelli tramite ChatGPT Plus o attraverso l’API di OpenAI, a seconda delle necessità specifiche.

    OpenAI potrebbe rendere accessibile a tutti gli utenti gratuiti la versione ridotta o1-mini, entro qualche giorno.

    Gli abbonati a ChatGPT Plus possono selezionare il modello o1-preview o o1-mini attraverso il selettore di modelli, con limiti di messaggi settimanali di 30 per o1-preview e 50 per o1-mini. Per gli sviluppatori, l’accesso avviene tramite l’API, che consente di integrare il modello o1 nelle proprie applicazioni.

    L’API offre un limite di 20 richieste al minuto, con piani per aumentare questi limiti in futuro. Tuttavia, attualmente l’API non supporta alcune funzionalità avanzate come le chiamate di funzione e le risposte in streaming. Per integrare il modello, è consigliabile consultare la documentazione ufficiale di OpenAI, che fornisce dettagli su come iniziare e sfruttare al meglio le capacità del modello.

    Il modello o1-preview è particolarmente adatto per compiti che richiedono un ragionamento complesso e una conoscenza generale ampia, mentre il modello o1-mini offre una soluzione più economica e veloce, ideale per applicazioni che necessitano di capacità di ragionamento senza un ampio bagaglio di conoscenze generali.

    Naturalmente, come accade con altri modelli popolari (Claude, Gemini, LLama) anchei modelli o1-preview o o1-mini saranno presto disponibili in servizi di terze parti in abbonamento; parliamo di servizi come Poe, Perplexity e altri. Il servizio You.com ha già inserito i modelli OpenAI o1 nella sua interfaccia.

    OpenAI API : prezzi di o1-preview e o1-mini

    Se sei uno sviluppatore o ricercatore che utilizza le API di OpenAI, devi sapere che i modelli OpenAI o1-preview e o1-mini presentano differenze significative in termini di costi e funzionalità rispetto GPT-4o.

    Il modello o1-preview è il più avanzato della serie, progettato per affrontare compiti complessi che richiedono una conoscenza generale ampia. Questo modello ha un costo di $15 per ogni milione di token di input e $60 per ogni milione di token di output. È particolarmente adatto per applicazioni che richiedono un ragionamento approfondito e una capacità di problem-solving su vasta scala, come la scienza e la matematica avanzata.

    D’altra parte, il modello o1-mini è una versione più economica e veloce, ideale per compiti di coding, matematica e scienza. Il costo per il modello o1-mini è notevolmente inferiore, con un prezzo di $3 per ogni milione di token di input e $12 per ogni milione di token di output. Questa riduzione del costo del 80% rispetto al modello o1-preview rende l’o1-mini una scelta eccellente per sviluppatori e ricercatori che necessitano di potenti capacità di ragionamento senza un ampio bagaglio di conoscenze generali.

    Pro e contro di OpenAI o1

    Abbiamo parlato a lungo dei vantaggi di OpenAI o1. Se vogliamo considerare anche i contro e non solo i pro, bisogna notare che OpenAI o1 richiede un calcolo computazionale molto più elevato se comparato con GPT4-o; di conseguenza è un modello che è più costoso, sia per chi lo usa sia per il dispendio energetico richiesto.

    Ma questi sono i prezzi da pagare per l’innovazione IA. OpenAI o1 è anche considerevolmente più lento di GPT4-o, in quanto deve completare la fase di “thinking” prima di rispondere. Il vantaggio è che OpenAI o1 ti darà molto probabilmente la risposta migliore.

    Alla domanda “dammi 5 nazioni con la lettera A in terza posizione nel nome“, GPT-4o ha risposto in 3 secondi , ma ha fornito 5 risposte incorrette. Alla stessa domanda o1 ha risposto correttamente, ma il modello ha richiesto 32 secondi. Anche o1-mini risponde correttamente al prompt e con un tempo di soli 9 secondi. Tempo molto inferiore al modello o1, ma il triplo del tempo rispetto GPT-4o.

    OpenAI o1: conclusioni

    L’introduzione dei modelli o1-preview e o1-mini dimostrano la nuova capacità da parte dei modelli IA di emulare il processo di pensiero umano in modo più accurato, dedicando tempo alla riflessione prima di fornire risposte a problemi complessi.

    Le prestazioni in ambiti come la matematica, la programmazione e le scienze aprono nuove possibilità per l’applicazione dell’IA in settori critici della ricerca e dell’innovazione. E’ importante ricordare e considerare che, nonostante questi progressi, l’IA rimane uno strumento da utilizzare con cautela e sotto la supervisione umana. Le implicazioni etiche e sociali dell’implementazione di sistemi di IA così avanzati richiedono una riflessione continua.

    Non siamo ad un punto di arrivo, questo è ancora solo l’inizio. OpenAI sta pianificando aggiornamenti e miglioramenti regolari a questi modelli. OpenAI sta inoltre continuando a sviluppare modelli della serie GPT insieme a questa nuova serie o1; poi non dimentichiamoci dell’annunciata e mai lanciata voice chat GPT; quindi ci sarà molto da aspettarsi in futuro. Aspettiamoci anche risposte dalla concorrenza; con Anthropic in prima linea che ancora non ha lanciato Claude Opus 3.5 e che già in passato ha superato le perfomance dei modelli OpenAI.

    AGI Anthropic API blog ChatGPT Claude Copilot gemini Grok ia modello news o1 o1mini OpenAI picks Strawberry tech tecnologia
    Seguici su X (Twitter) Seguici su Bluesky Seguici su WhatsApp
    Share. Facebook Twitter Pinterest
    Previous ArticleRainbow 2 Pro Elite: controller wireless
    Next Article AirPods Max: eleganza e innovazione del suono nelle cuffie Apple
    Graziano
    • Website

    Reporter e recensore presso Gomoot, mi occupo di riportare notizie riguardanti la tecnologia. Ho cominciato con C64, Amiga, fino al 486; ora seguo con passione la tecnologia attuale e adoro in particolare i desktop SFF e i mini pc. Appassionato di informatica e linguaggi di programmazione nel tempo libero amo praticare trekking e stare all'aperto.

    Articoli collegati

    gemma 3n
    Intelligenza artificiale

    Gemma 3n, l’AI open source di Google pensata per dispositivi mobili

    27/06/2025
    Gemini CLI
    Intelligenza artificiale

    Gemini CLI: Google lancia l’AI open source e gratuita per il terminale

    26/06/202529 Views
    ChatGPT Record
    Intelligenza artificiale

    ChatGPT Record per Mac: registra la voce, e riassume tutto in testo

    24/06/2025
    Add A Comment
    Leave A Reply Cancel Reply

    Ultimi articoli

    Oukitel WP35, rugged phone 5G compatto, completo e conveniente

    03/07/2025
    figment

    Figment in regalo su Epic Games

    03/07/2025
    Backpack Hero

    Backpack Hero in regalo su Epic Games

    03/07/2025
    Moondrop Pill

    Moondrop Pill: auricolari a clip OWS dal design fuori dagli schemi e suono piacevole

    02/07/2025
    Smart Tracker Aowoka

    Smart Tracker Aowoka per localizzare gli oggetti smarriti

    02/07/2025
    EERO 7

    Eero 7: sistema mesh Wi-Fi 7 economico, smart e facile da usare

    02/07/2025
    Gomoot : tecnologia e lifestyle
    Mastodon WhatsApp X (Twitter) Instagram Threads
    • Home
    • Tech
    • Mobiles
    • Contatti
    • Privacy
    • ABOUT
    © 2025 GOMOOT.COM

    Type above and press Enter to search. Press Esc to cancel.

    Sign In or Register

    Welcome Back!

    Login below or Register Now.

    Continua con Google
    Lost password?

    Register Now!

    Already registered? Login.

    Continua con Google

    A password will be e-mailed to you.