Close Menu
    Ultimi Articoli

    POCO F7 Ultra, un flagship killer con Snapdragon 8 Elite, display 2K e Wi-Fi 7

    14/06/202532 Views
    Keys-To-Go 2

    Logitech Keys-To-Go 2: tastiera wireless per laptop, tablet e smartphone

    14/06/202550 Views
    Honor 200 Lite

    Honor 200 Lite, il processore Dimensity 6080 regge alla grande

    14/06/202554 Views
    Huawei Watch GT 5

    Huawei Watch GT 5, il nuovo sistema TruSense per la salute al polso

    14/06/202527 Views

    OXS Storm G2: la nuova frontiera del gaming wireless con 7.1 surround

    14/06/2025

    FRITZ!Box 7690, un perfetto router domestico Wi-Fi 7

    13/06/202527 Views
    ASUS ZenScreen MB169CK

    Monitor ASUS ZenScreen MB169CK: senza stress in viaggio

    13/06/2025
    Muon g-2

    L’anomalia Muon g-2 segue le leggi del Modello Standard

    13/06/202516 Views
    sabato, Giugno 14
    Trending
    • POCO F7 Ultra, un flagship killer con Snapdragon 8 Elite, display 2K e Wi-Fi 7
    • Logitech Keys-To-Go 2: tastiera wireless per laptop, tablet e smartphone
    • Honor 200 Lite, il processore Dimensity 6080 regge alla grande
    • Huawei Watch GT 5, il nuovo sistema TruSense per la salute al polso
    • OXS Storm G2: la nuova frontiera del gaming wireless con 7.1 surround
    • FRITZ!Box 7690, un perfetto router domestico Wi-Fi 7
    • Monitor ASUS ZenScreen MB169CK: senza stress in viaggio
    • L’anomalia Muon g-2 segue le leggi del Modello Standard
    Login
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    • Home
    • Computer
      1. MINI PC
      2. Laptop
      3. Monitor
      4. Teoria
      5. Mouse
      6. GPU
      7. Windows
      8. Motherboard
      9. Tastiere
      10. View All
      Beelink EQR6

      Beelink EQR6 con Ryzen 6900HX: un mini PC potente e silenzioso

      11/06/2025
      NiPoGi E1

      NiPoGi E1: un mini pc che consuma quanto una lampadina

      10/06/2025
      GMKtec NucBox K11

      GMKtec NucBox K11, una soluzione completa per produttività e intrattenimento

      31/05/2025
      Minisforum UM690L Slim

      Minisforum UM690L Slim: prestazioni desktop in dimensioni ultra compatte

      26/05/2025
      IdeaPad Flex 5

      Lenovo IdeaPad Flex 5 un convertibile 2-in-1 con pen inclusa

      10/06/2025
      Lenovo ThinkPad P1 Gen 7

      Lenovo ThinkPad P1 Gen 7 con memoria LPCAMM2

      08/06/2025
      Galaxy Chromebook Plus

      Samsung Galaxy Chromebook Plus: veloce, leggero e sottile

      24/05/2025
      ExpertBook P5

      Asus ExpertBook P5, un laptop per professionisti

      11/05/2025
      ASUS ZenScreen MB169CK

      Monitor ASUS ZenScreen MB169CK: senza stress in viaggio

      13/06/2025
      Arzopa A1S

      ARZOPA A1S, il monitor portatile ideale

      11/06/2025
      MSI MPG 272URX QD-OLED

      MSI MPG 272URX QD-OLED : soluzione completa per gioco e produttività

      09/06/2025
      UltraSharp U2725QE

      Dell UltraSharp U2725QE: un monitor 4K ideale per professionisti e creativi

      08/06/2025
      Bluetooth 6.1

      Bluetooth 6.1: più privacy e autonomia per i dispositivi wireless

      12/05/2025
      ASUS ProArt Z790

      Evoluzione del bus di sistema PCIe fino al PCIe 7

      16/04/2025
      USB

      USB : l’evoluzione di Universal Serial Bus dagli anni 90 ad oggi

      02/02/2025
      bluetooth

      L’evoluzione del Bluetooth: un viaggio attraverso le versioni fino al 6.1

      13/11/2024
      Scimitar Elite Wireless SE

      Corsair Scimitar Elite Wireless SE: un mouse pensato per chi ha bisogno di controllare tutto

      04/06/2025
      Corsair M55

      Mouse Corsair M55 e M55 Wireless: performance top a prezzi accessibili

      19/05/2025
      Logitech G309

      Logitech G309: mouse gaming wireless versatile e potente

      17/05/2025
      Mouse NZXT Lift 2

      Mouse NZXT Lift 2, mouse filare ultraleggero e preciso

      14/04/2025
      amd udna

      UDNA 5, la nuova identità di AMD nel ray tracing: un cambio di rotta molto atteso

      06/05/2025
      RX 9070 XT

      La GPU Radeon RX 9070 XT va a ruba, successo di vendite per AMD

      25/03/2025
      Radeon 8060S

      La Radeon 8060S nelle APU AMD Strix Halo sarà una nuova frontiera per laptop e mini pc

      19/02/2025
      fsr4

      In arrivo l’upscaling con AMD FSR 4, ma solo per GPU RDNA 4

      11/01/2025
      Microsoft passkey

      Microsoft: nuovi account senza password e con passkey di default

      02/05/2025
      windows

      Fine supporto Windows 10: cosa scegliere tra Windows 11 e Linux

      09/01/2025
      Windows 11

      Aggiornamenti bloccati per un bug nei supporti Windows 11

      27/12/2024
      ChatGPT su Windows

      ChatGPT arriva su Windows, come utilizzare l’app su desktop

      18/11/2024
      MSI MAG Z890 Tomahawk WiFi

      MSI MAG Z890 Tomahawk WiFi: scheda madre top per Intel Ultra

      12/06/2025
      ROG Strix B860-A Gaming

      Asus ROG Strix B860-A Gaming WiFi, motherboard per build ad alte prestazioni.

      25/05/2025
      CVN Z790D5

      Colorful presenta la nuova mobo gaming CVN Z790D5 ARK FROZEN

      22/08/2024
      Z790 Project Zero Plus

      La motherboard Z790 Project Zero Plus porta le DDR5 CAMM2 sui PC desktop

      24/05/2024
      Keys-To-Go 2

      Logitech Keys-To-Go 2: tastiera wireless per laptop, tablet e smartphone

      14/06/2025
      Logitech G515 TKL

      Logitech G515: tastiera gaming TKL sottile e versatile a prezzo accessibile

      04/06/2025
      G915 Lightspeed TKL

      Logitech G915 X LIGHTSPEED TKL: tastiera multiuso con profilo premium

      12/05/2025
      Keychron Q1 HE: tastiera meccanica

      Keychron Q1 HE: tastiera meccanica con switch magnetici Hall Effect

      02/02/2025
      Keys-To-Go 2

      Logitech Keys-To-Go 2: tastiera wireless per laptop, tablet e smartphone

      14/06/2025

      FRITZ!Box 7690, un perfetto router domestico Wi-Fi 7

      13/06/2025
      ASUS ZenScreen MB169CK

      Monitor ASUS ZenScreen MB169CK: senza stress in viaggio

      13/06/2025
      MSI MAG Z890 Tomahawk WiFi

      MSI MAG Z890 Tomahawk WiFi: scheda madre top per Intel Ultra

      12/06/2025
    • Tech
      1. Curiosità
      2. Eventi
      3. memory cards
      4. Powerbank
      5. Smartwatch
      6. Gadgets
      7. Bluetooth speakers
      8. Intelligenza artificiale
      9. Offerte
      10. Software
      11. View All
      grotta lunare

      Scoperta una grotta lunare sotterranea

      16/07/2024
      Oleg Kononenko

      Oleg Kononenko: 1000 giorni nello spazio

      05/06/2024

      GPT-4 supera gli analisti finanziari nella previsione degli utili aziendali

      28/05/2024
      alimenti ultra-processati

      Alimenti ultra-processati collegati a 32 effetti negativi sulla salute

      28/05/2024
      volo elettrico Alia CX300

      Alia CX300: primo volo elettrico passeggeri atterra al JFK

      05/06/2025
      TIM Summer Hits 2025

      Tim Summer Hits 2025 a Roma: Piazza del Popolo si accende anche quest’estate

      31/05/2025
      Starship Flight 9

      Starship Flight 9: una missione tra successi parziali e limiti tecnici

      28/05/2025
      IFT-9

      Starship IFT-9: il test chiave per il riuso del booster Super Heavy

      27/05/2025
      SSD Crucial P310 2TB

      Crucial P310 2TB SSD NVMe: storage ad alta velocità a un ottimo prezzo

      08/06/2025
      V-NAND QLC Samsung

      Il futuro dello storage è pronto: Samsung svela la V-NAND QLC da 1 Tb

      12/09/2024
      microSD SD Express

      Samsung presenta la prima microSD SD Express

      07/03/2024

      ADATA lancia il primo SSD esterno USB4 SE920

      31/10/2023
      Sharge ICEMAG 2

      Sharge ICEMAG 2: power bank Qi2 15W con raffreddamento attivo

      12/05/2025
      Baseus Nomos

      Baseus Nomos Power Bank: ricarica wireless veloce e sicura

      11/05/2025

      Xiaomi Power Bank da 165W: ricarica ultra-rapida e design compatto

      10/04/2025
      belkin

      Belkin Power Bank da 5.000 mAh compatibile con MagSafe e Qi2

      03/11/2024
      Huawei Watch GT 5

      Huawei Watch GT 5, il nuovo sistema TruSense per la salute al polso

      14/06/2025

      Huawei Band 10: comfort, tecnologia e salute a meno di 50 euro

      09/06/2025
      Withings scanwatch 2

      Withings ScanWatch 2, uno smartwach ibrido con 30 giorni di autonomia

      07/06/2025
      Garmin Instinct 3

      Garmin Instinct 3: il compagno outdoor perfetto anche per l’uso quotidiano in città

      03/06/2025
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      FreeStyle Gen 2

      Il Samsung FreeStyle Gen 2: un proiettore portatile con funzioni di streaming e gaming

      02/06/2025
      8BitDo Ultimate 2C Controller

      8BitDo Ultimate 2C Wireless Controller, il migliore sotto i 50 euro

      25/05/2025
      WiiM Mini

      WiiM Mini: lo streamer Hi-Res economico che sorprende

      16/05/2025

      Sony HT-AX7: l’innovazione audio portatile che ridefinisce l’immersione sonora

      03/06/2025
      Soundcore Boom 2 Plus

      Soundcore Boom 2 Plus: lo speaker Bluetooth ideale per l’outdoor

      02/06/2025
      Ultimate Ears EVERBOOM

      Ultimate Ears Everboom: audio a 360 gradi, design solido e 20 ore di autonomia

      27/05/2025
      Bose SoundLink Flex 2

      Bose SoundLink Flex 2: audio bilanciato e design robusto

      23/05/2025
      Wikipedia

      Wikipedia blocca i riassunti IA in seguito alle proteste dei collaboratori

      12/06/2025
      Magistral

      Mistral AI lancia Magistral, il suo primo modello di ragionamento step by step

      11/06/2025
      Gemini 2.5 Pro 06-05

      Gemini 2.5 Pro 06-05, maggiore precisione e migliori performance nel coding

      06/06/2025
      AI Edge Gallery

      AI Edge Gallery di Google esegue i modelli AI sul tuo smartphone Android

      04/06/2025
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      12/04/2025
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      nubia z60 ultra

      Offerte Black Friday Nubia: telefoni premium a prezzi convenienti

      22/11/2024
      Scream Fest 2024

      Steam Scream Fest 2024: sconti horror per Halloween

      29/10/2024
      OBS Studio 31.1

      OBS Studio 31.1 porta Multitrack Video anche su Linux

      30/05/2025
      moduli Go

      Moduli Go cancellano dischi Linux in un lampo

      06/05/2025
      One UI 8.0

      One UI 8.0: la nuova interfaccia Samsung su Android 16, tutte le novità in cantiere

      30/04/2025

      SuperCard X: nuova minaccia contactless in rapida espansione

      22/04/2025

      POCO F7 Ultra, un flagship killer con Snapdragon 8 Elite, display 2K e Wi-Fi 7

      14/06/2025
      Honor 200 Lite

      Honor 200 Lite, il processore Dimensity 6080 regge alla grande

      14/06/2025
      COSMOS-Web

      Con COSMOS-Web puoi esplorare 800.000 galassie, 13,5 miliardi di anni luce

      13/06/2025
      Wikipedia

      Wikipedia blocca i riassunti IA in seguito alle proteste dei collaboratori

      12/06/2025
    • Mobiles
      1. Smartphones
      2. View All

      POCO F7 Ultra, un flagship killer con Snapdragon 8 Elite, display 2K e Wi-Fi 7

      14/06/2025
      Honor 200 Lite

      Honor 200 Lite, il processore Dimensity 6080 regge alla grande

      14/06/2025
      OnePlus Nord 4

      OnePlus Nord 4 un medio gamma con prestazioni al top e design premium

      07/06/2025
      TCL 60 SE NXTPAPER

      TCL 60 SE NXTPAPER: smartphone ed e-reader in un unico dispositivo

      06/06/2025
      XPPEN Magic Note Pad

      XPPen Magic Note Pad: il tablet ideale per studenti

      07/06/2025
      reMarkable Paper Pro

      Il reMarkable Paper Pro è un taccuino digitale per chi scrive a mano

      05/06/2025
      TCL NXTPAPER 11 Plus

      TCL NXTPAPER 11 Plus: il tablet Android con display effetto carta

      03/06/2025
      Lenovo Tab Plus

      Lenovo Tab Plus: il tablet per chi ama la musica

      27/05/2025
    • Musica
      1. Cuffie
      2. DAC
      3. hi-fi
      4. Teoria
      5. View All

      OXS Storm G2: la nuova frontiera del gaming wireless con 7.1 surround

      14/06/2025
      Skullcandy Crusher ANC 2

      Skullcandy Crusher ANC 2: cuffie wireless con bassi potenti, ANC e buona autonomia

      13/06/2025

      JBL Tune Beam 2: TWS economiche ma con funzionalità premium

      11/06/2025
      Shokz OpenFit 2

      Shokz OpenFit 2: cuffie open-ear ideali per l’attività fisica

      09/06/2025
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      FiiO BTR15

      FiiO BTR15: DAC Bluetooth al prezzo più basso di sempre

      17/05/2025
      DAC ADI-2 DAC FS

      Cosa è un DAC audio

      26/10/2024
      iFi go bar

      Ascolta audio ad alta fedeltà sul tuo Iphone con l’amp/DAC Hi-Res portatile iFi GO bar.

      03/08/2024
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      Focal Aria 926

      Componenti per un ottimo impianto stereo

      31/07/2024

      Garmin acquista JL Audio

      16/08/2023
      Credits Technics : amplificatore digitale SE-R1

      Come ascoltare musica allo stereo con la qualità più alta possibile

      06/05/2023
      truffa phishing zalando

      Truffa phishing: in regalo la gift card Zalando da 150€

      06/12/2024
      sim ed esim

      Differenza tra SIM fisica ed eSIM: vantaggi e sicurezza

      02/11/2024

      Malware: cosa sono e come difendersi

      19/10/2024
      crittografia a cosa serve

      Crittografia, come funziona e perchè dobbiamo utilizzarla

      16/10/2024

      OXS Storm G2: la nuova frontiera del gaming wireless con 7.1 surround

      14/06/2025
      Skullcandy Crusher ANC 2

      Skullcandy Crusher ANC 2: cuffie wireless con bassi potenti, ANC e buona autonomia

      13/06/2025

      JBL Tune Beam 2: TWS economiche ma con funzionalità premium

      11/06/2025
      Shokz OpenFit 2

      Shokz OpenFit 2: cuffie open-ear ideali per l’attività fisica

      09/06/2025
    • Lifestyle
      1. Criptovalute
      2. EV
      3. Gaming
      4. Trekking
      5. Scienze
      6. View All
      Coinbase

      Coinbase colpita da attacco informatico e minaccia di riscatto

      15/05/2025
      coinbase

      Coinbase : acquisti cripto tramite Apple Pay

      03/12/2024
      criptovalute

      Criptovalute: cosa sono e come funzionano le monete virtuali

      19/10/2024
      Solana

      Visa punta sulla blockchain Solana: i motivi della partnership

      18/09/2023
      Volkswagen ID.1

      Volkswagen ID.1: l’auto elettrica da 20000 euro arriva nel 2027

      05/02/2025
      microvast

      Microvast: l’innovazione nelle batterie allo stato solido

      13/01/2025
      BYD

      BYD e Tesla: sfida per il primato nel mercato EV

      03/01/2025
      batterie 4680

      Panasonic sfida il mercato EV con le batterie 4680: cosa cambia?

      09/09/2024
      Two Point Hospital

      Two Point Hospital è in regalo su Epic Games

      12/06/2025
      Dune: Awakening

      Vivi Arrakis in un nuovo MMO survival, Dune: Awakening

      11/06/2025
      HyperX Cloud III

      HyperX Cloud III: comfort superiore e qualità audio a meno di 100 euro

      08/06/2025
      Turtle Beach Stealth 600

      Turtle Beach Stealth 600 Gen 3: cuffie gaming wireless

      07/06/2025
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      8a Scarpinata della Teverina

      A spasso per i sentieri: 8a Scarpinata della Teverina

      14/05/2024
      Valli e Calanchi

      A spasso per i sentieri: 1a Valli e Calanchi

      27/09/2023
      Maternum Marathon 2023

      A spasso per i sentieri: la 2a edizione di Maternum Marathon

      13/06/2023
      Muon g-2

      L’anomalia Muon g-2 segue le leggi del Modello Standard

      13/06/2025
      Neuroplatform finalspark

      Neuroplatform, piattaforma online alimentata dal primo processore biologico al mondo

      27/05/2024
      AlphaFold 3 di Google DeepMind

      AlphaFold 3 di Google DeepMind

      08/05/2024
      TAO Osservatorio Atacama dell'Università di Tokyo

      TAO: il telescopio più alto del mondo è pronto a scrutare il cosmo dal deserto cileno di Atacama

      03/05/2024
      Muon g-2

      L’anomalia Muon g-2 segue le leggi del Modello Standard

      13/06/2025
      he Wonderfully Weird World of Gumball

      Hulu annuncia il ritorno della serie surreale di Gumball

      20/05/2025

      Papa Leone XIV e l’IA: il significato del suo nome

      12/05/2025
      Google 100 Zeros

      Google entra nel cinema con il progetto 100 Zeros

      06/05/2025
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    Home»Tech»Intelligenza artificiale»OpenAI o1, il modello che ragiona prima di rispondere
    Intelligenza artificiale

    OpenAI o1, il modello che ragiona prima di rispondere

    OpenAI o1: l'IA che ragiona prima di rispondere, un salto importante nelle capacità di ragionamento artificiale, un nuovo paradigma per l'IA nel problem solving
    GrazianoGraziano13/09/2024Updated:13/09/2024012 Mins Read30 Views
    Share Twitter Facebook Pinterest Reddit Telegram WhatsApp Email
    OpenAI o1
    Share
    Facebook Twitter Pinterest Reddit Telegram WhatsApp Email Threads

    OpenAI ha presentato qualche ora fa 2 nuovi modelli di intelligenza artificiale denominati “o1-preview” e “o1-mini“; sono progettati per affrontare problemi complessi. Questi modelli si distinguono per la loro capacità di “ragionare” prima di fornire una risposta. No, OpenAI o1 non è ancora un’AGI! Anche se OpenAI sembra essere sulla strada giusta per arrivarci.

    OpenAI o1

    Questa tecnologia il cui nome in codice è il tanto vociferato Strawberry è un significativo passo avanti; supera le prestazioni dei modelli precedenti soprattutto in ambiti come la scienza, la programmazione e la matematica. L’obiettivo principale di OpenAI con questa nuova serie è quello di creare un’intelligenza artificiale in grado di emulare il processo di pensiero umano; analizzando attentamente i problemi, considerando diverse strategie e correggendo eventuali errori durante il processo di ragionamento.

    We're releasing a preview of OpenAI o1—a new series of AI models designed to spend more time thinking before they respond.

    These models can reason through complex tasks and solve harder problems than previous models in science, coding, and math. https://t.co/peKzzKX1bu

    — OpenAI (@OpenAI) September 12, 2024

    Questa nuova serie di modelli offre una capacità di problem-solving che durante test di benchmark supera quella di molti esperti umani. Il lancio di questi modelli potrebbe essere una svolta non solo per OpenAI, ma per l’intero campo dell’IA; apre nuove possibilità in settori che richiedono un ragionamento e una comprensione profonda.

    Il funzionamento tecnico di OpenAI o1

    Il cuore del funzionamento di OpenAI o1-preview risiede in un algoritmo di apprendimento per rinforzo su larga scala. Questo metodo consente al modello di apprendere come utilizzare efficacemente il “Chain of Thought“; ovvero la catena di pensiero, per affrontare problemi in modo produttivo. Durante il processo di addestramento, il modello ottimizza continuamente la sua catena di pensiero attraverso l’apprendimento per rinforzo; migliora progressivamente la sua capacità di risolvere problemi complessi.

    OpenAI ha osservato che le prestazioni del modello o1 migliorano significativamente con l’aumento del tempo dedicato all’apprendimento per rinforzo durante l’addestramento e del tempo di inferenza durante i test. Questo approccio basato sull’inferenza si differenzia notevolmente dai metodi tradizionali di pre-addestramento dei modelli linguistici di grandi dimensioni (LLM); offre vantaggi unici in termini di scalabilità e adattabilità a diverse tipologie di problemi.

    Il modello o1-preview potenzia notevolmente la sua capacità di affrontare compiti di ragionamento complessi attraverso l’implementazione della Chain of Thought . Questo concetto si ispira al processo cognitivo umano nell’affrontare problemi difficili; scomporre il problema in passaggi più piccoli, sperimenta strategie diverse e corregge gli errori lungo il percorso.

    Grazie all’addestramento basato sull’apprendimento per rinforzo, o1-preview è in grado di riflettere approfonditamente prima di fornire una risposta; raffinando progressivamente i passaggi del suo ragionamento. Questo metodo di ragionamento migliora significativamente le prestazioni di o1-preview in compiti complessi. Il modello o1-preview è in grado di scomporre gradualmente la difficoltà di un problema, giungendo infine alla soluzione corretta; un processo che rispecchia il modo in cui gli esseri umani affrontano sfide cognitive impegnative.

    Se vuoi approfondire il funzionamento di OpenAI o1 puoi leggere questo pdf.

    Valutazione e benchmark di OpenAI o1

    Per valutare le prestazioni del nuovo modello o1-preview, OpenAI ha condotto una serie di test, confrontandoli solo con il suo predecessore GPT-4o e con esperti umani in vari campi. OpenAI ha evitato ogni confronto con altri modelli IA come Claude Sonnet 3.5, Gemini, LLama, Grok ed altri.

    I risultati di questi test hanno dimostrato un notevole miglioramento delle capacità di ragionamento e problem-solving del nuovo modello.

    Uno dei test più significativi è stato l’AIME (American Invitational Mathematics Examination); un esame di matematica avanzata per studenti delle scuole superiori negli Stati Uniti. In questo contesto, il modello o1-preview ha risolto il 93% dei problemi; il modello si posiziona tra i migliori 500 studenti a livello nazionale e supera la soglia per la qualificazione all’Olimpiade Matematica degli Stati Uniti. Questo risultato è notevole se si considera che il modello GPT-4o ha risolto solo il 12% dei problemi nello stesso test.

    OpenAI o1

    o1 è valido anche in altri settori

    Anche se o1 eccelle in matematica e nel coding, il modello si fa valere anche in altri settori. E’ stato testato sul benchmark MMLU (Massive Multitask Language Understanding); un test che copre 57 diverse materie che vanno dalla storia e letteratura all’economia e alla chimica. In questo test o1 ha sovraperformato GPT-4o in 54 aree su 57 .

    OpenAI o1
    Comparazione tra gpt-4o e il modello o1

    Nel benchmark GPQA, che valuta la conoscenza in fisica, chimica e biologia, o1-preview ha superato le prestazioni di esperti con dottorato di ricerca; diventa così il primo modello di IA a raggiungere questo traguardo.

    LSAT è l’esame che viene tradizionalmente utilizzato per valutare le capacità di ragionamento logico e analitico degli aspiranti studenti di giurisprudenza. Questo tipo di test può essere utilizzato per valutare le abilità di comprensione del linguaggio naturale, il ragionamento e la capacità di risolvere problemi complessi di un modello di IA. Nel test LSAT (Law School Admission Test) o1 raggiunge il valore di 98.9% ! GPT-4o non andava oltre il 69.5% .

    In termini di programmazione, OpenAI o1 ha ottenuto un punteggio Elo di 1807 nei concorsi di programmazione simulati di Codeforces; ha superando il 93% dei concorrenti umani. Questo risultato segna un miglioramento significativo rispetto a GPT-4o, che ottiene un punteggio Elo di 808.

    Questi benchmark indicano che OpenAI o1 è in grado di risolvere attività di routine e affrontare problemi altamente complessi in più domini.

    Sebbene questi risultati non significhino che o1-preview sia superiore agli esperti umani in tutti i compiti, dimostra un livello di capacità di risoluzione dei problemi che si avvicina o supera quello dei dottori di ricerca in determinati ambiti specifici.

    Applicazioni pratiche nella scienza e nella ricerca

    Il nuovo modello di ragionamento o1-preview si presta particolarmente bene alla gestione di problemi complessi in ambiti scientifici, di programmazione e matematici. Le sue potenziali applicazioni spaziano in diversi settori cruciali per l’innovazione e la ricerca.

    Nel campo medico, i ricercatori possono utilizzare o1-preview per annotare dati complessi di sequenziamento cellulare; si aprono nuove strade per la comprensione di malattie e lo sviluppo di terapie mirate.

    Nel settore della fisica, il modello può assistere gli scienziati nella generazione di formule matematiche complesse; particolarmente utili per calcoli nel campo dell’ottica quantistica. Questo potrebbe accelerare la ricerca in aree di frontiera della fisica teorica e applicata.

    Per gli sviluppatori software, o1-preview offre un supporto prezioso nella costruzione ed esecuzione di flussi di lavoro multi-step; semplifica la gestione di compiti di programmazione complessi. Questa capacità potrebbe rivoluzionare e velocizzare il modo in cui il software viene sviluppato, debuggato e ottimizzato; porterà a un’efficienza senza precedenti nel ciclo di sviluppo del software.

    Applicazioni pratiche alla portata di tutti

    Il modello OpenAI o1 può essere di grande aiuto anche per gli utilizzatori comuni. Grazie alle sue avanzate capacità di ragionamento, il modello può essere utilizzato in diversi contesti quotidiani. Ad esempio, potrebbe essere impiegato per analizzare referti medici, fornendo spiegazioni dettagliate e comprensibili delle terminologie mediche complesse; un aiuto a comprendere meglio la propria salute.

    Inoltre, il modello può essere utilizzato per supportare l’apprendimento; oppure spiegazioni dettagliate su concetti complessi in matematica o scienze; per rendere più accessibili argomenti che potrebbero risultare difficili da comprendere attraverso i metodi tradizionali.

    Un altro esempio pratico è l’uso del modello per la gestione finanziaria personale. Grazie alla sua capacità di analizzare dati complessi ed allegati, il modello potrebbe aiutare a interpretare estratti conto bancari, identificare modelli di spesa e suggerire modi per ottimizzare il budget personale.

    Inoltre, il modello potrebbe essere utilizzato per generare idee creative o per assistere nella scrittura di documenti; con suggerimenti di miglioramento stilistico o grammaticale. In ambito educativo, potrebbe supportare gli studenti nello studio; può aiutarli a risolvere problemi matematici o a comprendere meglio i concetti scientifici attraverso spiegazioni passo-passo.

    Qui sotto vediamo come sia semplice e alla portata di tutti creare un semplice gioco, il noto Snake, facendosi assistere da o1.

    OpenAI o1-mini: una versione più agile e veloce

    Parallelamente al lancio di o1-preview, OpenAI ha introdotto o1-mini. E’ una versione più compatta e veloce del modello, focalizzata sulla generazione e il debug di codice. o1-mini si distingue per la sua efficienza in termini di costi, con una riduzione dell’80% rispetto a o1-preview, mantenendo al contempo prestazioni elevate in ambiti STEM (Scienza, Tecnologia, Ingegneria e Matematica).

    Il modello eccelle particolarmente in compiti di programmazione, matematica e scienze, offrendo un equilibrio ottimale tra prestazioni e costo computazionale. o1-mini utilizza lo stesso pipeline di apprendimento per rinforzo computazionalmente intensivo di o1 durante il pre-addestramento; genera prestazioni simili su molti compiti di ragionamento, ma a un costo significativamente inferiore. Sebbene le sue prestazioni siano inferiori in compiti che richiedono conoscenze non-STEM, o1-mini si avvicina molto alle capacità di o1-preview e o1 nel campo del ragionamento STEM.

    Entrambi i modelli supportano una modesta finestra di contesto fino a 128k token (circa 4 file pdf di poche pagine). In conclusione, l’utilizzo del modello OpenAI o1 richiede una comprensione delle proprie esigenze specifiche e delle capacità del modello. Con la sua capacità di ragionare prima di rispondere, il modello o1 offre un’opportunità unica per affrontare problemi complessi in modo più efficace rispetto ai modelli precedenti.

    Come accedere al modello OpenAI o1

    L’acesso ai modelli OpenAI o1, noti anche come “Strawberry” per il momento non è gratuito; come lo è invece GPT-4o da browser o da app Android/iOS. Si può accedere già da oggi ai modelli tramite ChatGPT Plus o attraverso l’API di OpenAI, a seconda delle necessità specifiche.

    OpenAI potrebbe rendere accessibile a tutti gli utenti gratuiti la versione ridotta o1-mini, entro qualche giorno.

    Gli abbonati a ChatGPT Plus possono selezionare il modello o1-preview o o1-mini attraverso il selettore di modelli, con limiti di messaggi settimanali di 30 per o1-preview e 50 per o1-mini. Per gli sviluppatori, l’accesso avviene tramite l’API, che consente di integrare il modello o1 nelle proprie applicazioni.

    L’API offre un limite di 20 richieste al minuto, con piani per aumentare questi limiti in futuro. Tuttavia, attualmente l’API non supporta alcune funzionalità avanzate come le chiamate di funzione e le risposte in streaming. Per integrare il modello, è consigliabile consultare la documentazione ufficiale di OpenAI, che fornisce dettagli su come iniziare e sfruttare al meglio le capacità del modello.

    Il modello o1-preview è particolarmente adatto per compiti che richiedono un ragionamento complesso e una conoscenza generale ampia, mentre il modello o1-mini offre una soluzione più economica e veloce, ideale per applicazioni che necessitano di capacità di ragionamento senza un ampio bagaglio di conoscenze generali.

    Naturalmente, come accade con altri modelli popolari (Claude, Gemini, LLama) anchei modelli o1-preview o o1-mini saranno presto disponibili in servizi di terze parti in abbonamento; parliamo di servizi come Poe, Perplexity e altri. Il servizio You.com ha già inserito i modelli OpenAI o1 nella sua interfaccia.

    OpenAI API : prezzi di o1-preview e o1-mini

    Se sei uno sviluppatore o ricercatore che utilizza le API di OpenAI, devi sapere che i modelli OpenAI o1-preview e o1-mini presentano differenze significative in termini di costi e funzionalità rispetto GPT-4o.

    Il modello o1-preview è il più avanzato della serie, progettato per affrontare compiti complessi che richiedono una conoscenza generale ampia. Questo modello ha un costo di $15 per ogni milione di token di input e $60 per ogni milione di token di output. È particolarmente adatto per applicazioni che richiedono un ragionamento approfondito e una capacità di problem-solving su vasta scala, come la scienza e la matematica avanzata.

    D’altra parte, il modello o1-mini è una versione più economica e veloce, ideale per compiti di coding, matematica e scienza. Il costo per il modello o1-mini è notevolmente inferiore, con un prezzo di $3 per ogni milione di token di input e $12 per ogni milione di token di output. Questa riduzione del costo del 80% rispetto al modello o1-preview rende l’o1-mini una scelta eccellente per sviluppatori e ricercatori che necessitano di potenti capacità di ragionamento senza un ampio bagaglio di conoscenze generali.

    Pro e contro di OpenAI o1

    Abbiamo parlato a lungo dei vantaggi di OpenAI o1. Se vogliamo considerare anche i contro e non solo i pro, bisogna notare che OpenAI o1 richiede un calcolo computazionale molto più elevato se comparato con GPT4-o; di conseguenza è un modello che è più costoso, sia per chi lo usa sia per il dispendio energetico richiesto.

    Ma questi sono i prezzi da pagare per l’innovazione IA. OpenAI o1 è anche considerevolmente più lento di GPT4-o, in quanto deve completare la fase di “thinking” prima di rispondere. Il vantaggio è che OpenAI o1 ti darà molto probabilmente la risposta migliore.

    Alla domanda “dammi 5 nazioni con la lettera A in terza posizione nel nome“, GPT-4o ha risposto in 3 secondi , ma ha fornito 5 risposte incorrette. Alla stessa domanda o1 ha risposto correttamente, ma il modello ha richiesto 32 secondi. Anche o1-mini risponde correttamente al prompt e con un tempo di soli 9 secondi. Tempo molto inferiore al modello o1, ma il triplo del tempo rispetto GPT-4o.

    OpenAI o1: conclusioni

    L’introduzione dei modelli o1-preview e o1-mini dimostrano la nuova capacità da parte dei modelli IA di emulare il processo di pensiero umano in modo più accurato, dedicando tempo alla riflessione prima di fornire risposte a problemi complessi.

    Le prestazioni in ambiti come la matematica, la programmazione e le scienze aprono nuove possibilità per l’applicazione dell’IA in settori critici della ricerca e dell’innovazione. E’ importante ricordare e considerare che, nonostante questi progressi, l’IA rimane uno strumento da utilizzare con cautela e sotto la supervisione umana. Le implicazioni etiche e sociali dell’implementazione di sistemi di IA così avanzati richiedono una riflessione continua.

    Non siamo ad un punto di arrivo, questo è ancora solo l’inizio. OpenAI sta pianificando aggiornamenti e miglioramenti regolari a questi modelli. OpenAI sta inoltre continuando a sviluppare modelli della serie GPT insieme a questa nuova serie o1; poi non dimentichiamoci dell’annunciata e mai lanciata voice chat GPT; quindi ci sarà molto da aspettarsi in futuro. Aspettiamoci anche risposte dalla concorrenza; con Anthropic in prima linea che ancora non ha lanciato Claude Opus 3.5 e che già in passato ha superato le perfomance dei modelli OpenAI.

    AGI Anthropic API blog ChatGPT Claude Copilot gemini Grok ia modello news o1 o1mini OpenAI picks Strawberry tech tecnologia
    Seguici su X (Twitter) Seguici su Bluesky Seguici su WhatsApp
    Share. Facebook Twitter Pinterest
    Previous ArticleRainbow 2 Pro Elite: controller wireless
    Next Article AirPods Max: eleganza e innovazione del suono nelle cuffie Apple
    Graziano
    • Website

    Reporter e recensore presso Gomoot, mi occupo di riportare notizie riguardanti la tecnologia. Ho cominciato con C64, Amiga, fino al 486; ora seguo con passione la tecnologia attuale e adoro in particolare i desktop SFF e i mini pc. Appassionato di informatica e linguaggi di programmazione nel tempo libero amo praticare trekking e stare all'aperto.

    Articoli collegati

    Wikipedia
    Intelligenza artificiale

    Wikipedia blocca i riassunti IA in seguito alle proteste dei collaboratori

    12/06/2025
    Magistral
    Intelligenza artificiale

    Mistral AI lancia Magistral, il suo primo modello di ragionamento step by step

    11/06/2025
    Gemini 2.5 Pro 06-05
    Intelligenza artificiale

    Gemini 2.5 Pro 06-05, maggiore precisione e migliori performance nel coding

    06/06/202549 Views
    Add A Comment
    Leave A Reply Cancel Reply

    Ultimi articoli

    POCO F7 Ultra, un flagship killer con Snapdragon 8 Elite, display 2K e Wi-Fi 7

    14/06/202532 Views
    Keys-To-Go 2

    Logitech Keys-To-Go 2: tastiera wireless per laptop, tablet e smartphone

    14/06/202550 Views
    Honor 200 Lite

    Honor 200 Lite, il processore Dimensity 6080 regge alla grande

    14/06/202554 Views
    Huawei Watch GT 5

    Huawei Watch GT 5, il nuovo sistema TruSense per la salute al polso

    14/06/202527 Views

    OXS Storm G2: la nuova frontiera del gaming wireless con 7.1 surround

    14/06/2025

    FRITZ!Box 7690, un perfetto router domestico Wi-Fi 7

    13/06/202527 Views
    Gomoot : tecnologia e lifestyle
    Mastodon WhatsApp X (Twitter) Instagram Threads
    • Home
    • Tech
    • Mobiles
    • Contatti
    • Privacy
    • ABOUT
    © 2025 GOMOOT.COM

    Type above and press Enter to search. Press Esc to cancel.

    Sign In or Register

    Welcome Back!

    Login below or Register Now.

    Continua con Google
    Lost password?

    Register Now!

    Already registered? Login.

    Continua con Google

    A password will be e-mailed to you.