Close Menu
Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    Ultimi Articoli

    Mise-en-place sta cambiando il modo di gestire gli ambienti di sviluppo

    01/05/2026
    yt-dlp e SponsorBlock

    yt-dlp e SponsorBlock, la combinazione per scaricare video da YouTube

    30/04/202616 Views
    Powertoys

    Microsoft PowerToys: una suite senza pretese che risolve problemi reali

    30/04/202615 Views
    Oddsparks: An Automation Adventure

    Oddsparks: An Automation Adventure – Recensione PC

    30/04/2026

    Gemini crea documenti Word, Excel e PDF direttamente in chat e senza abbonamento

    30/04/2026
    CATL e HyperStrong

    CATL e HyperStrong: l’accordo da 60 GWh che porta le batterie al sodio nell’era industriale

    29/04/2026

    Linux su PS5: la console Sony diventa un PC da gaming open source

    29/04/2026

    Fedora Linux 44 disponibile

    28/04/202619 Views
    venerdì 1 Maggio 2026
    X (Twitter) Threads Mastodon Bluesky WhatsApp
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    • Home
    • Computer
      1. MINI PC
      2. Laptop
      3. Monitor
      4. Teoria
      5. Mouse
      6. GPU
      7. Windows
      8. Motherboard
      9. Tastiere
      10. View All
      NiPoGi E3B

      Mini PC NiPoGi E3B con Ryzen 7 5700U: potenza compatta ad un prezzo aggressivo

      26/03/2026

      GEEKOM A5: mini pc con buone prestazioni grazie all’AMD Ryzen 7 5800H

      26/03/2026
      Geekom A8

      Recensione Geekom A8: il mini PC AMD che non ti aspetti

      11/03/2026
      ACEMAGICIAN S3A

      ACEMAGICIAN S3A: un mini pc per il gaming ma non solo

      09/03/2026
      MacBook Neo

      MacBook Neo, il portatile entry-level di Apple

      30/03/2026
      Galaxy Book5 Pro

      Il Samsung Galaxy Book5 Pro sfida il MacBook su qualità e autonomia

      18/03/2026
      Lenovo Chromebook Duet 11

      Lenovo Chromebook Duet 11, un versatile 2-in-1 con 10 anni di aggiornamenti

      24/12/2025
      Legion 5 15IRX10

      Lenovo Legion 5 15IRX10, potenza da workstation e versatilità gaming

      13/10/2025

      Philips Evnia 27M2N6501L: il miglior monitor QD-OLED sotto i 500 euro per gaming e color grading

      14/04/2026

      MSI Modern MD272UPSW, il monitor 4K che è anche Smart TV

      13/04/2026
      ASRock Phantom Gaming PGO32UFS

      ASRock Phantom Gaming PGO32UFS: il primo OLED di ASRock punta in alto

      07/04/2026
      odyssey oled g8

      Samsung Odyssey G8 OLED S32DG80: un monitor gaming 4k con Smart tv integrata

      24/03/2026

      Mise-en-place sta cambiando il modo di gestire gli ambienti di sviluppo

      01/05/2026
      Powertoys

      Microsoft PowerToys: una suite senza pretese che risolve problemi reali

      30/04/2026
      Bluetooth 6.1

      Bluetooth 6.1: più privacy e autonomia per i dispositivi wireless

      12/05/2025
      ASUS ProArt Z790

      Evoluzione del bus di sistema PCIe fino al PCIe 7

      16/04/2025

      Logitech G Pro X2 Superstrike, il mouse con tecnologia HITS per click più veloci

      10/02/2026
      Mouse NZXT Lift 2

      Mouse NZXT Lift 2, mouse filare ultraleggero e preciso

      21/12/2025
      MX Master 4

      Logitech MX Master 4, feedback aptico e design migliorato

      20/12/2025
      Burst II Air

      Turtle Beach Burst II Air wireless, un mouse gaming di soli 47 gr!

      15/06/2025
      MatX

      MatX raccoglie 500 milioni di dollari per sfidare Nvidia

      25/02/2026
      nvidia rtx 5090 ti

      Nvidia prepara una RTX 5090 “estrema” per il 2026

      09/02/2026
      dlss45 MFG 6× nvidia

      NVIDIA dynamic MFG e MFG 6×: più intelligenza per i frame generati

      06/02/2026
      OptiScaler

      OptiScaler, cos’è e come attivarlo nei giochi

      03/01/2026
      pannello di controllo windows 11

      Microsoft accelera l’abbandono del Pannello di controllo su Windows 11

      09/04/2026
      Windows 11

      Windows 11 raggiunge un miliardo di utenti: più veloce di Windows 10 nonostante le critiche

      29/01/2026
      mu language model

      Mu, un motore AI per gestire le impostazioni di Windows 11

      27/12/2025
      windows 11

      Windows 11 : nuove strategie di resilienza e strumenti di ripristino

      19/11/2025

      Arduino UNO Q raddoppia RAM e storage

      23/01/2026
      ROG Strix B860-A Gaming

      Asus ROG Strix B860-A Gaming WiFi, motherboard per build ad alte prestazioni.

      17/01/2026
      pcie 250watt

      Asus alimenta una RTX 5060 Ti da 250 W su uno slot PCIe potenziato

      23/09/2025
      MSI MAG Z890 Tomahawk WiFi

      MSI MAG Z890 Tomahawk WiFi: scheda madre top per Intel Ultra

      12/06/2025

      Light Mount di be quiet! porta il silenzio nel gaming

      04/02/2026
      Signature Slim Solar+ K980

      Logitech Signature Slim Solar+ K980: la tastiera che si ricarica con la luce

      22/01/2026
      Epomaker HE75 Mag

      Tastiera magnetica Epomaker HE75 Mag: la scelta giusta per chi pretende il massimo spendendo poco

      23/11/2025
      Keys-To-Go 2

      Logitech Keys-To-Go 2: tastiera wireless per laptop, tablet e smartphone

      14/06/2025

      Mise-en-place sta cambiando il modo di gestire gli ambienti di sviluppo

      01/05/2026
      yt-dlp e SponsorBlock

      yt-dlp e SponsorBlock, la combinazione per scaricare video da YouTube

      30/04/2026
      Powertoys

      Microsoft PowerToys: una suite senza pretese che risolve problemi reali

      30/04/2026

      Fedora Linux 44 disponibile

      28/04/2026
    • Tech
      1. Curiosità
      2. Eventi
      3. memory cards
      4. Powerbank
      5. Smartwatch
      6. Gadgets
      7. Bluetooth speakers
      8. Intelligenza artificiale
      9. Offerte
      10. Software
      11. View All

      Starlink abbassa i satelliti per sicurezza orbitale

      02/01/2026

      Con Nano Banana, Gemini supera ChatGPT tra le app AI

      17/09/2025
      grotta lunare

      Scoperta una grotta lunare sotterranea

      16/07/2024
      Oleg Kononenko

      Oleg Kononenko: 1000 giorni nello spazio

      05/06/2024
      Google I/O 2026

      La conferenza Google I/O 2026 sarà a maggio

      18/02/2026

      NASA rinvia Artemis II per perdite di idrogeno

      03/02/2026
      BYD YangWang U9 Extreme

      BYD YangWang U9 Extreme: il nuovo re della velocità tra le auto di serie

      24/09/2025
      Awe Dropping Apple

      Awe Dropping del 9 settembre 2025, Apple svela il suo futuro

      09/09/2025
      SSD Crucial P310 2TB

      Crucial P310 2TB SSD NVMe: storage ad alta velocità a un ottimo prezzo

      08/06/2025
      V-NAND QLC Samsung

      Il futuro dello storage è pronto: Samsung svela la V-NAND QLC da 1 Tb

      12/09/2024
      microSD SD Express

      Samsung presenta la prima microSD SD Express

      07/03/2024

      ADATA lancia il primo SSD esterno USB4 SE920

      31/10/2023
      power bank

      Power Bank cablati e wireless Qi2 : guida all’acquisto

      03/03/2026

      Anker Nano Power Bank 5K, il caricatore più sottile con MagSafe e Qi2

      22/01/2026
      Sharge ICEMAG 2

      Sharge ICEMAG 2: power bank Qi2 15W con raffreddamento attivo

      12/05/2025
      Baseus Nomos

      Baseus Nomos Power Bank: ricarica wireless veloce e sicura

      11/05/2025

      Watch GT Runner 2 è il running watch più completo di Huawei

      30/03/2026

      WhatsApp arriva sugli smartwatch Garmin

      17/03/2026

      CMF Watch 3 Pro, lo smartwatch con ChatGPT integrato a meno di 100 euro

      04/03/2026
      Honor Watch 4

      Honor Watch 4, lo smartwatch per tutti i giorni, con anima sportiva

      03/03/2026
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      24/03/2026

      Xiaomi Smart Tag offre Find My e Find Hub in un solo tracker

      12/03/2026
      Hollyland Lark A1

      Hollyland Lark A1: uno dei migliori microfoni lavalier per smartphone e vlogging

      03/03/2026
      Elgato Stream Deck

      Elgato Stream Deck MK.2: molto più di un pannello per streamer

      19/02/2026

      Sonos Play: lo speaker portatile che Sonos stava aspettando

      20/04/2026
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      24/03/2026

      Pebble X Plus: speakers 2.1 da scrivania con subwoofer

      09/02/2026

      JBL Boombox 4: speaker Bluetooth con AI e USB-C lossless

      23/01/2026
      ollama

      Eseguire modelli AI in locale con Ollama e Open WebUI

      01/05/2026

      Gemini crea documenti Word, Excel e PDF direttamente in chat e senza abbonamento

      30/04/2026
      gpt 5.5. openai

      GPT-5.5: il nuovo modello OpenAI che lavora (quasi) da solo

      25/04/2026
      deepseek v4

      DeepSeek V4: un’efficienza che mette pressione a tutti i big dell’AI

      24/04/2026
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      24/03/2026
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      nubia z60 ultra

      Offerte Black Friday Nubia: telefoni premium a prezzi convenienti

      22/11/2024
      Scream Fest 2024

      Steam Scream Fest 2024: sconti horror per Halloween

      29/10/2024

      Mise-en-place sta cambiando il modo di gestire gli ambienti di sviluppo

      01/05/2026

      Linux su PS5: la console Sony diventa un PC da gaming open source

      29/04/2026
      Roomote

      Da Roo Code a Roomote: 3 milioni di installazioni non hanno impedito un cambio di rotta

      22/04/2026

      Thunderbolt è il nuovo client AI open source di Mozilla per le aziende

      16/04/2026
      ollama

      Eseguire modelli AI in locale con Ollama e Open WebUI

      01/05/2026

      Gemini crea documenti Word, Excel e PDF direttamente in chat e senza abbonamento

      30/04/2026
      artemis II

      Artemis: costi, ritardi e la nuova strategia dei droni lunari

      27/04/2026
      gpt 5.5. openai

      GPT-5.5: il nuovo modello OpenAI che lavora (quasi) da solo

      25/04/2026
    • Mobiles
      1. Smartphones
      2. View All
      POCO M8 5G

      Il POCO M8 5G con display AMOLED da 3200 nits cambia le aspettative sulla fascia entry

      10/04/2026

      OPPO Reno13 Pro, il mid-range con ambizioni da flagship

      01/04/2026

      Samsung Galaxy A57 5G: il mid-range sottile, solido e duraturo

      27/03/2026

      OPPO Find X9 e X9 Pro: la gamma Find X ridefinisce l’autonomia dei flagship Android

      26/03/2026

      Note A1 NXTPAPER di TCL, un blocco note digitale per studenti e professionisti

      28/04/2026

      TCL NXTPAPER 14 è il tablet che fa riposare gli occhi

      24/04/2026
      Galaxy Tab S10 FE

      Da Samsung due valide alternative all’ iPad, Galaxy Tab S10 FE e S10 FE+

      10/03/2026
      OPPO Pad SE

      OPPO Pad SE: tablet economico con autonomia record e corpo in alluminio

      09/03/2026
    • Musica
      1. Cuffie
      2. DAC
      3. hi-fi
      4. Teoria
      5. View All

      JBL Sense Pro: la formula open-ear che convince

      27/04/2026

      SoundPEATS Air6 HS, auricolari semi-in-ear economici con LDAC

      23/04/2026

      Apple AirPods Max 2: sei anni di attesa per un aggiornamento che (quasi) vale il prezzo

      15/04/2026
      FiiO EH130

      FiiO EH13: cuffie Bluetooth con ANC, LDAC e doppio DAC

      09/04/2026
      Truthear KeyX

      Truthear KeyX, un DAC dongle che vale ogni centesimo

      28/04/2026
      Eversolo Play

      Eversolo Play: il tuttofare hi-fi per chi vuole meno cavi e più musica

      03/12/2025
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      FiiO BTR15

      FiiO BTR15: DAC Bluetooth al prezzo più basso di sempre

      17/05/2025
      Eversolo Play

      Eversolo Play: il tuttofare hi-fi per chi vuole meno cavi e più musica

      03/12/2025
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      Focal Aria 926

      Componenti per un ottimo impianto stereo

      31/07/2024

      Garmin acquista JL Audio

      16/08/2023
      truffa phishing zalando

      Truffa phishing: in regalo la gift card Zalando da 150€

      06/12/2024
      sim ed esim

      Differenza tra SIM fisica ed eSIM: vantaggi e sicurezza

      02/11/2024

      Malware: cosa sono e come difendersi

      19/10/2024
      crittografia a cosa serve

      Crittografia, come funziona e perchè dobbiamo utilizzarla

      16/10/2024
      Truthear KeyX

      Truthear KeyX, un DAC dongle che vale ogni centesimo

      28/04/2026

      JBL Sense Pro: la formula open-ear che convince

      27/04/2026

      SoundPEATS Air6 HS, auricolari semi-in-ear economici con LDAC

      23/04/2026

      Apple AirPods Max 2: sei anni di attesa per un aggiornamento che (quasi) vale il prezzo

      15/04/2026
    • Lifestyle
      1. Criptovalute
      2. EV
      3. Gaming
      4. Trekking
      5. Scienze
      6. View All
      Alpha Arena : trading ai bot

      Alpha Arena : sfida tra modelli AI nel trading di criptovalute

      20/10/2025
      Coinbase

      Coinbase colpita da attacco informatico e minaccia di riscatto

      15/05/2025
      coinbase

      Coinbase : acquisti cripto tramite Apple Pay

      03/12/2024
      criptovalute

      Criptovalute: cosa sono e come funzionano le monete virtuali

      19/10/2024
      CATL e HyperStrong

      CATL e HyperStrong: l’accordo da 60 GWh che porta le batterie al sodio nell’era industriale

      29/04/2026
      tesla

      Tesla dice addio a Model S e Model X ma accelera sugli EV autonomi e i robot umanoidi

      29/01/2026
      Volvo EX60

      Volvo EX60: la sfida scandinava al dominio tedesco degli elettrici premium

      22/01/2026
      CATL sodium ion

      CATL annuncia la produzione di massa delle batterie agli ioni di sodio nel 2026

      30/12/2025
      Oddsparks: An Automation Adventure

      Oddsparks: An Automation Adventure – Recensione PC

      30/04/2026
      DOOMBLADE

      DOOMBLADE: frenesia, heavy metal e biomi dei Dread Lords

      23/04/2026
      the stone of madness

      The Stone of Madness, fuga da un monastero inquisitoriale del Settecento

      16/04/2026
      Clone Drone in the Danger Zone

      Clone Drone in the Danger Zone mette alla prova riflessi e strategia

      02/04/2026
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      8a Scarpinata della Teverina

      A spasso per i sentieri: 8a Scarpinata della Teverina

      14/05/2024
      Valli e Calanchi

      A spasso per i sentieri: 1a Valli e Calanchi

      27/09/2023
      Maternum Marathon 2023

      A spasso per i sentieri: la 2a edizione di Maternum Marathon

      13/06/2023
      Il caffè riscrive il microbioma intestinale

      Il caffè riscrive il microbioma intestinale, e con esso umore, memoria e cognizione

      23/04/2026
      urano

      Le lune esterne di Urano Titania e Oberon, sono scure sul lato anteriore.

      19/06/2025
      Muon g-2

      L’anomalia Muon g-2 segue le leggi del Modello Standard

      13/06/2025
      Neuroplatform finalspark

      Neuroplatform, piattaforma online alimentata dal primo processore biologico al mondo

      27/05/2024
      CATL e HyperStrong

      CATL e HyperStrong: l’accordo da 60 GWh che porta le batterie al sodio nell’era industriale

      29/04/2026
      Il caffè riscrive il microbioma intestinale

      Il caffè riscrive il microbioma intestinale, e con esso umore, memoria e cognizione

      23/04/2026
      tesla

      Tesla dice addio a Model S e Model X ma accelera sugli EV autonomi e i robot umanoidi

      29/01/2026
      Volvo EX60

      Volvo EX60: la sfida scandinava al dominio tedesco degli elettrici premium

      22/01/2026
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    Home»Tech»Intelligenza artificiale»Eseguire modelli AI in locale con Ollama e Open WebUI
    Intelligenza artificiale

    Eseguire modelli AI in locale con Ollama e Open WebUI

    Modelli di linguaggio in locale senza cloud: Ollama e Open WebUI trasformano il tuo PC in una piattaforma AI completa con RAG, API compatibili OpenAI e supporto per decine di modelli open source
    GrazianoGraziano01/05/2026
    Share Twitter WhatsApp Bluesky Threads
    ollama

    Ogni volta che si invia un messaggio a ChatGPT, Claude o Gemini, i propri dati attraversano internet per raggiungere server remoti gestiti da aziende terze. Per la maggior parte degli utilizzi questo è un compromesso accettabile, ma non per tutti: chi lavora con informazioni sensibili, chi ha bisogno di funzionamento offline o chi semplicemente preferisce mantenere il pieno controllo dei propri dati ha poche alternative pratiche.

    La buona notizia è che esiste un ecosistema maturo per eseguire modelli di linguaggio direttamente sulla propria macchina, senza abbonamenti e senza trasferire nulla all’esterno. Ollama è il motore che semplifica tutto questo: basato su llama.cpp, scritto in Go con backend C per l’inferenza, rileva automaticamente la GPU e scarica modelli già quantizzati per l’hardware consumer.

    Supporta decine di modelli open source, da Gemma 4 di Google a Llama 3 di Meta, da Qwen3.6 di Alibaba a DeepSeek, con dimensioni che vanno da 2 GB per i modelli compatti fino a 40 GB per quelli più grandi. Open WebUI è l’interfaccia web che trasforma Ollama in una piattaforma completa, con supporto RAG per i documenti, ricerca web integrata, generazione immagini e persino API compatibili con OpenAI.

    Insieme offrono un’alternativa ai servizi cloud per chi vuole rimanere padrone dei propri dati. Questa guida parte dall’installazione per arrivare alle configurazioni avanzate: ottimizzazione della GPU, personalizzazione dei Modelfile, integrazione con strumenti di sviluppo e una valutazione di cosa funziona e cosa ancora no.

    Hardware e modelli

    Prima di installare qualsiasi cosa, serve un quadro chiaro delle risorse necessarie. I modelli di linguaggio consumano memoria in proporzione diretta al numero di parametri, e la quantità di RAM o VRAM disponibile stabilisce sia quali modelli puoi eseguire sia a che velocità. La tabella seguente riassume i requisiti approssimativi per i modelli più diffusi in quantizzazione Q4:

    ModelloParametriDimensioneRAM minima
    Phi-3 Mini3,8B~2,3 GB4 GB
    Llama 3.1 (8B)8B~4,7 GB8 GB
    Qwen2.5 (14B)14B~8,7 GB16 GB
    Gemma 3 (27B)27B~16 GB24 GB
    Llama 3.1 (70B)70B~40 GB48 GB

    La quantizzazione comprime i pesi del modello da 16-bit a 4 o 8-bit, riducendo le dimensioni a scapito di una perdita di qualità generalmente impercettibile. Ollama distribuisce modelli in Q4 per impostazione predefinita, ma puoi selezionare il livello tramite tag, ovvero ollama pull llama3.2:q8_0 per qualità quasi originale, oppure ollama pull llama3.2:q4_0 per la massima compattezza.

    Su CPU sola, un modello da 3B genera circa 5-15 token al secondo, mentre un 7B scende a 2-5 token al secondo: ancora usabile, ma al limite. Per i modelli medi, una GPU con 8 GB di VRAM come una RTX 3060 o 4060 cambia radicalmente le prestazioni. Per i modelli da 27-70B servono invece 24 GB di VRAM o più, l’ambito delle RTX 3090 e 4090.

    Ollama: installazione e personalizzazione con i Modelfile

    L’installazione di Ollama richiede un solo comando. Su Windows basta aprire PowerShell ed eseguire irm https://ollama.com/install.ps1 | iex; su macOS e Linux, curl -fsSL https://ollama.com/install.sh | sh. In alternativa, l’installer grafico è disponibile su ollama.com/download. Una volta completata l’installazione, il server parte automaticamente in background.

    Per scaricare ed eseguire il primo modello basta digitare ollama run gemma4: il modello viene recuperato dalla libreria e la sessione chat inizia direttamente nel terminale. I comandi essenziali includono ollama ls per elencare i modelli scaricati, ollama ps per verificare quali sono attivi e come si ripartisce il carico tra GPU e CPU, e ollama stop <modello> per liberare memoria.

    La vera potenza per chi configura a livello avanzato sta però nei Modelfile, file di configurazione che permettono di creare varianti personalizzate di qualsiasi modello con una sintassi minimale:

    FROM gemma4
    PARAMETER temperature 0.7
    PARAMETER num_ctx 8192
    PARAMETER top_p 0.9
    PARAMETER repeat_penalty 1.1
    SYSTEM """Sei un assistente tecnico specializzato in sysadmin Linux.Rispondi in italiano con esempi pratici e comandi utili."""

    Si costruisce il modello con ollama create mio-assistente -f Modelfile e si esegue con ollama run mio-assistente. I parametri più rilevanti sono temperature (da 0.0 a 2.0, controlla la creatività), num_ctx (finestra di contesto in token, predefinito 2048), top_p per il campionamento e repeat_penalty per scoraggiare le ripetizioni.

    È possibile ispezionare la configurazione di qualsiasi modello esistente con ollama show --modelfile gemma3, copiarlo con ollama cp e usarlo come base per le proprie personalizzazioni. L’istruzione MESSAGE permette inoltre di fornire esempi few-shot direttamente nel Modelfile, guidando il comportamento del modello senza modificarne i pesi.

    Open WebUI: da motore a piattaforma completa

    Ollama da solo funziona bene da terminale, ma per un uso quotidiano serve un’interfaccia più accessibile. Open WebUI si installa più comodamente tramite Docker. L’approccio più rapido è usare l’immagine che include già Ollama, ideale per iniziare con un solo container:

    docker run -d -p 3000:8080 --gpus=all \
      -v ollama:/root/.ollama \
      -v open-webui:/app/backend/data \
      --name open-webui --restart always \
      ghcr.io/open-webui/open-webui:ollama

    Se Ollama è già installato sulla macchina, basta l’immagine :main con il flag --add-host=host.docker.internal:host-gateway per consentire al container di raggiungere il server sull’host. Il primo che si registra diventa automaticamente amministratore.

    L’interfaccia ricorda da vicino ChatGPT, con supporto Markdown e LaTeX, ma le funzionalità vanno ben oltre la semplice chat. La caratteristica più interessante per un uso avanzato è il RAG (Retrieval-Augmented Generation): puoi caricare PDF, documenti Word e file di testo, poi interrogarli nella chat usando il comando # prima della domanda.

    openwebui e Ollama

    Open WebUI indicizza i documenti tramite un modello di embedding (per l’uso locale è consigliato nomic-embed-text) e supporta nove database vettoriali tra cui ChromaDB, PGVector e Qdrant. Un’altra funzionalità notevole è la possibilità di collegare fino a 15 provider di ricerca web; per un setup completamente locale e gratuito, SearXNG è l’opzione ideale.

    La funzione “Many Models Conversations” permette poi di interrogare più modelli in parallelo e confrontare le risposte in tempo reale, utile per valutare quale modello performa meglio su un determinato compito. È anche possibile usare contemporaneamente modelli locali e API cloud come OpenAI o Mistral nello stesso workspace, configurando le chiavi API nelle impostazioni.

    Integrazioni API in Ollama

    Uno dei vantaggi meno ovvi di Ollama è l’endpoint API compatibile con OpenAI, disponibile all’indirizzo http://localhost:11434/v1/. Qualsiasi strumento costruito per l’SDK OpenAI funziona anche con i modelli locali, semplicemente cambiando base_url e inserendo una stringa arbitraria come api_key:

    from openai import OpenAI
    
    client = OpenAI(
        base_url="http://localhost:11434/v1/",
        api_key="ollama",  # richiesta ma ignorata
    )
    
    resp>= client.chat.completions.create(
        model="llama3.2",
        messages=[{"role": "user", "c>"Spiega la quantizzazione in due frasi"}],
    )
    print(resp>0].message.content)

    Questa compatibilità apre la porta a diverse integrazioni. In VS Code, estensioni come Cline, Continue e AI Toolkit di Microsoft possono puntare direttamente al server Ollama locale per generazione codice e refactoring. In Obsidian, plugin come Copilot for Obsidian trasformano l’app in un assistente per gli appunti alimentato da modelli locali.

    Anche LangChain e LlamaIndex supportano Ollama nativamente per pipeline RAG e agenti personalizzati, rendendo semplice costruire applicazioni complesse sopra l’infrastruttura locale. Dal punto di vista dell’ottimizzazione hardware, ci sono diverse leve utili.

    Flash Attention (OLLAMA_FLASH_ATTENTION=1) riduce il consumo di memoria per contesti lunghi, mentre la quantizzazione della cache K/V con OLLAMA_KV_CACHE_TYPE=q8_0 dimezza la memoria del contesto con impatto minimo sulla qualità. Per task che richiedono contesti ampi (agenti, analisi di codice, documenti lunghi) conviene impostare OLLAMA_CONTEXT_LENGTH=64000 o superiore.

    Apple Silicon è supportato nativamente via Metal, NVIDIA via CUDA con compute capability 5.0+, AMD via ROCm sulle serie RX 6000 e 7000. Il comando ollama ps mostra la ripartizione CPU/GPU in tempo reale, permettendoti di verificare che il modello stia effettivamente usando l’accelerazione hardware.

    Il cloud non è il nemico e il locale non è perfetto

    I modelli locali sono meno capaci di GPT-5.5 o Claude Opus 4.7, ed è giusto riconoscerlo. Su compiti di ragionamento complesso, accuratezza fattuale e coding avanzato, il divario è ancora sensibile.

    I modelli da 14-27B colmano buona parte della distanza per gli utilizzi più comuni (scrittura, riassunti, brainstorming, domande generiche), mentre i modelli da 70B si avvicinano alle prestazioni cloud per molti task, ma richiedono hardware dedicato e costoso. La qualità dei modelli open source sta comunque migliorando rapidamente, e il gap si restringe con ogni nuovo rilascio.

    Ciò detto, ci sono scenari dove il locale eccelle in modo inequivocabile. Per la privacy dei dati (documenti legali, cartelle cliniche, codice proprietario) non esiste alternativa paragonabile a un modello che gira interamente sulla propria macchina senza comunicazione verso l’esterno. Per il funzionamento offline, Ollama funziona senza connessione dopo il download iniziale, configurabile anche in modalità air-gapped.

    Grazie all’assenza di costi ricorrenti: una volta configurato il sistema, non ci sono abbonamenti né limiti di utilizzo. Per gli sviluppatori, l’API locale permette di prototipare e testare senza consumare crediti. Il consiglio pragmatico è ibrido, ovvero usa il locale per il lavoro quotidiano, i documenti sensibili e la prototipazione, e affida al cloud i compiti che richiedono la massima qualità.

    Con Ollama e Open WebUI, configurare questa architettura richiede meno di un’ora, un investimento di tempo che ripaga in autonomia e controllo.

    AI news ollama tech WebUI
    Previous ArticleMise-en-place sta cambiando il modo di gestire gli ambienti di sviluppo
    Avatar photo
    Graziano
    • Website

    Ho visto l'informatica nascere con il C64 e oggi seguo con lo stesso entusiasmo l'evoluzione verso mini PC e desktop SFF. Fuori dal lavoro, le mie passioni sono i film, il trekking, la bici e la corsa. Ma non disdegno una sessione di gaming o programmazione!

    Articoli collegati

    Intelligenza artificiale

    Gemini crea documenti Word, Excel e PDF direttamente in chat e senza abbonamento

    30/04/2026
    gpt 5.5. openai
    Intelligenza artificiale

    GPT-5.5: il nuovo modello OpenAI che lavora (quasi) da solo

    25/04/202616 Views
    deepseek v4
    Intelligenza artificiale

    DeepSeek V4: un’efficienza che mette pressione a tutti i big dell’AI

    24/04/202662 Views
    Add A Comment
    Leave A Reply Cancel Reply

    Ultimi articoli

    Mise-en-place sta cambiando il modo di gestire gli ambienti di sviluppo

    01/05/2026
    yt-dlp e SponsorBlock

    yt-dlp e SponsorBlock, la combinazione per scaricare video da YouTube

    30/04/202616 Views
    Powertoys

    Microsoft PowerToys: una suite senza pretese che risolve problemi reali

    30/04/202615 Views
    Oddsparks: An Automation Adventure

    Oddsparks: An Automation Adventure – Recensione PC

    30/04/2026

    Gemini crea documenti Word, Excel e PDF direttamente in chat e senza abbonamento

    30/04/2026
    CATL e HyperStrong

    CATL e HyperStrong: l’accordo da 60 GWh che porta le batterie al sodio nell’era industriale

    29/04/2026
    Gomoot : tecnologia e lifestyle
    X (Twitter) Bluesky WhatsApp Threads Mastodon
    • Home
    • Tech
    • Mobiles
    • Contatti
    • Privacy
    • ABOUT
    © 2026 GOMOOT.COM

    Type above and press Enter to search. Press Esc to cancel.