Close Menu
Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    Ultimi Articoli

    Google blocca il primo zero-day generato da un LLM

    11/05/202618 Views

    WiiM Sound Lite: speaker Wi-Fi perfetto per l’audio domestico

    11/05/2026
    immense engine

    Immense Engine, l’alternativa europea a Unreal Engine

    11/05/2026
    Karakeep alternativa a pocket con gestione AI dei bookmark

    Karakeep: il sostituto self-hosted di Pocket che organizza i bookmark con un LLM locale

    11/05/2026
    Marshall Killburn III

    Marshall Kilburn III: altoparlante robusto, stereo e vintage

    11/05/2026137 Views
    EarFun Uboom L

    EarFun UBoom L, l’altoparlante economico, pratico e di qualità

    10/05/202657 Views
    Immich

    Immich: accelerazione GPU, ricerca CLIP multilingua e External Library

    09/05/202627 Views
    JBL Flip 6

    JBL Flip 6: speaker Bluetooth compatto, potente e impermeabile

    09/05/20262.028 Views
    martedì 12 Maggio 2026
    X (Twitter) Threads Mastodon Bluesky WhatsApp
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    • Home
    • Computer
      1. MINI PC
      2. Laptop
      3. Monitor
      4. Teoria
      5. Mouse
      6. GPU
      7. Windows
      8. Motherboard
      9. Tastiere
      10. View All
      NiPoGi E3B

      Mini PC NiPoGi E3B con Ryzen 7 5700U: potenza compatta ad un prezzo aggressivo

      26/03/2026

      GEEKOM A5: mini pc con buone prestazioni grazie all’AMD Ryzen 7 5800H

      26/03/2026
      Geekom A8

      Recensione Geekom A8: il mini PC AMD che non ti aspetti

      11/03/2026
      ACEMAGICIAN S3A

      ACEMAGICIAN S3A: un mini pc per il gaming ma non solo

      09/03/2026
      MacBook Neo

      MacBook Neo, il portatile entry-level di Apple

      30/03/2026
      Galaxy Book5 Pro

      Il Samsung Galaxy Book5 Pro sfida il MacBook su qualità e autonomia

      18/03/2026
      Lenovo Chromebook Duet 11

      Lenovo Chromebook Duet 11, un versatile 2-in-1 con 10 anni di aggiornamenti

      24/12/2025
      Legion 5 15IRX10

      Lenovo Legion 5 15IRX10, potenza da workstation e versatilità gaming

      13/10/2025

      ASUS ROG Strix XG27AQNGV, il monitor per i competitive gamer

      05/05/2026

      Philips Evnia 27M2N6501L: il miglior monitor QD-OLED sotto i 500 euro per gaming e color grading

      14/04/2026

      MSI Modern MD272UPSW, il monitor 4K che è anche Smart TV

      13/04/2026
      ASRock Phantom Gaming PGO32UFS

      ASRock Phantom Gaming PGO32UFS: il primo OLED di ASRock punta in alto

      07/04/2026
      Immich

      Immich: accelerazione GPU, ricerca CLIP multilingua e External Library

      09/05/2026
      uv astral

      Il tooling Python è sempre stato un disastro. uv risolve tutto in un colpo solo

      04/05/2026

      Mise-en-place sta cambiando il modo di gestire gli ambienti di sviluppo

      01/05/2026
      Powertoys

      Microsoft PowerToys: una suite senza pretese che risolve problemi reali

      30/04/2026

      Logitech G Pro X2 Superstrike, il mouse con tecnologia HITS per click più veloci

      10/02/2026
      Mouse NZXT Lift 2

      Mouse NZXT Lift 2, mouse filare ultraleggero e preciso

      21/12/2025
      MX Master 4

      Logitech MX Master 4, feedback aptico e design migliorato

      20/12/2025
      Burst II Air

      Turtle Beach Burst II Air wireless, un mouse gaming di soli 47 gr!

      15/06/2025
      MatX

      MatX raccoglie 500 milioni di dollari per sfidare Nvidia

      25/02/2026
      nvidia rtx 5090 ti

      Nvidia prepara una RTX 5090 “estrema” per il 2026

      09/02/2026
      dlss45 MFG 6× nvidia

      NVIDIA dynamic MFG e MFG 6×: più intelligenza per i frame generati

      06/02/2026
      OptiScaler

      OptiScaler, cos’è e come attivarlo nei giochi

      03/01/2026
      secure boot

      Secure Boot in scadenza: cosa succede ai PC dopo il 27 giugno 2026

      06/05/2026
      pannello di controllo windows 11

      Microsoft accelera l’abbandono del Pannello di controllo su Windows 11

      09/04/2026
      Windows 11

      Windows 11 raggiunge un miliardo di utenti: più veloce di Windows 10 nonostante le critiche

      29/01/2026
      mu language model

      Mu, un motore AI per gestire le impostazioni di Windows 11

      27/12/2025

      Arduino UNO Q raddoppia RAM e storage

      23/01/2026
      ROG Strix B860-A Gaming

      Asus ROG Strix B860-A Gaming WiFi, motherboard per build ad alte prestazioni.

      17/01/2026
      pcie 250watt

      Asus alimenta una RTX 5060 Ti da 250 W su uno slot PCIe potenziato

      23/09/2025
      MSI MAG Z890 Tomahawk WiFi

      MSI MAG Z890 Tomahawk WiFi: scheda madre top per Intel Ultra

      12/06/2025

      Light Mount di be quiet! porta il silenzio nel gaming

      04/02/2026
      Signature Slim Solar+ K980

      Logitech Signature Slim Solar+ K980: la tastiera che si ricarica con la luce

      22/01/2026
      Epomaker HE75 Mag

      Tastiera magnetica Epomaker HE75 Mag: la scelta giusta per chi pretende il massimo spendendo poco

      23/11/2025
      Keys-To-Go 2

      Logitech Keys-To-Go 2: tastiera wireless per laptop, tablet e smartphone

      14/06/2025
      Immich

      Immich: accelerazione GPU, ricerca CLIP multilingua e External Library

      09/05/2026
      Jujutsu

      Jujutsu (jj): il version control system Git-compatibile per il workflow del developer

      08/05/2026
      Rog Maximus Z890 Extreme PCIe 5

      PCIe 8.0 Draft 0.5: lo standard vola, l’hardware consumer non segue

      07/05/2026
      secure boot

      Secure Boot in scadenza: cosa succede ai PC dopo il 27 giugno 2026

      06/05/2026
    • Tech
      1. Curiosità
      2. Eventi
      3. memory cards
      4. Powerbank
      5. Smartwatch
      6. Gadgets
      7. Bluetooth speakers
      8. Intelligenza artificiale
      9. Offerte
      10. Software
      11. View All

      Starlink abbassa i satelliti per sicurezza orbitale

      02/01/2026

      Con Nano Banana, Gemini supera ChatGPT tra le app AI

      17/09/2025
      grotta lunare

      Scoperta una grotta lunare sotterranea

      16/07/2024
      Oleg Kononenko

      Oleg Kononenko: 1000 giorni nello spazio

      05/06/2024
      Google I/O 2026

      La conferenza Google I/O 2026 sarà a maggio

      18/02/2026

      NASA rinvia Artemis II per perdite di idrogeno

      03/02/2026
      BYD YangWang U9 Extreme

      BYD YangWang U9 Extreme: il nuovo re della velocità tra le auto di serie

      24/09/2025
      Awe Dropping Apple

      Awe Dropping del 9 settembre 2025, Apple svela il suo futuro

      09/09/2025
      SSD Crucial P310 2TB

      Crucial P310 2TB SSD NVMe: storage ad alta velocità a un ottimo prezzo

      08/06/2025
      V-NAND QLC Samsung

      Il futuro dello storage è pronto: Samsung svela la V-NAND QLC da 1 Tb

      12/09/2024
      microSD SD Express

      Samsung presenta la prima microSD SD Express

      07/03/2024

      ADATA lancia il primo SSD esterno USB4 SE920

      31/10/2023
      power bank

      Power Bank cablati e wireless Qi2 : guida all’acquisto

      03/03/2026

      Anker Nano Power Bank 5K, il caricatore più sottile con MagSafe e Qi2

      22/01/2026
      Sharge ICEMAG 2

      Sharge ICEMAG 2: power bank Qi2 15W con raffreddamento attivo

      12/05/2025
      Baseus Nomos

      Baseus Nomos Power Bank: ricarica wireless veloce e sicura

      11/05/2025

      Huawei Watch Fit 5 Pro: design e sensori da fascia alta in un formato ultrasottile

      08/05/2026

      Watch GT Runner 2 è il running watch più completo di Huawei

      30/03/2026

      WhatsApp arriva sugli smartwatch Garmin

      17/03/2026

      CMF Watch 3 Pro, lo smartwatch con ChatGPT integrato a meno di 100 euro

      04/03/2026

      WiiM Sound Lite: speaker Wi-Fi perfetto per l’audio domestico

      11/05/2026
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      24/03/2026

      Xiaomi Smart Tag offre Find My e Find Hub in un solo tracker

      12/03/2026
      Hollyland Lark A1

      Hollyland Lark A1: uno dei migliori microfoni lavalier per smartphone e vlogging

      03/03/2026
      Marshall Killburn III

      Marshall Kilburn III: altoparlante robusto, stereo e vintage

      11/05/2026
      EarFun Uboom L

      EarFun UBoom L, l’altoparlante economico, pratico e di qualità

      10/05/2026
      JBL Flip 6

      JBL Flip 6: speaker Bluetooth compatto, potente e impermeabile

      09/05/2026
      Marshall Middleton II

      Marshall Middleton II, potenza e stile dal look retrò

      08/05/2026
      Docling

      Docling, la libreria open source per il PDF parsing nelle pipeline RAG con Ollama e Qdrant

      12/05/2026

      Google blocca il primo zero-day generato da un LLM

      11/05/2026
      Karakeep alternativa a pocket con gestione AI dei bookmark

      Karakeep: il sostituto self-hosted di Pocket che organizza i bookmark con un LLM locale

      11/05/2026
      Gemma 4

      Gemma 4 accelera l’inferenza grazie ai drafter multi-token

      06/05/2026
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      24/03/2026
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      nubia z60 ultra

      Offerte Black Friday Nubia: telefoni premium a prezzi convenienti

      22/11/2024
      Scream Fest 2024

      Steam Scream Fest 2024: sconti horror per Halloween

      29/10/2024
      Docling

      Docling, la libreria open source per il PDF parsing nelle pipeline RAG con Ollama e Qdrant

      12/05/2026
      Karakeep alternativa a pocket con gestione AI dei bookmark

      Karakeep: il sostituto self-hosted di Pocket che organizza i bookmark con un LLM locale

      11/05/2026
      firefox 150

      Claude Mythos e Firefox: la pipeline AI che ha corretto 423 bug di sicurezza in un solo mese

      08/05/2026
      Ghostty

      Ghostty 1.3: l’emulatore di terminale che ha trovato la sua formula definitiva

      08/05/2026
      Docling

      Docling, la libreria open source per il PDF parsing nelle pipeline RAG con Ollama e Qdrant

      12/05/2026

      Google blocca il primo zero-day generato da un LLM

      11/05/2026
      immense engine

      Immense Engine, l’alternativa europea a Unreal Engine

      11/05/2026
      Karakeep alternativa a pocket con gestione AI dei bookmark

      Karakeep: il sostituto self-hosted di Pocket che organizza i bookmark con un LLM locale

      11/05/2026
    • Mobiles
      1. Smartphones
      2. View All
      POCO M8 5G

      Il POCO M8 5G con display AMOLED da 3200 nits cambia le aspettative sulla fascia entry

      10/04/2026

      OPPO Reno13 Pro, il mid-range con ambizioni da flagship

      01/04/2026

      Samsung Galaxy A57 5G: il mid-range sottile, solido e duraturo

      27/03/2026

      OPPO Find X9 e X9 Pro: la gamma Find X ridefinisce l’autonomia dei flagship Android

      26/03/2026

      Note A1 NXTPAPER di TCL, un blocco note digitale per studenti e professionisti

      28/04/2026

      TCL NXTPAPER 14 è il tablet che fa riposare gli occhi

      24/04/2026
      Galaxy Tab S10 FE

      Da Samsung due valide alternative all’ iPad, Galaxy Tab S10 FE e S10 FE+

      10/03/2026
      OPPO Pad SE

      OPPO Pad SE: tablet economico con autonomia record e corpo in alluminio

      09/03/2026
    • Musica
      1. Cuffie
      2. DAC
      3. hi-fi
      4. Teoria
      5. View All

      Sony INZONE H6 Air, la prima cuffia gaming open-back di Sony

      04/05/2026

      JBL Sense Pro: la formula open-ear che convince

      27/04/2026

      SoundPEATS Air6 HS, auricolari semi-in-ear economici con LDAC

      23/04/2026

      Apple AirPods Max 2: sei anni di attesa per un aggiornamento che (quasi) vale il prezzo

      15/04/2026
      Truthear KeyX

      Truthear KeyX, un DAC dongle che vale ogni centesimo

      28/04/2026
      Eversolo Play

      Eversolo Play: il tuttofare hi-fi per chi vuole meno cavi e più musica

      03/12/2025
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      FiiO BTR15

      FiiO BTR15: DAC Bluetooth al prezzo più basso di sempre

      17/05/2025
      Eversolo Play

      Eversolo Play: il tuttofare hi-fi per chi vuole meno cavi e più musica

      03/12/2025
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      Focal Aria 926

      Componenti per un ottimo impianto stereo

      31/07/2024

      Garmin acquista JL Audio

      16/08/2023
      truffa phishing zalando

      Truffa phishing: in regalo la gift card Zalando da 150€

      06/12/2024
      sim ed esim

      Differenza tra SIM fisica ed eSIM: vantaggi e sicurezza

      02/11/2024

      Malware: cosa sono e come difendersi

      19/10/2024
      crittografia a cosa serve

      Crittografia, come funziona e perchè dobbiamo utilizzarla

      16/10/2024

      Sony INZONE H6 Air, la prima cuffia gaming open-back di Sony

      04/05/2026
      Truthear KeyX

      Truthear KeyX, un DAC dongle che vale ogni centesimo

      28/04/2026

      JBL Sense Pro: la formula open-ear che convince

      27/04/2026

      SoundPEATS Air6 HS, auricolari semi-in-ear economici con LDAC

      23/04/2026
    • Lifestyle
      1. Criptovalute
      2. EV
      3. Gaming
      4. Trekking
      5. Scienze
      6. View All
      Alpha Arena : trading ai bot

      Alpha Arena : sfida tra modelli AI nel trading di criptovalute

      20/10/2025
      Coinbase

      Coinbase colpita da attacco informatico e minaccia di riscatto

      15/05/2025
      coinbase

      Coinbase : acquisti cripto tramite Apple Pay

      03/12/2024
      criptovalute

      Criptovalute: cosa sono e come funzionano le monete virtuali

      19/10/2024
      CATL e HyperStrong

      CATL e HyperStrong: l’accordo da 60 GWh che porta le batterie al sodio nell’era industriale

      29/04/2026
      tesla

      Tesla dice addio a Model S e Model X ma accelera sugli EV autonomi e i robot umanoidi

      29/01/2026
      Volvo EX60

      Volvo EX60: la sfida scandinava al dominio tedesco degli elettrici premium

      22/01/2026
      CATL sodium ion

      CATL annuncia la produzione di massa delle batterie agli ioni di sodio nel 2026

      30/12/2025
      Arranger: A Role-Puzzling Adventure

      Arranger: A Role-Puzzling Adventure, un puzzle che sposta il mondo sotto i tuoi piedi

      07/05/2026
      Saros

      Saros: Housemarque firma il suo shooter più maturo

      06/05/2026
      Oddsparks: An Automation Adventure

      Oddsparks: An Automation Adventure – Recensione PC

      30/04/2026
      DOOMBLADE

      DOOMBLADE: frenesia, heavy metal e biomi dei Dread Lords

      23/04/2026
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      8a Scarpinata della Teverina

      A spasso per i sentieri: 8a Scarpinata della Teverina

      14/05/2024
      Valli e Calanchi

      A spasso per i sentieri: 1a Valli e Calanchi

      27/09/2023
      Maternum Marathon 2023

      A spasso per i sentieri: la 2a edizione di Maternum Marathon

      13/06/2023
      Il caffè riscrive il microbioma intestinale

      Il caffè riscrive il microbioma intestinale, e con esso umore, memoria e cognizione

      23/04/2026
      urano

      Le lune esterne di Urano Titania e Oberon, sono scure sul lato anteriore.

      19/06/2025
      Muon g-2

      L’anomalia Muon g-2 segue le leggi del Modello Standard

      13/06/2025
      Neuroplatform finalspark

      Neuroplatform, piattaforma online alimentata dal primo processore biologico al mondo

      27/05/2024
      CATL e HyperStrong

      CATL e HyperStrong: l’accordo da 60 GWh che porta le batterie al sodio nell’era industriale

      29/04/2026
      Il caffè riscrive il microbioma intestinale

      Il caffè riscrive il microbioma intestinale, e con esso umore, memoria e cognizione

      23/04/2026
      tesla

      Tesla dice addio a Model S e Model X ma accelera sugli EV autonomi e i robot umanoidi

      29/01/2026
      Volvo EX60

      Volvo EX60: la sfida scandinava al dominio tedesco degli elettrici premium

      22/01/2026
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    Home»Tech»Intelligenza artificiale»Docling, la libreria open source per il PDF parsing nelle pipeline RAG con Ollama e Qdrant
    Intelligenza artificiale

    Docling, la libreria open source per il PDF parsing nelle pipeline RAG con Ollama e Qdrant

    Dalla teoria alla pratica con Docling, 500 paper scientifici, Qdrant e Qwen3.6-35b-a3b in locale per costruire una knowledge base privata interrogabile in vero linguaggio naturale
    GrazianoGraziano12/05/2026
    Share Twitter WhatsApp Bluesky Threads
    Docling
    Docling

    Chi prova a costruire un sistema RAG sopra il proprio archivio documentale conosce bene il momento in cui l’entusiasmo iniziale si scontra con la realtà: i PDF. Da tempo il formato di Adobe ha occupato una sorta di muro invisibile fra i dati strutturati e i modelli linguistici, capace di trasformare una pipeline elegante in una sequenza di workaround poco eleganti.

    Tabelle disallineate, colonne che diventano un flusso di testo confuso, formule matematiche ridotte a sequenze incomprensibili: ogni documento sembra avere una geometria a sé. Docling nasce per affrontare questo problema in modo strutturale. Sviluppato da IBM Research e rilasciato come progetto open source alla fine del 2024, è una libreria Python pensata per convertire documenti complessi (non solo PDF, ma anche DOCX, PPTX, HTML, XLSX e immagini) in un formato coerente, pronto per essere ingerito da un LLM, da un sistema di ricerca semantica o da un knowledge graph.

    A differenza dei classici parser basati su euristiche o sul testo grezzo estratto da PyPDF2, Docling adotta un approccio multi-modello che combina rilevamento del layout, comprensione gerarchica delle tabelle e OCR opzionale per i documenti scannerizzati. Il risultato è un Markdown ordinato, una struttura JSON gerarchica oppure un grafo di blocchi, sempre con riferimenti ai bounding box originali. Per chi lavora a RAG, automatizza report o vuole portare la propria libreria personale dentro un assistente AI in locale, Docling è uno dei tasselli più interessanti emersi negli ultimi tempi.

    Perché IBM ha rilasciato Docling come open source

    Docling è il frutto del gruppo IBM Research Zurich, lo stesso che da anni si occupa di document understanding per i clienti enterprise della casa madre. Per molto tempo questa tecnologia è rimasta dietro il portale Watson, accessibile solo via API e a pagamento.

    La scelta di liberarne il cuore con licenza MIT, alla fine del 2024, va letta nel contesto della guerra in corso sui modelli aperti: senza una pipeline solida di preprocessing, anche il miglior LLM rimane limitato dalla qualità del testo che riceve in ingresso. A tal proposito, IBM ha rilasciato in parallelo i modelli specializzati su cui Docling si appoggia, distribuiti su Hugging Face e utilizzabili in totale autonomia. Inoltre, la libreria si integra in modo trasparente con LangChain, LlamaIndex, Haystack e diversi orchestratori agentici, riducendo l’attrito per chi adotta lo stack di fatto del momento.

    La differenza rispetto a librerie storiche come pdfplumber, pdfminer.six o PyMuPDF è netta. Quei tool restano ottimi per estrarre testo lineare, ma non comprendono la struttura logica del documento. Docling, invece, distingue intestazioni, paragrafi, didascalie, note a piè di pagina, tabelle multilivello e blocchi di codice. Di conseguenza, quando il documento viene chunkato per essere embeddato in un vector store, i confini semantici vengono rispettati e la retrieval ne beneficia in modo misurabile.

    I modelli che lavorano su Docling

    L’architettura di Docling si regge su due modelli specializzati, entrambi rilasciati pubblicamente. Il primo è un layout analyzer basato su una variante di RT-DETR addestrato su DocLayNet, il dataset interno IBM che copre 80.863 pagine annotate manualmente su sei categorie documentali (articoli scientifici, manuali, brevetti, bilanci, leggi e moduli amministrativi).

    DocLayNet è stato pensato proprio per coprire la varietà del mondo reale, con undici classi semantiche e una distribuzione bilanciata fra domini. Il secondo modello è TableFormer, una rete che ricostruisce la matrice logica delle tabelle, comprese quelle con celle unite, header su più righe e gerarchie complesse, proprio i casi in cui i tool tradizionali falliscono.

    Per chi vuole numeri di throughput, il Docling Technical Report misura su una RTX 3090 una media di 1,27 secondi per pagina in modalità fast e 3,7 secondi in modalità accurate. Su CPU (un Intel Xeon Platinum 8580) si scende a 5,4 secondi/pagina in fast e oltre 14 secondi in accurate. Su una RTX 4070 consumer, un documento di 30 pagine processato con pipeline completa (layout, tabelle, OCR disattivato) gira in circa 22-25 secondi, contro i 45-50 secondi della stessa pipeline su un MacBook Pro M3 Pro in modalità CPU-only. In tempo reale conviene la GPU, ma per lavori batch notturni anche un mini-PC diventa un’opzione valida.

    Sopra questi due modelli, Docling orchestra una pipeline modulare. Si possono attivare o disattivare OCR (EasyOCR e Tesseract sono entrambi supportati), classificazione delle figure, equazioni LaTeX, esportazione gerarchica e persino estrazione dei metadati. La possibilità di scegliere quali fasi caricare significa controllare esattamente VRAM, tempo di esecuzione e qualità del risultato. A partire dalla versione 2 è stato introdotto anche SmolDocling, un modello vision-language compatto da 256M parametri pensato per girare su hardware modesto, mentre su CPU i tempi salgono in modo sensibile, lasciando il flusso utilizzabile solo per archivi non in tempo reale.

    Integrarlo in una pipeline RAG senza riscrivere lo stack

    L’approccio più immediato è installare il pacchetto con pip install docling e ottenere subito un convertitore funzionante. Una manciata di righe basta per trasformare un PDF in Markdown, JSON o nel formato nativo DoclingDocument, che conserva struttura, posizioni e relazioni gerarchiche.

    from docling.document_converter import DocumentConverter
    
    converter = DocumentConverter()
    result = converter.convert("manuale_tecnico.pdf")
    print(result.document.export_to_markdown())

    Quando carichi un documento in un sistema RAG (recupero + LLM), devi spezzare il testo in pezzi più piccoli (chunk) per poterli cercare nel vector store. Il guaio è che se tagli il testo in modo ingenuo — ogni N caratteri, o ogni N parole — rischi di spezzare a metà un concetto, una tabella, un elenco puntato. Il chunk risultante non ha senso da solo.

    Docling capisce già la struttura del documento (titoli, paragrafi, tabelle, ecc.). HybridChunker sfrutta questa conoscenza per tagliare il testo nei punti giusti, cioè rispettando i confini logici: finisce un paragrafo → taglia lì, non nel mezzo.

    Fa anche due cose in più:

    • Controlla la lunghezza in token — non in caratteri, ma nei “pezzi” che l’LLM effettivamente legge — così il chunk non supera mai il limite del modello.
    • Aggiunge il contesto della sezione — se un chunk viene da un paragrafo sotto il titolo “Installazione > Requisiti”, questa informazione viene allegata al chunk. Così anche fuori contesto si capisce di cosa parla.

    Quando l’LLM riceve un chunk recuperato dal vector store, non gli arriva un pezzetto di testo strappato a caso dal mezzo di un documento. Gli arriva un blocco che ha senso da solo, con il titolo della sezione di appartenenza e i confini rispettati. Questo migliora molto la qualità delle risposte.

    Il lettore di base funziona, ma ti dà solo il testo. Se invece esporti il documento in formato JSON (con metadati), Docling ti restituisce molto di più (metadati): per ogni pezzo di testo sai a che pagina si trova, se è un titolo o un paragrafo o una tabella, a che livello gerarchico appartiene.

    Se usi LlamaIndex o LangChain per costruire un sistema RAG, di solito carichi i PDF con un lettore generico. Docling offre un suo lettore ufficiale (DoclingReader) che si sostituisce a quello standard con pochissimo codice — due righe, appunto.

    from llama_index.readers.docling import DoclingReader
    
    reader = DoclingReader()
    docs = reader.load_data(file_path="documento.pdf")

    Se invece vuoi l’export in JSON (per avere i metadati di cui parlavamo sopra):

    from llama_index.readers.docling import DoclingReader
    
    reader = DoclingReader(export_type=DoclingReader.ExportType.JSON)
    docs = reader.load_data(file_path="documento.pdf")

    E a questo punto, se aggiungi anche il DoclingNodeParser, LlamaIndex capisce la struttura Docling e crea i nodi già arricchiti con metadati come numero di pagina e bounding box:

    from llama_index.readers.docling import DoclingReader
    from llama_index.node_parser.docling import DoclingNodeParser
    
    reader = DoclingReader(export_type=DoclingReader.ExportType.JSON)
    node_parser = DoclingNodeParser()
    
    index = VectorStoreIndex.from_documents(
    documents=reader.load_data("documento.pdf"),
    transformations=[node_parser],
    )

    Senza filtering, il vector store recupera i chunk più simili semanticamente, ma magari prende roba sparsa e poco pertinente. Con il filtering arrivi al contesto giusto con più precisione, e l’LLM risponde meglio perché riceve informazioni più mirate. In breve: l’integrazione base ti fa risparmiare tempo, ma i metadati personalizzati ti faranno guadagnare qualità nelle risposte.

    Docling alla prova: end-to-end con 500 paper, Qdrant e Ollama

    Per capire come si comporta lo stack messo davvero alla prova, vale la pena ricostruire un flusso end-to-end su un caso plausibile, ovvero un ricercatore che vuole interrogare in linguaggio naturale una libreria di 500 paper scientifici in PDF. Il setup è minimale, con una macchina dotata di RTX 4070 (12 GB), 32 GB di RAM, Ollama per l’inferenza locale, Qdrant come vector store e un piccolo script che orchestra il tutto.

    La pipeline di ingest si divide in tre fasi. Nella prima, Docling viene fatto girare sull’intero corpus con modalità accurate attivata e OCR disattivato (i paper sono digitali nativi). Il tempo medio è di circa 2,8 secondi per pagina su GPU, quindi su una media di 12 pagine per paper si ottiene un throughput totale di circa cinque ore per l’intero archivio. È un batch che gira tranquillamente in una notte senza supervisione.

    Nella seconda fase entra in gioco l’HybridChunker, configurato sul tokenizer di BAAI/bge-m3, un embedding model multilingue da 567M parametri che gira bene sulla stessa GPU. Ogni paper produce in media 45 chunk semanticamente coerenti, per un totale di circa 22.500 vettori generati a una velocità di 160 chunk/secondo in batch da 32. I metadati salvati includono titolo del paper, sezione, numero pagina e bounding box, informazioni preziose per filtri mirati e per fornire citazioni esatte all’LLM.

    Nella terza fase, Qdrant viene avviato in container con storage su SSD NVMe e configurato con indice HNSW. L’intero database, comprese le payload, occupa circa 180 MB su disco, una dimensione gestibile anche su una macchina modesta. La fase di query usa Qwen3.6-35b-a3b servito da Ollama o LMStudio, che con offload parziale su CPU produce risposte in circa 12 secondi per una domanda complessa, oppure Qwen2.5 14B completamente su GPU per latenze sotto i 6 secondi.

    Il risultato pratico è una knowledge base personale completamente locale, capace di rispondere a domande del tipo “quali paper degli ultimi due anni discutono di sparse attention?“, citando direttamente sezione e pagina. Il costo marginale è zero, la privacy assoluta, e l’intera pipeline può essere ricostruita su una macchina secondaria in poche ore.

    Limiti reali e alternative da conoscere

    Sarebbe scorretto presentare Docling come una soluzione universale. La libreria ha ancora qualche fragilità sui documenti con formattazione molto creativa (riviste, magazine, layout editoriali multicolonna con riquadri sovrapposti), dove l’analisi del layout fa fatica a stabilire l’ordine di lettura. Su scansioni di pessima qualità, il risultato dell’OCR resta vincolato a EasyOCR o Tesseract, e nessuno dei due raggiunge la qualità dei modelli proprietari di Google Document AI o Azure Document Intelligence.

    Marker, sviluppato da Vik Paruchuri, è probabilmente il principale concorrente diretto, perché privilegia velocità ed eleganza dell’output Markdown ed eccelle su paper accademici. MinerU, progetto cinese basato su PDF-Extract-Kit, ha un approccio simile a Docling ma con modelli più pesanti e qualità superiore su tabelle e formule. Per casi più semplici, infine, unstructured.io rimane una scelta valida come orchestratore generale.

    La scelta dipende da cosa stai costruendo. Se ti serve un parser che funzioni out of the box su un parco documenti eterogeneo, gestisca DOCX, PPTX e HTML oltre ai PDF, e si integri senza attrito nel tuo stack RAG, Docling è oggi il punto di equilibrio migliore. Se invece il tuo dominio è ristretto e omogeneo, potresti trovare in Marker o MinerU una qualità superiore. Conviene sempre testare su una decina di documenti campione del tuo corpus prima di committare l’intera pipeline.

    Un tassello che cambia la qualità del tuo stack AI locale

    Se hai una libreria di paper, manuali, schede tecniche o bilanci, puoi costruire un knowledge base privato e interrogabile in linguaggio naturale, abbinando Docling a un’istanza locale di Ollama o LM Studio. Poi se devi automatizzare report aziendali, puoi trasformare il flusso PDF verso dati strutturati in qualcosa di affidabile, senza la fragilità delle regex sul testo estratto. Infine se gestisci documenti per un team, puoi alimentare un sistema di ricerca semantica che restituisce risposte ancorate al documento originale, con tanto di citazione della pagina e del blocco.

    Il consiglio è di trattarlo come qualunque altro strumento, dedicandogli mezza giornata di sperimentazione, costruendo una piccola pipeline di valutazione sui tuoi documenti , e confrontando i chunk prodotti con quelli del tuo workflow attuale. È probabile che non tornerai indietro. In uno stack AI personale, Docling non è la stella, ma è uno di quei tasselli silenziosi che spostano la qualità complessiva di parecchi punti percentuali.

    docling ollama parsing pdf qdrant rag
    Previous ArticleGoogle blocca il primo zero-day generato da un LLM
    Avatar photo
    Graziano
    • Website

    Ho visto l'informatica nascere con il C64 e oggi seguo con lo stesso entusiasmo l'evoluzione verso mini PC e desktop SFF. Fuori dal lavoro, le mie passioni sono i film, il trekking, la bici e la corsa. Ma non disdegno una sessione di gaming o programmazione!

    Articoli collegati

    Intelligenza artificiale

    Google blocca il primo zero-day generato da un LLM

    11/05/202618 Views
    Karakeep alternativa a pocket con gestione AI dei bookmark
    Intelligenza artificiale

    Karakeep: il sostituto self-hosted di Pocket che organizza i bookmark con un LLM locale

    11/05/2026
    firefox 150
    Software

    Claude Mythos e Firefox: la pipeline AI che ha corretto 423 bug di sicurezza in un solo mese

    08/05/2026
    Add A Comment
    Leave A Reply Cancel Reply

    Ultimi articoli

    Google blocca il primo zero-day generato da un LLM

    11/05/202618 Views

    WiiM Sound Lite: speaker Wi-Fi perfetto per l’audio domestico

    11/05/2026
    immense engine

    Immense Engine, l’alternativa europea a Unreal Engine

    11/05/2026
    Karakeep alternativa a pocket con gestione AI dei bookmark

    Karakeep: il sostituto self-hosted di Pocket che organizza i bookmark con un LLM locale

    11/05/2026
    Marshall Killburn III

    Marshall Kilburn III: altoparlante robusto, stereo e vintage

    11/05/2026137 Views
    EarFun Uboom L

    EarFun UBoom L, l’altoparlante economico, pratico e di qualità

    10/05/202657 Views
    Gomoot : tecnologia e lifestyle
    X (Twitter) Bluesky WhatsApp Threads Mastodon
    • Home
    • Tech
    • Mobiles
    • Contatti
    • Privacy
    • ABOUT
    © 2026 GOMOOT.COM

    Type above and press Enter to search. Press Esc to cancel.