Close Menu
Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    Ultimi Articoli
    Colorful floating Office app icons (Word, Excel, PowerPoint, Outlook) on a light blue background.

    Windows 10 ancora protetto e gratis fino a ottobre 2027

    26/06/2026
    Microsoft 365

    Microsoft 365: l’Antitrust indaga sul rincaro di Copilot

    26/06/2026
    Voidwrought

    Voidwrought: esplorazione, combattimento e poteri divini

    25/06/202616 Views
    Mistral OCR 4

    Mistral OCR 4 trasforma il riconoscimento documenti in una mappa strutturata

    25/06/202627 Views

    FSR 4 arriva sulla nuova Steam Machine passando da Proton

    25/06/2026
    Strudel

    Strudel: il live coding della musica

    24/06/2026

    CATL lancia TENER Sodium, l’accumulo al sodio per la rete

    23/06/2026
    Gyroflow

    Gyroflow, come stabilizzare i video di action cam e droni

    23/06/2026
    sabato 27 Giugno 2026
    X (Twitter) Threads Mastodon Bluesky WhatsApp
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    • Home
    • Computer
      1. MINI PC
      2. Laptop
      3. Monitor
      4. Teoria
      5. Mouse
      6. GPU
      7. Windows
      8. Motherboard
      9. Tastiere
      10. View All
      NiPoGi E3B

      Mini PC NiPoGi E3B con Ryzen 7 5700U: potenza compatta ad un prezzo aggressivo

      26/03/2026

      GEEKOM A5: mini pc con buone prestazioni grazie all’AMD Ryzen 7 5800H

      26/03/2026
      Geekom A8

      Recensione Geekom A8: il mini PC AMD che non ti aspetti

      11/03/2026
      ACEMAGICIAN S3A

      ACEMAGICIAN S3A: un mini pc per il gaming ma non solo

      09/03/2026
      MacBook Neo

      MacBook Neo, il portatile entry-level di Apple

      30/03/2026
      Galaxy Book5 Pro

      Il Samsung Galaxy Book5 Pro sfida il MacBook su qualità e autonomia

      18/03/2026
      Lenovo Chromebook Duet 11

      Lenovo Chromebook Duet 11, un versatile 2-in-1 con 10 anni di aggiornamenti

      24/12/2025
      Legion 5 15IRX10

      Lenovo Legion 5 15IRX10, potenza da workstation e versatilità gaming

      13/10/2025
      Asus VA279QG

      ASUS VA279QG, monitor 27″ per lavoro, svago e gaming

      20/06/2026

      ASUS ROG Strix XG27AQNGV, il monitor per i competitive gamer

      05/05/2026

      Philips Evnia 27M2N6501L: il miglior monitor QD-OLED sotto i 500 euro per gaming e color grading

      14/04/2026

      MSI Modern MD272UPSW, il monitor 4K che è anche Smart TV

      13/04/2026
      Immich

      Immich: accelerazione GPU, ricerca CLIP multilingua e External Library

      09/05/2026
      uv astral

      Il tooling Python è sempre stato un disastro. uv risolve tutto in un colpo solo

      04/05/2026

      Mise-en-place sta cambiando il modo di gestire gli ambienti di sviluppo

      01/05/2026
      Powertoys

      Microsoft PowerToys: una suite senza pretese che risolve problemi reali

      30/04/2026

      Logitech Mobi Fold è il mouse pieghevole per chi viaggia

      11/06/2026

      Logitech G Pro X2 Superstrike, il mouse con tecnologia HITS per click più veloci

      10/02/2026
      Mouse NZXT Lift 2

      Mouse NZXT Lift 2, mouse filare ultraleggero e preciso

      21/12/2025
      MX Master 4

      Logitech MX Master 4, feedback aptico e design migliorato

      20/12/2025
      rtx spark

      Con RTX Spark, NVIDIA reinventa il PC Windows

      08/06/2026
      MatX

      MatX raccoglie 500 milioni di dollari per sfidare Nvidia

      25/02/2026
      nvidia rtx 5090 ti

      Nvidia prepara una RTX 5090 “estrema” per il 2026

      09/02/2026
      dlss45 MFG 6× nvidia

      NVIDIA dynamic MFG e MFG 6×: più intelligenza per i frame generati

      06/02/2026
      Colorful floating Office app icons (Word, Excel, PowerPoint, Outlook) on a light blue background.

      Windows 10 ancora protetto e gratis fino a ottobre 2027

      26/06/2026
      winget configuration

      WinGet Configuration configura Windows da zero con un solo comando

      02/06/2026
      Windhawk

      Windhawk: il marketplace di mod che modella Windows 11 a tuo piacere

      28/05/2026
      secure boot

      Secure Boot in scadenza: cosa succede ai PC dopo il 27 giugno 2026

      06/05/2026

      Arduino UNO Q raddoppia RAM e storage

      23/01/2026
      ROG Strix B860-A Gaming

      Asus ROG Strix B860-A Gaming WiFi, motherboard per build ad alte prestazioni.

      17/01/2026
      pcie 250watt

      Asus alimenta una RTX 5060 Ti da 250 W su uno slot PCIe potenziato

      23/09/2025
      MSI MAG Z890 Tomahawk WiFi

      MSI MAG Z890 Tomahawk WiFi: scheda madre top per Intel Ultra

      12/06/2025
      Epomaker HE75 V2

      Epomaker HE75 V2, il magnetico smette di essere una promessa

      20/06/2026

      Light Mount di be quiet! porta il silenzio nel gaming

      04/02/2026
      Signature Slim Solar+ K980

      Logitech Signature Slim Solar+ K980: la tastiera che si ricarica con la luce

      22/01/2026
      Epomaker HE75 Mag

      Tastiera magnetica Epomaker HE75 Mag: la scelta giusta per chi pretende il massimo spendendo poco

      23/11/2025
      Colorful floating Office app icons (Word, Excel, PowerPoint, Outlook) on a light blue background.

      Windows 10 ancora protetto e gratis fino a ottobre 2027

      26/06/2026
      Asus VA279QG

      ASUS VA279QG, monitor 27″ per lavoro, svago e gaming

      20/06/2026
      Epomaker HE75 V2

      Epomaker HE75 V2, il magnetico smette di essere una promessa

      20/06/2026

      Unreal Engine 6: Epic Games punta su Verse, portabilità e modelli AI

      18/06/2026
    • Tech
      1. Curiosità
      2. Eventi
      3. memory cards
      4. Powerbank
      5. Smartwatch
      6. Gadgets
      7. Bluetooth speakers
      8. Intelligenza artificiale
      9. Offerte
      10. Software
      11. View All

      Starlink abbassa i satelliti per sicurezza orbitale

      02/01/2026

      Con Nano Banana, Gemini supera ChatGPT tra le app AI

      17/09/2025
      grotta lunare

      Scoperta una grotta lunare sotterranea

      16/07/2024
      Oleg Kononenko

      Oleg Kononenko: 1000 giorni nello spazio

      05/06/2024

      Dataland, il primo museo di arte AI al mondo apre a LA

      19/06/2026
      Google I/O 2026

      La conferenza Google I/O 2026 sarà a maggio

      18/02/2026

      NASA rinvia Artemis II per perdite di idrogeno

      03/02/2026
      BYD YangWang U9 Extreme

      BYD YangWang U9 Extreme: il nuovo re della velocità tra le auto di serie

      24/09/2025
      SSD Crucial P310 2TB

      Crucial P310 2TB SSD NVMe: storage ad alta velocità a un ottimo prezzo

      08/06/2025
      V-NAND QLC Samsung

      Il futuro dello storage è pronto: Samsung svela la V-NAND QLC da 1 Tb

      12/09/2024
      microSD SD Express

      Samsung presenta la prima microSD SD Express

      07/03/2024

      ADATA lancia il primo SSD esterno USB4 SE920

      31/10/2023
      power bank

      Power Bank cablati e wireless Qi2 : guida all’acquisto

      03/03/2026

      Anker Nano Power Bank 5K, il caricatore più sottile con MagSafe e Qi2

      22/01/2026
      Sharge ICEMAG 2

      Sharge ICEMAG 2: power bank Qi2 15W con raffreddamento attivo

      12/05/2025
      Baseus Nomos

      Baseus Nomos Power Bank: ricarica wireless veloce e sicura

      11/05/2025
      Xiaomi Watch S5

      Xiaomi Watch S5, il nuovo smartwatch in acciaio e con autonomia record

      19/06/2026

      Xiaomi Redmi Watch 6, a meno di 100 euro fa cose che non ti aspetti

      12/06/2026

      Amazfit Bip Max, lo smartwatch con GPS a meno di 100 euro

      02/06/2026

      Huawei Watch Fit 5 Pro: design e sensori da fascia alta in un formato ultrasottile

      08/05/2026

      Blink Outdoor 4 è in offerta adesso, sorveglianza esterna senza abbonamento cloud

      22/06/2026

      WiiM Sound Lite: speaker Wi-Fi perfetto per l’audio domestico

      11/05/2026
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      24/03/2026

      Xiaomi Smart Tag offre Find My e Find Hub in un solo tracker

      12/03/2026

      JBL Xtreme 3, altoparlante potente e impermeabile

      19/05/2026

      JBL Boombox 4: speaker Bluetooth con AI e USB-C lossless

      18/05/2026
      JBL Clip 5

      JBL Clip 5, lo speaker Bluetooth ultra-portatile e suono potente

      16/05/2026
      Marshall Emberton III

      Marshall Emberton III: il re portatile del suono rock

      15/05/2026
      Mistral OCR 4

      Mistral OCR 4 trasforma il riconoscimento documenti in una mappa strutturata

      25/06/2026

      DiffusionGemma, il nuovo modello open source di Google

      11/06/2026
      Fable 5

      Claude Fable 5 e Mythos 5: Anthropic separa la potenza dall’accesso

      10/06/2026
      Hermes One

      Hermes Desktop, l’agente AI open source di Nous Research che impara dall’uso

      09/06/2026
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      24/03/2026
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      nubia z60 ultra

      Offerte Black Friday Nubia: telefoni premium a prezzi convenienti

      22/11/2024
      Scream Fest 2024

      Steam Scream Fest 2024: sconti horror per Halloween

      29/10/2024

      FSR 4 arriva sulla nuova Steam Machine passando da Proton

      25/06/2026
      Strudel

      Strudel: il live coding della musica

      24/06/2026
      Gyroflow

      Gyroflow, come stabilizzare i video di action cam e droni

      23/06/2026
      DuckDB

      DuckDB analizza file CSV, JSON e Parquet senza server né configurazione

      22/06/2026
      Microsoft 365

      Microsoft 365: l’Antitrust indaga sul rincaro di Copilot

      26/06/2026
      Mistral OCR 4

      Mistral OCR 4 trasforma il riconoscimento documenti in una mappa strutturata

      25/06/2026

      RedMagic 11S Pro, tanta potenza e autonomia per il re degli smartphone da gioco

      23/06/2026
      OPPO Reno15 5G

      OPPO Reno15 5G è il medio gamma completo ed equilibrato

      19/06/2026
    • Mobiles
      1. Smartphones
      2. View All

      RedMagic 11S Pro, tanta potenza e autonomia per il re degli smartphone da gioco

      23/06/2026
      OPPO Reno15 5G

      OPPO Reno15 5G è il medio gamma completo ed equilibrato

      19/06/2026

      Honor 600 Pro, il flagship di Honor in offerta

      09/06/2026

      Xiaomi 17T porta il teleobiettivo Leica 5x nella fascia media

      02/06/2026

      Honor MagicPad 4, il tablet Android ultrasottile che sfida l’iPad, ma costa la metà

      10/06/2026

      Note A1 NXTPAPER di TCL, un blocco note digitale per studenti e professionisti

      28/04/2026

      TCL NXTPAPER 14 è il tablet che fa riposare gli occhi

      24/04/2026
      Galaxy Tab S10 FE

      Da Samsung due valide alternative all’ iPad, Galaxy Tab S10 FE e S10 FE+

      10/03/2026
    • Musica
      1. Cuffie
      2. DAC
      3. hi-fi
      4. Teoria
      5. View All

      Moto Buds Loop, auricolari con stile aperto e suono Bose

      19/06/2026
      Turtle Beach Stealth Pro II

      Turtle Beach Stealth Pro II, cuffia da gaming per ogni piattaforma

      15/06/2026

      Sony INZONE H6 Air, la prima cuffia gaming open-back di Sony

      04/05/2026

      JBL Sense Pro: la formula open-ear che convince

      27/04/2026
      Truthear KeyX

      Truthear KeyX, un DAC dongle che vale ogni centesimo

      28/04/2026
      Eversolo Play

      Eversolo Play: il tuttofare hi-fi per chi vuole meno cavi e più musica

      03/12/2025
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      FiiO BTR15

      FiiO BTR15: DAC Bluetooth al prezzo più basso di sempre

      17/05/2025

      Edifier R1280DBs, ottimi diffusori da scaffale economici

      20/06/2026
      Eversolo Play

      Eversolo Play: il tuttofare hi-fi per chi vuole meno cavi e più musica

      03/12/2025
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      Focal Aria 926

      Componenti per un ottimo impianto stereo

      31/07/2024
      truffa phishing zalando

      Truffa phishing: in regalo la gift card Zalando da 150€

      06/12/2024
      sim ed esim

      Differenza tra SIM fisica ed eSIM: vantaggi e sicurezza

      02/11/2024

      Malware: cosa sono e come difendersi

      19/10/2024
      crittografia a cosa serve

      Crittografia, come funziona e perchè dobbiamo utilizzarla

      16/10/2024

      Edifier R1280DBs, ottimi diffusori da scaffale economici

      20/06/2026

      Moto Buds Loop, auricolari con stile aperto e suono Bose

      19/06/2026
      Turtle Beach Stealth Pro II

      Turtle Beach Stealth Pro II, cuffia da gaming per ogni piattaforma

      15/06/2026
      Soundcore Motion 300

      Soundcore Motion 300: speaker Bluetooth con app e LDAC a meno di 100 euro

      13/06/2026
    • Lifestyle
      1. Criptovalute
      2. EV
      3. Gaming
      4. Trekking
      5. Scienze
      6. View All
      Alpha Arena : trading ai bot

      Alpha Arena : sfida tra modelli AI nel trading di criptovalute

      20/10/2025
      Coinbase

      Coinbase colpita da attacco informatico e minaccia di riscatto

      15/05/2025
      coinbase

      Coinbase : acquisti cripto tramite Apple Pay

      03/12/2024
      criptovalute

      Criptovalute: cosa sono e come funzionano le monete virtuali

      19/10/2024

      CATL lancia TENER Sodium, l’accumulo al sodio per la rete

      23/06/2026
      CATL e HyperStrong

      CATL e HyperStrong: l’accordo da 60 GWh che porta le batterie al sodio nell’era industriale

      29/04/2026
      tesla

      Tesla dice addio a Model S e Model X ma accelera sugli EV autonomi e i robot umanoidi

      29/01/2026
      Volvo EX60

      Volvo EX60: la sfida scandinava al dominio tedesco degli elettrici premium

      22/01/2026
      Voidwrought

      Voidwrought: esplorazione, combattimento e poteri divini

      25/06/2026
      Citizen Sleeper

      Citizen Sleeper: una coscienza alla deriva tra le stelle

      18/06/2026
      The Ouroboros King

      The Ouroboros King: scacchi, carte e un serpente che si morde la coda

      11/06/2026
      Songs of conquest

      Songs of Conquest: un genere che torna a respirare

      04/06/2026
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      8a Scarpinata della Teverina

      A spasso per i sentieri: 8a Scarpinata della Teverina

      14/05/2024
      Valli e Calanchi

      A spasso per i sentieri: 1a Valli e Calanchi

      27/09/2023
      Maternum Marathon 2023

      A spasso per i sentieri: la 2a edizione di Maternum Marathon

      13/06/2023
      Il caffè riscrive il microbioma intestinale

      Il caffè riscrive il microbioma intestinale, e con esso umore, memoria e cognizione

      23/04/2026
      urano

      Le lune esterne di Urano Titania e Oberon, sono scure sul lato anteriore.

      19/06/2025
      Muon g-2

      L’anomalia Muon g-2 segue le leggi del Modello Standard

      13/06/2025
      Neuroplatform finalspark

      Neuroplatform, piattaforma online alimentata dal primo processore biologico al mondo

      27/05/2024

      CATL lancia TENER Sodium, l’accumulo al sodio per la rete

      23/06/2026
      la vita in scena

      La vita in scena, cosa resta del cinema di Vittorio De Sica

      16/06/2026

      Accordo Wizz Air e Starlink: Wi-Fi gratuito a bordo dal 2027

      09/06/2026
      CATL e HyperStrong

      CATL e HyperStrong: l’accordo da 60 GWh che porta le batterie al sodio nell’era industriale

      29/04/2026
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    Home»Tech»Intelligenza artificiale»Docling, la libreria open source per il PDF parsing nelle pipeline RAG con Ollama e Qdrant
    Intelligenza artificiale

    Docling, la libreria open source per il PDF parsing nelle pipeline RAG con Ollama e Qdrant

    Dalla teoria alla pratica con Docling, 500 paper scientifici, Qdrant e Qwen3.6-35b-a3b in locale per costruire una knowledge base privata interrogabile in vero linguaggio naturale
    GrazianoGraziano12/05/202631
    Share Twitter WhatsApp Bluesky Threads
    Docling
    Docling

    Chi prova a costruire un sistema RAG sopra il proprio archivio documentale conosce bene il momento in cui l’entusiasmo iniziale si scontra con la realtà: i PDF. Da tempo il formato di Adobe ha occupato una sorta di muro invisibile fra i dati strutturati e i modelli linguistici, capace di trasformare una pipeline elegante in una sequenza di workaround poco eleganti.

    Tabelle disallineate, colonne che diventano un flusso di testo confuso, formule matematiche ridotte a sequenze incomprensibili: ogni documento sembra avere una geometria a sé. Docling nasce per affrontare questo problema in modo strutturale. Sviluppato da IBM Research e rilasciato come progetto open source alla fine del 2024, è una libreria Python pensata per convertire documenti complessi (non solo PDF, ma anche DOCX, PPTX, HTML, XLSX e immagini) in un formato coerente, pronto per essere ingerito da un LLM, da un sistema di ricerca semantica o da un knowledge graph.

    A differenza dei classici parser basati su euristiche o sul testo grezzo estratto da PyPDF2, Docling adotta un approccio multi-modello che combina rilevamento del layout, comprensione gerarchica delle tabelle e OCR opzionale per i documenti scannerizzati. Il risultato è un Markdown ordinato, una struttura JSON gerarchica oppure un grafo di blocchi, sempre con riferimenti ai bounding box originali. Per chi lavora a RAG, automatizza report o vuole portare la propria libreria personale dentro un assistente AI in locale, Docling è uno dei tasselli più interessanti emersi negli ultimi tempi.

    Perché IBM ha rilasciato Docling come open source

    Docling è il frutto del gruppo IBM Research Zurich, lo stesso che da anni si occupa di document understanding per i clienti enterprise della casa madre. Per molto tempo questa tecnologia è rimasta dietro il portale Watson, accessibile solo via API e a pagamento.

    La scelta di liberarne il cuore con licenza MIT, alla fine del 2024, va letta nel contesto della guerra in corso sui modelli aperti: senza una pipeline solida di preprocessing, anche il miglior LLM rimane limitato dalla qualità del testo che riceve in ingresso. A tal proposito, IBM ha rilasciato in parallelo i modelli specializzati su cui Docling si appoggia, distribuiti su Hugging Face e utilizzabili in totale autonomia. Inoltre, la libreria si integra in modo trasparente con LangChain, LlamaIndex, Haystack e diversi orchestratori agentici, riducendo l’attrito per chi adotta lo stack di fatto del momento.

    La differenza rispetto a librerie storiche come pdfplumber, pdfminer.six o PyMuPDF è netta. Quei tool restano ottimi per estrarre testo lineare, ma non comprendono la struttura logica del documento. Docling, invece, distingue intestazioni, paragrafi, didascalie, note a piè di pagina, tabelle multilivello e blocchi di codice. Di conseguenza, quando il documento viene chunkato per essere embeddato in un vector store, i confini semantici vengono rispettati e la retrieval ne beneficia in modo misurabile.

    I modelli che lavorano su Docling

    L’architettura di Docling si regge su due modelli specializzati, entrambi rilasciati pubblicamente. Il primo è un layout analyzer basato su una variante di RT-DETR addestrato su DocLayNet, il dataset interno IBM che copre 80.863 pagine annotate manualmente su sei categorie documentali (articoli scientifici, manuali, brevetti, bilanci, leggi e moduli amministrativi).

    DocLayNet è stato pensato proprio per coprire la varietà del mondo reale, con undici classi semantiche e una distribuzione bilanciata fra domini. Il secondo modello è TableFormer, una rete che ricostruisce la matrice logica delle tabelle, comprese quelle con celle unite, header su più righe e gerarchie complesse, proprio i casi in cui i tool tradizionali falliscono.

    Per chi vuole numeri di throughput, il Docling Technical Report misura su una RTX 3090 una media di 1,27 secondi per pagina in modalità fast e 3,7 secondi in modalità accurate. Su CPU (un Intel Xeon Platinum 8580) si scende a 5,4 secondi/pagina in fast e oltre 14 secondi in accurate. Su una RTX 4070 consumer, un documento di 30 pagine processato con pipeline completa (layout, tabelle, OCR disattivato) gira in circa 22-25 secondi, contro i 45-50 secondi della stessa pipeline su un MacBook Pro M3 Pro in modalità CPU-only. In tempo reale conviene la GPU, ma per lavori batch notturni anche un mini-PC diventa un’opzione valida.

    Sopra questi due modelli, Docling orchestra una pipeline modulare. Si possono attivare o disattivare OCR (EasyOCR e Tesseract sono entrambi supportati), classificazione delle figure, equazioni LaTeX, esportazione gerarchica e persino estrazione dei metadati. La possibilità di scegliere quali fasi caricare significa controllare esattamente VRAM, tempo di esecuzione e qualità del risultato. A partire dalla versione 2 è stato introdotto anche SmolDocling, un modello vision-language compatto da 256M parametri pensato per girare su hardware modesto, mentre su CPU i tempi salgono in modo sensibile, lasciando il flusso utilizzabile solo per archivi non in tempo reale.

    Integrarlo in una pipeline RAG senza riscrivere lo stack

    L’approccio più immediato è installare il pacchetto con pip install docling e ottenere subito un convertitore funzionante. Una manciata di righe basta per trasformare un PDF in Markdown, JSON o nel formato nativo DoclingDocument, che conserva struttura, posizioni e relazioni gerarchiche.

    from docling.document_converter import DocumentConverter
    
    converter = DocumentConverter()
    result = converter.convert("manuale_tecnico.pdf")
    print(result.document.export_to_markdown())

    Quando carichi un documento in un sistema RAG (recupero + LLM), devi spezzare il testo in pezzi più piccoli (chunk) per poterli cercare nel vector store. Il guaio è che se tagli il testo in modo ingenuo — ogni N caratteri, o ogni N parole — rischi di spezzare a metà un concetto, una tabella, un elenco puntato. Il chunk risultante non ha senso da solo.

    Docling capisce già la struttura del documento (titoli, paragrafi, tabelle, ecc.). HybridChunker sfrutta questa conoscenza per tagliare il testo nei punti giusti, cioè rispettando i confini logici: finisce un paragrafo → taglia lì, non nel mezzo.

    Fa anche due cose in più:

    • Controlla la lunghezza in token — non in caratteri, ma nei “pezzi” che l’LLM effettivamente legge — così il chunk non supera mai il limite del modello.
    • Aggiunge il contesto della sezione — se un chunk viene da un paragrafo sotto il titolo “Installazione > Requisiti”, questa informazione viene allegata al chunk. Così anche fuori contesto si capisce di cosa parla.

    Quando l’LLM riceve un chunk recuperato dal vector store, non gli arriva un pezzetto di testo strappato a caso dal mezzo di un documento. Gli arriva un blocco che ha senso da solo, con il titolo della sezione di appartenenza e i confini rispettati. Questo migliora molto la qualità delle risposte.

    Il lettore di base funziona, ma ti dà solo il testo. Se invece esporti il documento in formato JSON (con metadati), Docling ti restituisce molto di più (metadati): per ogni pezzo di testo sai a che pagina si trova, se è un titolo o un paragrafo o una tabella, a che livello gerarchico appartiene.

    Se usi LlamaIndex o LangChain per costruire un sistema RAG, di solito carichi i PDF con un lettore generico. Docling offre un suo lettore ufficiale (DoclingReader) che si sostituisce a quello standard con pochissimo codice — due righe, appunto.

    from llama_index.readers.docling import DoclingReader
    
    reader = DoclingReader()
    docs = reader.load_data(file_path="documento.pdf")

    Se invece vuoi l’export in JSON (per avere i metadati di cui parlavamo sopra):

    from llama_index.readers.docling import DoclingReader
    
    reader = DoclingReader(export_type=DoclingReader.ExportType.JSON)
    docs = reader.load_data(file_path="documento.pdf")

    E a questo punto, se aggiungi anche il DoclingNodeParser, LlamaIndex capisce la struttura Docling e crea i nodi già arricchiti con metadati come numero di pagina e bounding box:

    from llama_index.readers.docling import DoclingReader
    from llama_index.node_parser.docling import DoclingNodeParser
    
    reader = DoclingReader(export_type=DoclingReader.ExportType.JSON)
    node_parser = DoclingNodeParser()
    
    index = VectorStoreIndex.from_documents(
    documents=reader.load_data("documento.pdf"),
    transformations=[node_parser],
    )

    Senza filtering, il vector store recupera i chunk più simili semanticamente, ma magari prende roba sparsa e poco pertinente. Con il filtering arrivi al contesto giusto con più precisione, e l’LLM risponde meglio perché riceve informazioni più mirate. In breve: l’integrazione base ti fa risparmiare tempo, ma i metadati personalizzati ti faranno guadagnare qualità nelle risposte.

    Docling alla prova: end-to-end con 500 paper, Qdrant e Ollama

    Per capire come si comporta lo stack messo davvero alla prova, vale la pena ricostruire un flusso end-to-end su un caso plausibile, ovvero un ricercatore che vuole interrogare in linguaggio naturale una libreria di 500 paper scientifici in PDF. Il setup è minimale, con una macchina dotata di RTX 4070 (12 GB), 32 GB di RAM, Ollama per l’inferenza locale, Qdrant come vector store e un piccolo script che orchestra il tutto.

    La pipeline di ingest si divide in tre fasi. Nella prima, Docling viene fatto girare sull’intero corpus con modalità accurate attivata e OCR disattivato (i paper sono digitali nativi). Il tempo medio è di circa 2,8 secondi per pagina su GPU, quindi su una media di 12 pagine per paper si ottiene un throughput totale di circa cinque ore per l’intero archivio. È un batch che gira tranquillamente in una notte senza supervisione.

    Nella seconda fase entra in gioco l’HybridChunker, configurato sul tokenizer di BAAI/bge-m3, un embedding model multilingue da 567M parametri che gira bene sulla stessa GPU. Ogni paper produce in media 45 chunk semanticamente coerenti, per un totale di circa 22.500 vettori generati a una velocità di 160 chunk/secondo in batch da 32. I metadati salvati includono titolo del paper, sezione, numero pagina e bounding box, informazioni preziose per filtri mirati e per fornire citazioni esatte all’LLM.

    Nella terza fase, Qdrant viene avviato in container con storage su SSD NVMe e configurato con indice HNSW. L’intero database, comprese le payload, occupa circa 180 MB su disco, una dimensione gestibile anche su una macchina modesta. La fase di query usa Qwen3.6-35b-a3b servito da Ollama o LMStudio, che con offload parziale su CPU produce risposte in circa 12 secondi per una domanda complessa, oppure Qwen2.5 14B completamente su GPU per latenze sotto i 6 secondi.

    Il risultato pratico è una knowledge base personale completamente locale, capace di rispondere a domande del tipo “quali paper degli ultimi due anni discutono di sparse attention?“, citando direttamente sezione e pagina. Il costo marginale è zero, la privacy assoluta, e l’intera pipeline può essere ricostruita su una macchina secondaria in poche ore.

    Limiti reali e alternative da conoscere

    Sarebbe scorretto presentare Docling come una soluzione universale. La libreria ha ancora qualche fragilità sui documenti con formattazione molto creativa (riviste, magazine, layout editoriali multicolonna con riquadri sovrapposti), dove l’analisi del layout fa fatica a stabilire l’ordine di lettura. Su scansioni di pessima qualità, il risultato dell’OCR resta vincolato a EasyOCR o Tesseract, e nessuno dei due raggiunge la qualità dei modelli proprietari di Google Document AI o Azure Document Intelligence.

    Marker, sviluppato da Vik Paruchuri, è probabilmente il principale concorrente diretto, perché privilegia velocità ed eleganza dell’output Markdown ed eccelle su paper accademici. MinerU, progetto cinese basato su PDF-Extract-Kit, ha un approccio simile a Docling ma con modelli più pesanti e qualità superiore su tabelle e formule. Per casi più semplici, infine, unstructured.io rimane una scelta valida come orchestratore generale.

    La scelta dipende da cosa stai costruendo. Se ti serve un parser che funzioni out of the box su un parco documenti eterogeneo, gestisca DOCX, PPTX e HTML oltre ai PDF, e si integri senza attrito nel tuo stack RAG, Docling è oggi il punto di equilibrio migliore. Se invece il tuo dominio è ristretto e omogeneo, potresti trovare in Marker o MinerU una qualità superiore. Conviene sempre testare su una decina di documenti campione del tuo corpus prima di committare l’intera pipeline.

    Un tassello che cambia la qualità del tuo stack AI locale

    Se hai una libreria di paper, manuali, schede tecniche o bilanci, puoi costruire un knowledge base privato e interrogabile in linguaggio naturale, abbinando Docling a un’istanza locale di Ollama o LM Studio. Poi se devi automatizzare report aziendali, puoi trasformare il flusso PDF verso dati strutturati in qualcosa di affidabile, senza la fragilità delle regex sul testo estratto. Infine se gestisci documenti per un team, puoi alimentare un sistema di ricerca semantica che restituisce risposte ancorate al documento originale, con tanto di citazione della pagina e del blocco.

    Il consiglio è di trattarlo come qualunque altro strumento, dedicandogli mezza giornata di sperimentazione, costruendo una piccola pipeline di valutazione sui tuoi documenti , e confrontando i chunk prodotti con quelli del tuo workflow attuale. È probabile che non tornerai indietro. In uno stack AI personale, Docling non è la stella, ma è uno di quei tasselli silenziosi che spostano la qualità complessiva di parecchi punti percentuali.

    docling ollama parsing pdf qdrant rag
    Previous ArticleGoogle blocca il primo zero-day generato da un LLM
    Next Article Daybreak: l’AI di OpenAI per la cybersecurity
    Avatar photo
    Graziano
    • Website

    Ho visto l'informatica nascere con il C64 e oggi seguo con lo stesso entusiasmo l'evoluzione verso mini PC e desktop SFF. Fuori dal lavoro, le mie passioni sono i film, il trekking, la bici e la corsa. Ma non disdegno una sessione di gaming o programmazione!

    Articoli collegati

    Mistral OCR 4
    Intelligenza artificiale

    Mistral OCR 4 trasforma il riconoscimento documenti in una mappa strutturata

    25/06/202627 Views
    Software

    FSR 4 arriva sulla nuova Steam Machine passando da Proton

    25/06/2026
    Strudel
    Software

    Strudel: il live coding della musica

    24/06/2026
    Add A Comment
    Leave A Reply Cancel Reply

    Ultimi articoli
    Colorful floating Office app icons (Word, Excel, PowerPoint, Outlook) on a light blue background.

    Windows 10 ancora protetto e gratis fino a ottobre 2027

    26/06/2026
    Microsoft 365

    Microsoft 365: l’Antitrust indaga sul rincaro di Copilot

    26/06/2026
    Voidwrought

    Voidwrought: esplorazione, combattimento e poteri divini

    25/06/202616 Views
    Mistral OCR 4

    Mistral OCR 4 trasforma il riconoscimento documenti in una mappa strutturata

    25/06/202627 Views

    FSR 4 arriva sulla nuova Steam Machine passando da Proton

    25/06/2026
    Strudel

    Strudel: il live coding della musica

    24/06/2026
    Gomoot : tecnologia e lifestyle
    X (Twitter) Bluesky WhatsApp Threads Mastodon
    • Home
    • Tech
    • Mobiles
    • Contatti
    • Privacy
    • ABOUT
    © 2026 GOMOOT.COM

    Type above and press Enter to search. Press Esc to cancel.