Vai al contenuto
Metadati documento

Estrai i metadati nascosti di un file PDF

Visualizza i metadati incorporati in un PDF: titolo, autore, oggetto e parole chiave, il software che lo ha creato e prodotto, le date di creazione e modifica, la versione del formato, il numero di pagine e se il file è cifrato. Sono informazioni che spesso rivelano più di quanto si pensi su chi e con cosa ha generato il documento. Il PDF viene letto nel browser: non viene caricato su alcun server.

Trascina un PDF qui o clicca per sceglierlo
Solo file PDF. Il documento resta nel browser.

Come leggere i metadati di un PDF

  1. 1

    Carica il PDF

    Trascina il file nell'area di rilascio o clicca per selezionarlo. Sono accettati solo file PDF; il documento viene letto in binario nel browser.

  2. 2

    Leggi le proprietà del documento

    Vedi titolo, autore, oggetto e parole chiave: i campi che l'autore (o il software) ha compilato. Spesso il titolo o l'autore svelano il nome reale del file o della persona.

  3. 3

    Controlla software e date

    Creator e Producer indicano con quali programmi è stato scritto e generato il PDF; le date di creazione e modifica raccontano la sua cronologia. Sono indizi utili per analisi e verifica.

  4. 4

    Valuta gli aspetti tecnici

    Versione del formato, numero di pagine stimato, cifratura e ottimizzazione web completano il quadro. Copia il riepilogo se ti serve per documentazione.

Cosa contengono i metadati di un PDF

Un file PDF non è solo la pagina che vedi: contiene una struttura di oggetti e, di norma, un dizionario informazioni (il cosiddetto /Info) con i metadati del documento. Questo strumento legge il file in binario e ne estrae i campi standard: Title, Author, Subject, Keywords, Creator (l'applicazione con cui è stato creato il contenuto) e Producer (la libreria o il software che ha generato il PDF finale), oltre alle date di creazione e modifica nel formato PDF D:AAAAMMGGhhmmss.

Questi dati sono spesso più rivelatori di quanto l'autore immagini. Il Producer dice quale libreria ha prodotto il file (e quindi quale flusso di lavoro, quale versione, a volte quale sistema operativo); l'Author può contenere un nome reale anche quando il contenuto è anonimo; le date possono contraddire la storia ufficiale del documento. Per questo i metadati PDF sono un classico punto di partenza nelle analisi tecniche e nelle verifiche, ma anche un rischio di privacy quando si pubblica un documento senza ripulirlo.

Lo strumento stima anche dati tecnici: la versione del formato dall'intestazione %PDF-1.x, una stima del numero di pagine contando gli oggetti pagina, la presenza di cifratura (un dizionario /Encrypt) e se il PDF è linearizzato per il caricamento progressivo sul web. La lettura è basata sul parsing dei marcatori del formato, quindi è robusta per la maggior parte dei PDF ma resta una stima per i file molto complessi o con stream compressi. Tutto avviene nel browser: il documento non viene mai inviato a un server.

Glossario

Termini tecnici usati in questa pagina, spiegati in due righe.

Dizionario /Info #
La sezione del PDF che raccoglie i metadati del documento: titolo, autore, oggetto, parole chiave, software, date. È la fonte principale letta da questo strumento.
Creator #
L'applicazione con cui è stato creato il contenuto originale (es. un word processor o un programma di grafica) prima della conversione in PDF.
Producer #
La libreria o il software che ha generato il file PDF finale. Spesso rivela versione e ambiente del flusso di produzione del documento.
Data PDF (D:...) #
Formato delle date nei PDF: D: seguito da anno, mese, giorno, ora, minuti, secondi ed eventuale fuso. Lo strumento la converte in forma leggibile.
Linearizzazione #
Riorganizzazione del PDF (Fast Web View) che permette di mostrare la prima pagina prima di aver scaricato tutto il file. Indica un'ottimizzazione per il web.
/Encrypt #
Dizionario che segnala che il PDF è cifrato, con password di apertura o restrizioni (stampa, copia). La sua presenza indica un documento protetto.

Domande frequenti sui metadati PDF

Il mio PDF viene caricato su un server?
No. Il file viene letto in binario nel browser e i metadati vengono estratti localmente. Il documento non lascia il dispositivo e non viene inviato da nessuna parte. Puoi verificarlo nella scheda Rete degli strumenti per sviluppatori, oppure usare il tool offline.
Perché alcuni PDF non mostrano metadati?
Perché non tutti li includono: scansioni grezze, file generati da strumenti minimali o documenti volutamente ripuliti possono non avere il dizionario informazioni. In quel caso vengono mostrati solo i dati tecnici ricavabili dalla struttura (versione, pagine, cifratura).
Il numero di pagine è sempre esatto?
È una stima robusta ma non garantita. Viene ricavata contando gli oggetti pagina nel file. Per PDF con strutture insolite o oggetti compressi in stream, il valore può differire da quello reale. Per un conteggio certo, apri il documento in un lettore PDF.
Cosa rivela il campo Producer sulla mia privacy?
Indica con quale software e versione è stato generato il PDF, e a volte lascia intuire il sistema o il flusso di lavoro usato. Insieme ad Author e alle date, è una delle informazioni che conviene controllare e, se necessario, rimuovere prima di pubblicare un documento.
Lo strumento può rimuovere i metadati?
No, li legge soltanto. Per rimuoverli servono strumenti che riscrivono il PDF (molti software di modifica PDF hanno una funzione di pulizia metadati, oppure si può ristampare il documento come nuovo PDF). Questo tool serve a vedere cosa il file sta rivelando.
Funziona con PDF cifrati o protetti da password?
Rileva la presenza di cifratura e te la segnala, ma se il PDF è protetto da password di apertura, i metadati testuali potrebbero essere cifrati e non leggibili senza la password. La struttura tecnica resta in genere ispezionabile.
Legge anche i metadati XMP?
Lo strumento si concentra sul dizionario informazioni standard, che copre il caso d'uso più comune. Alcuni PDF includono anche metadati XMP (un blocco XML); il parsing completo dell'XMP non è l'obiettivo di questo strumento, pensato per una lettura rapida e leggibile.

Chi sviluppa questi strumenti?

Maurizio Fonte, consulente IT senior con oltre 20 anni di esperienza in PHP, Laravel, infrastrutture Linux, cybersecurity e integrazione AI/LLM in azienda. Backend di produzione, modernizzazione di codice legacy, audit di sicurezza, agenti AI e MCP server custom: il lavoro che sta dietro a questi strumenti.

Conosci Maurizio Fonte