Verificare che un file PDF/A sia conforme

Come fare per verificare prima dell’invio alla pubblica amministrazione o al registro imprese che un documento PDF è conforme allo standard PDF/A ?

Non è facile trovare strumenti di cui fidarsi. In passato esisteva in Webtelemaco un servizio gratuito per la verifica di conformità PDF/A, ma con la nuova versione del sistema è stato dismesso.

Come noto la pubblica amministrazione deve usare il formato PDF/A per l’archiviazione a lungo termine di documenti, ad esempio le partiche Telemaco / COMunica inviate al registro imprese della camera di commercio lo richiedono. In una guida INFOCAMERE “Indicazioni per la formazione e verifica del formato PDF/A nei documenti R.I." un po’ vecchiotta ma ben fatta leggiamo:

PDF/A è uno standard internazionale (ISO19005), sottoinsieme dello standard PDF, appositamente pensato per l’archiviazione nel lungo periodo di documenti elettronici. Garantisce che il documento sia visualizzabile sempre allo stesso modo, anche a distanza di tempo e con programmi software diversi.

Lo standard PDF/A è suddiviso in due parti: PDF/A-1 e PDF/A-2.
Il PDF/A-1, l’unico ad oggi approvato, è suddiviso a sua volta in due livelli:

  • PDF/A-1a= massimo richiesto dallo standard
  • PDF/A-1b= minimo richiesto dallo standard (incluso nel PDF/A-1a).

Produrre files conformi a questo standard non è un problema, vedi ad esempio questa ottima guida di Salvatore Aranzulla. In pratica LibreOffice se richiesto può produrre files PDF/A-1a, che è addirittura più stringente di quello (PDF/A-1b) che richiede INFOCAMERE.

Dal 2015 è in fase di sviluppo un nuovo strumento open source di validazione PDF/A, veraPDF, finanziato anche da fondi europei provienienti dal progetto FP7-ICT PREFORMA (PREservation FORMAts for culture information/e-archives).

Non ostante sia ancora in beta e non ben documentato, mi sembra usabile.

Questo è quello che ho fatto per installarlo come utente non privilegiato su Debian 9 (stretch) a 64 bit: ho scaricato veraPDF for Linux dalla dalla pagina di download, poi ho creato una directory d’installazione e ho lancato lo script verapdf-install:

sudo mkdir -p /opt/verapdf
sudo chown utente:utente /opt/verapdf
cd ~/Scaricati
unzip verapdf-installer.zip
cd verapdf-1.6.3
./verapdf-install

parte l’installer grafico, a cui ho dato il percorso creato sopra (/opt/verapdf) come destinazione dell’installazione.

Per validare un file a questo punto do’ il comando: /opt/verapdf/verapdf -f 1a /home/utente/documento.pdf che mi restituisce un file XML (wow!) che contiene tra l’altro una chiave validationReport:

...
<validationReport profileName="PDF/A-1A validation profile" statement="PDF file is compliant with Validation Profile requirements." isCompliant="true">
  <details passedRules="107" failedRules="0" passedChecks="12172" failedChecks="0"></details>
</validationReport>
...

Per chi lo preferisce, c’è anche un’interfaccia utente, deliziosamente anni ‘90 nel suo look Java-escque, si può avviare con: /opt/verapdf/verapdf-gui: