I metadati: cosa sono?

Il passaggio alla produzione documentaria digitale ha imposto l’adozione di specifici strumenti e la soddisfazione di requisiti necessari per governare la formazione, la gestione, la tenuta e la conservazione dei documenti.

Fra di essi molto importante è l’utilizzo dei cosiddetti metadati, termine in uso nel linguaggio informatico per definire un insieme di informazioni sui dati.

Essi sono spesso definiti anche come “dati sui dati”. Il termine deriva dall’inglese metadata, che trae origine dal prefisso meta- (dalla preposizione greca metà “al di sopra”) e dal plurale neutro latino data ossia “i dati”.

Nell’ambito degli archivi digitali i metadati sono le informazioni di cui bisogna dotare il documento informatico1 per poterlo correttamente formare, gestire e conservare nel tempo2.

Il documento informatico è infatti privo della componente materiale costituita dalla carta ed è memorizzato in sistemi che contengono moltissimi oggetti digitali; per poter essere conservato, reso accessibile nel tempo, e per poter essere correttamente inserito nel suo contesto, deve essere posto in relazione ad un insieme di informazioni che lo descrivano a vari livelli3.

I metadati più basilari sono il formato e il nome del file, le specifiche tecniche sulla versione del software e sul hardware, le date di creazione, di accesso e di ultima modifica, l’autore; quelli più complessi la descrizione, l’oggetto, i termini di rilascio, accesso e uso, ecc.

La normativa italiana prevede alcuni metadati minimi che devono essere associati al documento informatico:

  • Identificativo
  • Data di chiusura
  • Oggetto
  • Soggetto produttore
  • Destinatario4.

Tali elementi servono per attribuire al documento un’identità ben precisa. Si capisce quindi perché viene ritenuta cruciale la fase di formazione dellarchivio per la corretta tenuta e conservazione della documentazione digitale.

Il documento però una volta formato avrà un suo percorso di esistenza che lo porterà ad essere gestito da diversi sistemi e applicazioni con la contestuale produzione e associazione di ulteriori informazioni. Un altro aspetto da tenere in considerazione, dunque, è che i metadati non vengono attribuiti ai documenti e in generale agli oggetti digitali tutti nel medesimo tempo, ma tendono ad accumularsi nel corso della vita degli stessi per tracciarne l’utilizzo, ad esempio gli accessi, le modifiche, i trasferimenti, le copie, nonché le modalità della sua conservazione.

Si comprende quindi che i metadati sono dati che descrivono il contenuto, la struttura e il contesto dei documenti e la loro gestione nel tempo.

La centralità di tali “dati” nell’ambito della gestione delle risorse informative digitali ha portato la comunità scientifica internazionale ad elaborare una serie di standard5 e a giungere a una distinzione di massima dei metadati in tre grandi categorie:

  • metadati descrittivi,
  • metadati amministrativi e gestionali,
  • metadati strutturali.

I primi sono funzionali all’identificazione e al recupero dei documenti stessi e sono costituiti da descrizioni normalizzate; i secondi sono utili alla loro gestione all’interno dell’archivio e comprendono quindi anche informazioni di natura tecnica (ad. es. quelle sui formati, le procedure di creazione, l’ambiente tecnologico); la terza categoria comprende le informazioni necessarie a descrivere l’articolazione interna e le relazioni fra le parti che compongono gli oggetti digitali6.

Queste brevi considerazioni consentono di comprendere come i metadati costituiscano  una parte fondamentale di un archivio digitale, un ambiente nel quale le collocazioni logiche hanno più rilevanza di quelle fisiche e il legame fra i documenti e le informazioni su di essi è di conseguenza inscindibile.

[1]Per semplicità ci si riferisce qui unicamente al documento, ma i metadati devono essere associati a tutti i livelli di aggregazione presenti in un archivio.

[2]Le regole tecniche in materia di formazione, trasmissione, copia, duplicazione, riproduzione e validazione temporale dei documenti informatici contenute nel DPCM 13 novembre 2014 propongono la seguente definizione: “insieme di dati associati a un documento informatico, o a un fascicolo informatico, o ad un’aggregazione documentale informatica per identificarlo e descriverne il contesto, il contenuto e la struttura, nonché per permetterne la gestione nel tempo nel sistema di conservazione” (allegato 1).

[3]I metadati possono essere statici o dinamici, inclusi negli oggetti digitali (embedded) oppure collegati ad essi in maniera stabile.

[4]Allegato 5 al DPCM 3 dicembre 2013 contenente le regole tecniche in materia di sistema di conservazione e al DPCM 13 novembre 2014. Per l’insieme minimo dei metadati che identificano il documento amministrativo informatico si fa invece ancora riferimento a quanto indicato agli articoli 9 e 19 del DPCM 31 ottobre 2000 recanti le precedenti regole tecniche per il protocollo informatico.

[5]Fra tutti si cita la famiglia di norme ISO 23081 dedicata ai metadati per la gestione documentale.

[6]Si fa qui riferimento a macro categorie molto generali che non tengono conto di alcuni tipi di metadati attinenti ad ambiti più specifici, ad es. quelli per la gestione dei diritti di proprietà intellettuale, per le informazioni personali, per la conservazione a lungo termine, ecc.