Domenica, 13 Gennaio 2013

I linked open data per i beni culturali: il catalogo worldcata in Linked Open Data

RUBRICA di Silvia Mazzini
Sezione Primo piano

Aprire il nuovo anno con una nuova rubrica dedicata alle tecnologie Linekd Data per i beni culturali è una bella scommessa, ma senza nuovi obiettivi non si cresce mentre “il mondo degli archivi” vuole crescere!

Da archivista esperta in semantic web, da tempo auspico che il mondo dei beni culturali  (archivisti, bibliotecari, operatori museali, ricercatori, e tutti coloro che si occupano di preservazione e promozione del nostro patrimonio culturale) faccia un passo deciso verso le tecnologie informatiche,  utilizzate ormai quotidianamente nel lavoro di conservazione e valorizzazione del patrimonio. Basti pensare a quanto è  cambiato il lavoro di tutti noi da 20 anni a questa parte: la schedatura e la catalogazione avviene solo con strumenti informatici e spesso si utilizzano standard informatici specifici per la codifica delle informazioni (si veda EAD, EAC-CP, XML-MARC); la consultazione stessa avviene quasi esclusivamente su cataloghi informatici che sono sempre più evoluti (meta-opac, sistemi a faccette e filtri); la valorizzazione del patrimonio culturale avviene attraverso il web;  per finire oggi si parla spesso di interoperabilità tra sistemi informativi  la cui realizzazione è possibile solo con una conoscenza analitica degli standard alla base dei metadati descrittivi delle risorse.

E’ dunque importante approfondire questi aspetti, per diventare interlocutori esigenti e competenti degli informatici che sviluppano e realizzano le soluzioni software: solo conoscendo cosa si può fare con questi strumenti  si possono offrire servizi più efficienti e migliorare i sistemi di integrazione tra i diversi portali culturali.

Questa rubrica è uno spazio nuovo dove approfondiremo periodicamente qualche aspetto tecnologico legato al mondo dei beni culturali: si farà riferimento a standard nazionali e internazionali, a progetti innovativi e soprattutto alle tecnologie dei Linked Open Data come strumento essenziale per favorire la valorizzazione, la fruizione e la gestione del patrimonio culturale sulla rete.

Seguendo una strategia “bottom-up”, ovvero entrando di volta in volta direttamente nell’argomento e facendo digressioni se necessario, sono benvenute domande, riflessioni e richieste di approfondimento di temi specifici che vogliate propormi.

Ed ora buona lettura!

Il catalogo worldcata in Linked Open Data

Da poco più di sei mesi l’OCLC (Online Computer Library Center, una rete internazionale di biblioteche), ha pubblicato 250 milioni di record del catalogo WorldCat delle risorse bibliografiche in formato LOD usando ontologie standard (come schema.org) e creandone una specifica per le biblioteche.

Il progetto dell’OCLC non è il primo esempio di apertura di dati bibliografici al mondo del web of data: numerose sono gli istituti che da diverso tempo implementano queste tecnologie per il patrimonio bibliografico. Questa tipologia di risorse culturali, essendo più “data-centric” rispetto a quelle di tipo archivistico ad esempio, sono più facilmente riconducibili a modelli atomici come quelli utilizzati nei Linked Data e  la loro trasformazione in “triple” è molto più naturale. Mi soffermo brevemente sul concetto di tripla: il passaggio alle “triple” o “triplification” è la trasformazione dei metadati relativi ad una risorsa ad una serie di asserzioni molto semplici basate sulla unione di soggetto, predicato e oggetto. Così un record bibliografico di un libro avrà delle triple di questo tipo:

 prima tripla) record1234 è libro;

seconda tripla) record1234 ha_titolo “Weaving the web: : the original design and ultimate destiny of the World Wide Web by its inventor

terza tripla) record1234 ha_autore Tim Berners-Lee;

quarta tripla) record1234 ha_data_pubbl 1999

e così via. La cosa che più salta all’occhio in questa rappresentazione è la prolissità ma è proprio questo che consente la costruzione di un grafo di informazioni collegate; si immagini un insieme di sfere collegate da archi dove le sfere rappresentano le “cose” mentre gli archi le “proprietà”. Il Final Report del gruppo di lavoro del W3C sui Library Linked Data pubblicato nell’ottobre 2011, documento che consiglio a vivamente di leggere, elenca tra i vantaggi del passaggio ai Linked Data per le risorse bibliografiche il risparmio di tempo per i catalogatori  -  che non devono schedare cose già presenti sul web potendo  riusare parti di schedature (solo alcune triple) -  e il miglioramento nell’esito di ricerca per i fruitori dei cataloghi.

Tornando ai Linked Data dell’OCLC, la convinzione alla base del progetto descritto nel sito è che “Making WorldCat.org available to programs as well as humans means that services can process library data and make more effective connections between it and other Web resources.”

 I linked data sono stati integrati nella pagine delle singole risorse in un apposito tab che mostra gli stessi dati catalografici in modo conforme alle ontologie specificate (dedicheremo un altro appuntamento alle ontologie utilizzate nell’ambito dei beni culturali).

In questo modo nella stessa scheda di pubblicazione del catalogo è possibile visualizzare i collegamenti con altre risorse esterne  già esposte sul web con gli stessi principi come  viaf, il Virtual International Authority File e il sistema di classificazione decimale Dewey  alimentando così la cosiddetta linked data cloud, la nuvola dei dati collegati esposti sul web.

Devi effettuare il login per inviare commenti