Mercoledì, 31 Ottobre 2012

La Camera dei deputati nel web of data

Giovanni Bruno
Sezione Nel web

A dicembre del 2011, nell’ambito delle iniziative per il 150° Anniversario dell’Unità d’Italia, la Camera dei deputati ha pubblicato il proprio “Portale storico” (http://storia.camera.it) – che dà accesso a documenti e informazioni   su deputati,  leggi, lavori parlamentari  dalla I Legislatura del Parlamento sabaudo del 1848 alla XV legislatura della Repubblica (2008) -  e  il sito dati.camera.it, l’archivio digitale in formato aperto realizzato secondo gli  standards  del Semantic Web e i principi dei Linked Data per  permettere l’accesso,  il download e il riuso di tutti i dati pubblicati (oltre un milione di schede e documenti). Nello scorso mese di settembre i progetti  realizzati e i progetti in corso sui Linked Open Data alla Camera sono stati presentati alla World e-Parliament Conference 2012, la conferenza mondiale su attività  parlamentari e nuove tecnologie, organizzata dalle Nazioni unite, l'Unione interparlamentare attraverso il Global Centre for ICT in Parliament, nella sessione del 13 settembre  "Benefits and values of open data for fostering greater transparency in legislatures": un video (consultabile all’indirizzo web http://dati.camera.it/it/video/World-e-Parliament-Conference-2012-session-A4.html) illustra  ragioni, caratteristiche, risultati e sviluppi di questa iniziativa,  che segna  una tappa importantissima nel cammino dell'Italia verso l’Open Governement

Alla base del progetto, al quale regesta.exe ha partecipato fin dalla sua ideazione, è stata  posta un’ontologia relativa all’intero dominio Camera con l’obiettivo di descriverne il funzionamento nel tempo e di garantirne l’aggiornamento continuo con i dati e i documenti prodotti nel corso della normale attività degli organismi parlamentari. Per rappresentare esplicitamente significato e semantica degli “oggetti” presenti nello specifico dominio informativo  e le relazioni tra gli stessi l’Ontologia della Camera dei deputati (ODC) è stata scritta usando lo standard OWL, un linguaggio per pubblicare e condividere ontologie promosso dal W3C.

Nel 2012 La Camera ha proseguito il suo impegno sui Linked Open Data, avviando l’estensione dell’ontologia Camera alla descrizione dell’iter legislativo nella sua interezza: ai semplici metadati sui disegni di legge (data, firmatario, titolo) sono quindi state aggiunte le classi e le proprietà necessarie a descrivere tutti gli eventi legati al processo di formazione delle leggi, assegnazioni, dibatti in commissione e in aula, modifiche ai testi, votazioni e navette. Con la disponibilità di queste nuove risorse informative, relative sia alla documentazione ormai consolidata che al complesso della quotidiana attività legislativa, si intende non solo garantire una più ampia trasparenza dei lavori degli organismi parlamentari, ma anche favorire il tempestivo riuso di queste informazioni da parte di utilizzatori esterni (ad esempio, data journalism, organizzazioni di Parliamentary Monitoring). L’obiettivo finale è rendere tutte le risorse informative prodotte pienamente disponibili e interoperabili nel nuovo Web of Data.

Con questa espressione viene individuata l’attuale linea di evoluzione dal Web dei documenti - che condivide attraverso la rete pagine, parole e link - ad un Web semantico, alimentato da dati e metadati strutturati, in grado di veicolare in un formato standard e machine-readable, i contenuti con tutto il necessario corredo di informazioni di significato e di contesto, in modo da consentire una piena comprensione e riutilizzo da applicazioni distribuite[1]. Si tratta di una trasformazione di grande portata, in cui l’aspetto predominante non è quello prettamente tecnologico: proseguendo una tendenza avviata ormai da tempo, i gestori delle informazioni si riappropriano, attraverso la modellizzazione dei processi, di quelle funzioni di mediazione “culturale” delle informazioni veicolate sulla rete fino ad ora demandata soltanto agli strumenti tecnologici (banche dati, siti web, ecc.).

I vantaggi di un approccio del genere sono apparsi, fin dall’inizio, particolarmente utili anche per la gestione dell’attività di documentazione interna. Piuttosto che far interagire diverse applicazioni gestionali e specialistiche grazie a complicati sistemi di comunicazione tra software differenti, l’interoperabilità dei dati è garantita da una comune sintassi descrittiva (RDF), in grado di favorire l’immediata condivisione delle informazioni anche entro strutture complesse, come il Servizio Studi della Camera. Da queste premesse ha preso avvio un nuovo progetto, denominato PAD -  Piattaforme Aperte di Documentazione -  un ambiente integrato per una completa automazione delle attività di documentazione del Servizio Studi e degli altri servizi di documentazione della Camera, dalla gestione degli archivi fino alla produzione dei documenti. Anche questa iniziativa è stata presentata  per la prima volta  in occasione della World eParliament Conference 2012.

Interamente sviluppato con tecnologie e componenti Open Source per la gestione di documenti digitali in formato RDF, PAD è articolato in tre aree funzionali. La piattaforma integra un ambiente completo per la raccolta di documenti e materiali digitali provenienti da fonti eterogenee, sia interne che esterne alla Camera, e per la gestione condivisa degli archivi; offre una serie di strumenti per la categorizzazione dei documenti, utilizzando diversi sistemi di classificazione codificati secondo lo standard SKOS, e per il loro arricchimento informativo; rende disponibili servizi evoluti di web editing per la redazione di contenuti e la la produzione partecipata di molteplici prodotti editoriali, come note e Newsletter per le Commissioni, Dossier legislativi, ecc. PAD permette  la redazione condivisa di contenuti, attraverso  l’assegnazione di  responsabilità all’autore di una scheda  e, contestualmente,  la possibilità di assemblare in un documento complesso  i diversi articoli redatti e presenti in archivio.  In ogni fase del processo di redazione sono disponibili tutte le informazioni archiviate, per referenziarle e linkarle all’interno del nuovo documento. Sono, infine, disponibili specifici strumenti per la preparazione della versione finale del documento prodotto, erogabile attraverso una serie di canali di pubblicazione e distribuzione in formato html, PDF, RDF, eBook.

Per l’intero sviluppo applicativo di PAD regesta.exe ha utilizzato una sua nuova piattaforma software di produzione, gestione e annotazione semantica, frutto di un’attività di ricerca e sviluppo tuttora in corso per sfruttare le potenzialità delle tecnologie Linked Data.



[1] C.Bizer, T.Heath, T. Berners-Lee, Linked Data – The story so far, in “International Journal on Semantic Web and Information Systems”, vol. 5 – 2009, ISSUE 3 – Special issue on Linked Data, disponibile anche su http:// tomheath.com/papers/bizer-heath-berners-lee-ijswis-linked-data.pdf.

Devi effettuare il login per inviare commenti