Introduzione
L'idea di un polo di istituti culturali a Napoli nasce nel luglio 2013, quando l'Istituto Italiano per gli Studi Storici, il Pio Monte della Misericordia, la Società Napoletana di Storia Patria e la Fondazione Biblioteca Benedetto Croce decidono di cooperare - nell'ambito delle misure adottate dalla Regione Campania e destinate alla digitalizzazione di archivi e biblioteche - unendo i fondi europei destinati all'acquisto delle attrezzature tecnologiche previste dal bando “Digitalizzazione e messa in rete di archivi e biblioteche pubblici e privati”. Al nucleo originario si affianca nel dicembre dello stesso anno la Cappella del Tesoro di San Gennaro.
I vantaggi della cooperazione
In primo luogo l'accumulo di risorse economiche, dovuto al contributo che ciascun istituito ha deciso di mettere a fattor comune, ha determinato la disponibilità di budget che ci ha consentito di progettare il sistema di gestione del patrimonio;
La creazione del Polo ci ha consentito – sia grazie al prestigio delle istituzioni coinvolte sia grazie alla massa critica delle risorse potenziali – di richiedere la collaborazione dell’ICCU (Istituto Centrale per il Catalogo Unico delle Biblioteche italiane) nella fase di sviluppo di alcune delle componenti più innovative del software gestionale. Tale collaborazione è finalizzata al rilascio di una piattaforma opensource, gratuitamente disponibile, che consentirà alle istituzioni della cultura di gestire l’intero ciclo di produzione e gestione del digitale finalizzato all’erogazione dei servizi destinati alla comunità dei propri utenti.
I numeri
Sono circa 600.000 le pagine digitalizzate:
200.000 file/pagine di testi a stampa antichi;
330.000 file/pagine d’archivio di documentazione moderna e contemporanea;
70.000 file di materiale grafico, manoscritti e materiale non librario.
Il processo di scansione (in service) prevede l’uso di scanner planetari a sensore d’area (per materiale di dimensioni ridotte) e scanner piano con sensore lineare (per i grandi formati).
I file prodotti dalla scansione ottica sono per lo più finalizzati ad offrire “copie per immagine” del bene; solo in taluni casi, tale processo è il primo passo verso la creazione di una vera edizione digitale dell’opera, attraverso l’estrazione automatica di testo ed entità significative.
Gli standard di digitalizzazione
I file vengono generati in formato TIFF non compresso a 300 ppi per tutti i documenti pari o superiori ad A3, a 400 ppi per quelli inferiori ad A3, con profondità colore di 24 bit RGB; quando le dimensioni o il particolare tipo di materiale (per esempio disegni o fotografie) lo richiedano si prevede di arrivare a valori di campionamento molto più elevati. Questi costituiscono la copia master per l’archiviazione e la conservazione. La conservazione degli oggetti è affidata a un servizio cloud di storage management che garantirà l’integrità dei file e consentirà, interfacciandosi con il sistema di gestione, di avviare servizi di delivery anche su tali formati.
I file derivati sono JPG con valori di campionamento che dipendono dal uso: la piena risoluzione è destinata alla consultazione interna e alla vendita attraverso il sistema di e-commerce integrato nella piattaforma; i sotto-campionali (in media 150 ppi) saranno visibili on-line ed esposti tramite tramite OAI verso gli aggregatori.
Il sistema di gestione dei dati
L’architettura generale del sistema, come riportata nell'immagine di apertura, da un punto di vista funzionale, è piuttosto complessa e prevede la presenza di numerosi moduli che interagiscono tra di loro al fine di erogare i servizi necessari a supportare i complessi processi di lavoro finalizzati alla digitalizzazione, conservazione e divulgazione di beni culturali documentali e museali.
I modelli dei dati
Il sistema di gestione dei dati prevede diversi moduli di catalogazione e descrizione dei materiali.
Un modulo di descrizione archivistica basata sullo standard ISAD (G) e la sua codifica XML EAD che rende le descrizioni prodotte con tali sistemi indipendenti dalla particolare architettura software implementata, consentendone agevolmente l’esportazione verso altri sistemi che adottino tale standard per l’interscambio dei dati. In generale ogni modulo del sistema di gestione del Polo è basato su uno standard di struttura e di scambio dati che garantisce al “catalogo” creato la sua esportabilità su altre piattaforme. Il profilo applicativo studiato per il Polo consente la descrizione di complessi archivistici di documentazione moderna e contemporanea fino ad un livello analitico (ISAD 4).
In linea generale la catalogazione in Museo&Wed FAD permette di utilizzare un insieme di strumenti che agevolano il compito dell'operatore: elenco dei campi già compilati, gestione di liste e vocabolari (authority files), campi precompilati, campi ripetibili, ecc. Tali strumenti sono forniti all'interno di interfacce grafiche di semplice utilizzo.
Un modulo che consente la catalogazione del patrimonio sulla base delle normative ICCD (il sistema MetaFAD – la base open-source da cui si è partiti per lo sviluppo del software). In tale caso l’applicazione consente l’import-export nel formato standard definito dall’ICCD (trc 92). Le normative previste sono: F (fotografia), D (disegno), S (stampa) e OA (oggetto d’arte).
Un modulo di integrazione con l’ambiente SBN basato su un sistema di cooperazione applicativa che consente al software del Polo di importare i dati bibliografici dal Polo SBN che fa capo alla Biblioteca Nazionale di Napoli (tale Polo costituisce per i partner del progetto l’ambiente di lavoro SBN, rappresentato da un software gestionale web-based sviluppato dall’ICCU e usato da oltre 20 poli SBN). Tale scelta è dettata dall’esigenza di non investire risorse nella duplicazioni di servizi che sono già disponibili sul territorio e ampiamente testati, oltreché dall’esigenza di rendere massima la visibilità del patrimonio librario e grafico grazie all’immediata disponibilità dei dati bibliografici resa possibile dal sistema informativo SBN.
Un modulo che consente la descrizione dei manoscritti basata sullo standard TEI-MS adottato dalla piattaforma Manus-online dell’ICCU e che consenta di importare le descrizioni in tale sistema informativo che realizza il censimento dei manoscritti posseduti dalle biblioteche italiane.
Di seguito rendiamo uno schema del modulo di gestione dati con tutti i canali gestionali esplicitati suddivisi nei principali domini descrittivi:
- Patrimonio:
OA (opera d’arte)
F (fotografia)
D (disegno)
S (stampe)
- Archivistico:
EAD (ISAD): standard internazionale di descrizione archivistica
EAC (ISAAR): standard per la descrizione dei soggetti produttori
- Bibliografico:
SBN-Marc (in cooperazione applicativa)
MODS (Metadata Object Description Schema)
TEI-MS (Editor TEI Manus compliant)
- Multimediale:
Audioteca (modello dati ICBSA)
Videoteca (modello dati ICBSA)
Il sistema di cooperazione applicativa
Favorire l’integrazione del catalogo di biblioteca (la cui funzione precipua è identificare e localizzare una risorsa documentale) con i cataloghi che descrivono il bene culturale sulla base di modelli specialistici è uno degli obiettivi di tale progetto: in altre parole favorire l'integrazione tra gli ambienti descrittivi, in particolar modo quando questi si sovrappongono parzialmente perché restituiscono, a livelli di approfondimento diversi e per utenze differenziate, le stesse entità.
E’ il caso dei disegni, delle stampe e delle fotografie per le quali il sistema del Polo digitale prevede l’integrazione tra l’ambiente SBN (Servizio Bibliotecario nazionale), finalizzato alla descrizione immediatamente disponibile e fruibile attraverso il sistema informativo nazionale rappresentato dall’OPAC SBN, e i cataloghi basati sulle normative definite, per tali beni, dall’ICCD (Istituto Centrale per il Catalogo e la Documentazione).
Per il Polo digitale, SBN infatti è l’ambiente cui è riservata la fase di record-making bibliografico (che include anche materiale grafico come stampe, disegni, fotografie): il materiale librario viene gestito integralmente in ambiente SBN e importato – attraverso uno scarico dati in formato unimarc - allo scopo di alimentare il sistema informativo del Polo digitale. Il materiale grafico(disegni, stampe e fotografie) viene, in tale scenario, preliminarmente catalogato in SBN, per poi essere dinamicamente importato, sulla base del protocollo applicativo su cui si basa il funzionamento di SBN (SBNMarc), nel sistema di gestione del Polo digitale che prevede, per tali materiali, i tracciati definiti dall’ICCD (scheda F per la fotografia, scheda D per il disegno, scheda S per la stampa). Tale derivazione presuppone lo studio di mappature tra i modelli dati adottai nei due ambienti che è tra gli scopi di una collaborazione scientifica avviata tra l’ICCU e il Polo digitale.
Descrizione funzionale
Gli istituti che partecipano al progetto catalogano, inventariano e collocano il materiale grafico, come detto, con le procedure di SBNWeb, usando le normali utenze disponibili sull'ILS di Polo. I record così creati sono poi estratti da Indice o da Polo in cooperazione applicativa tramite protocollo SBNMarc - attraverso una interfaccia di ricerca dedicata, disponibile in Museo&Web FAD (componente di data management della piattaforma di gestione del Polo digitale) – con l’invocazione di un servizio specifico (“cerca”) tra quelli ammessi dal protocollo.
Le procedure cablate nel sistema d’arrivo, definite sulla base delle mappature studiate, consentono la precompilazione dinamica dei campi ICCD mappati con le strutture dati SBNMarc importate.
Lo scopo di tale processo è consentire, attraverso un unico flusso di lavoro, di alimentare sia il sistema informativo SBN che i repository ICCD locali, estendendo e arricchendo sul sistema di gestione del Polo digitale la descrizione dei suddetti materiali, attraverso i tracciati specialistici disponibili secondo il livello di descrizione scelto dai diversi istituti (inventariale, pre-catalogo e catalogo).
L’output finale - grazie ai formati di scambio standard previsti in fase di export dei dati - sarà un file TRC (ICCD 92) che potrà essere importato nelle banche dati regionali e centrali (come quella rappresentata dal SigecWeb).
Nell’ambito di tale progetto è allo studio la fattibilità di una integrazione con il sistema SigecWeb in modo analogo a quanto previsto con l’ambiente SBN. Infatti per tale sistema sono documentate API di tipo web services, principalmente per la restituzione delle informazioni che potranno essere impiegate per l’importazione puntuale di singoli record; mentre per l’importazione batch nel sistema locale di schede eventualmente già presenti nel SigecWeb si userà il formato di scambio TRC.
Digital Assets Management (DAM) e funzionalità di Teca digitale
La componente funzionale fondamentale in una piattaforma gestione di tale natura è indubbiamente il sistema di digital library. Il progetto prevede lo sviluppo di una teca digitale che consentirà al personale di gestire i file digitali prodotti (che siano originati da campagne di scansione – come in questa prima fase – o che siano prodotti internamente sulla base di richieste di servizi – ad esempio richieste di digitalizzazione avanzate dagli utenti attraverso i canali di richiesta disponibili sul sito-portale), attraverso la creazione dei metadati gestionali. In ambiente digitale i metadati gestionali sono fondamentali per consentire attraverso un sistema di interfacce informatiche di ricostruire virtualmente l’integrità fisica e la struttura logica di un documento analogico e del testo/contenuto che esso veicola. Accanto ai metadati tradizionalmente associati alla ricerca in un catalogo (valori che garantiscono le funzioni di ricerca, localizzazione e selezione di una risorsa informativa), risultano imprescindibili i metadati di natura strutturale che consentono la corretta rappresentazione della struttura fisica del documento analogico (l’organizzazione delle parti costituenti il supporto documentale) e della struttura logica dell’interfaccia testuale (ad esempio i capitoli di un libro). Tali metadati aggiuntivi vengono generati manualmente attraverso la disponibilità di editor sviluppati ad hoc.
Per garantire la massima flessibilità di utilizzo, nonché l’integrabilità con la componente di data management M&W FAD, una facile manutenibilità e prestazioni adeguate, scalabilità, sicurezza e flessibilità d’uso, si è deciso di implementare una soluzione di Digital Asset Management (DAM) per la gestione degli oggetti digitali basato su framework Glizy, SOLR e un front-end realizzato in AngularJS.
Caratteristica principale del DAM è la possibilità di specificare in modo estremamente accurato tutti i set di operazioni che possono essere effettuate su ogni singolo oggetto digitale come:
inserimento, modifica e cancellazione degli oggetti digitali
ricerca e consultazione
editing dei metadati nei formati supportati.
gestione collezioni o raccolte per facilitarne il riuso.
tagging gerarchico dei contenuti al fine di facilitare le operazioni di ricerca
conversione degli oggetti digitali nel maggior numero di formati compatibili
gestione di oggetti gerarchici
gestione di oggetti multiformato
supporto protocollo OAI-PMH
Profili di metadati generati e workflow di metadatazione
Le linee dedicate alla codifica dei metadati gestionali contemplano processi che è possibile definire come semi-automatici. Una volta manipolato attraverso le funzionalità del DAM, l’oggetto digitale - che sia rappresentato da un singolo file o da una collezione di file - è agganciato, attraverso apposite intefacce di ricerca, alla fonte dati descrittiva dell’entità intellettuale rappresentata dal record bibliografico o dalla scheda archivistica. Tale fonte, grazie a mappature cablate nel sistema, consente il popolamento automatico della sezione descrittiva dei metadati gestional.
Per i metadati strutturali i sistema dispone di interfacce dedicate che consentono all’operatore di stabilire sequenza e nomenclatura dei file componenti l’oggetto della metadatazione. Tali linee procedurali dispongono di un viewer che consente di visualizzare e/o riprodurre i file in modo che l’operatore sia in grado, una volta stabilitane la posizione, di definirne il “contenuto” attraverso i metadati di nomenclatura (elemento esplicitamente dichiarato nello schema MAG che trova corrispondenza anche nel framework METS).
Una volta definita la struttura fisica, l'operatore passa alla definizione della struttura logica attraverso un'interfaccia grafica che gli consente di aggiungere elementi, anche nidificati, definendone la nomenclatura e la posizione, attraverso la valorizzazione di puntatori agli oggetti digitali la cui sequenza sia stata già definita nella fase preliminare della strutturazione fisica. L'interfaccia dispone di un viewer che consente all'operatore di visualizzare i file e definire i puntamenti agli stessi.
Di seguito rendiamo uno schema delle componenti funzionali del sistema sotto il profilo dei servizi digitali disponibili e dei profili di metadati gestiti:
DAM (Digital Assets Management o sistema di Digital Library):
Gestionale di risorse digitali: consente la manipolazione degli oggetti digitali e la generazione dei formati file derivati.
Gestionale di pacchetti (SIP AIP DIP secondo il modello funzionale OAIS).
Generatore e editor di metadati MAG e METS. Formati gestiti:
MAG: consente l’esposizione degli oggetti verso l’aggregatore Internet Culturale
METS-SAN: consente l’esposizione dei metadati descrittivi degli allegati digitali verso il sistema informativo SAN
METS-MDI (MuseiD)
METS di Google books: profilo METS generato nell’ambito del progetto Google books
Gli aggregatori con cui colloquiamo
Lo scopo primario degli schemi di metadati sopra richiamati è quello di rendere ricercabili e usabili gli oggetti digitali quando questi siano “esposti” fuori dall’ambiente di produzione e gestione originario, di modo che le interfacce applicative degli aggregatori esterni (nel nostro caso Internet Culturale e SAN come aggregatori primari) siano in grado rendere correttamente i pacchetti informativi. I principali schemi di scambio gestiti sono MAG, CAT-SAN e METS-SAN: il primo consente il colloquio tramite protocollo OAI-PMH con l’aggregatore Internet Culturale verso il quale verranno esposti sia i metadati che gli oggetti digitali; il secondo consente il colloquio con il Sistema Archivistico Nazionale limitatamente ai metadati descrittivi codificati nella grammatica EAD (Encoded Archival Description) per quanto riguarda la descrizione dei complessi documentali (record di primo livello) ed EAC (Encoded Archival of Contest) per quel che riguarda la descrizione delle entità collegate; gli oggetti digitali e i loro collegamenti ai livelli di descrizione di pertinenza sono descritti attraverso l’uso del profilo METS-SAN che fa uso per il livello descrittivo della codifica EAD mentre per le relazioni si richiama all’ontologia SAN-DL (SAN Digital Library).
Tale piattaforma consentirà - grazie ai servizi di metadatazione integrati - un colloquio nativo con i sistemi informativi dei principali aggregatori nazionali.
Workflow management
Una componente importante in sistemi di tale complessità è il sistema di modellazione e gestione dei processi di lavoro. Quello presentato sommariamente nel presente lavoro non è un software ma un “sistema di gestione”: un insieme di risorse hardware, software, umane, e di regole, procedure da applicare perché il flusso di lavoro finalizzato alla gestione del bene e all’erogazione dei servizi vada a buon fine. Il componente di gestione dei processi di lavoro consentirà di modellarne i flussi ottimizzandoli e, quando necessario, ridisegnandoli (reengineering).
Il Portale
Per la realizzazione del Portale e dei suoi servizi si useranno le funzionalità di Museo&Web CMS integrate col sistema di gestione dei dati basato a sua volta su Museo&Web FAD.
Grazie al CMS (content management system) integrato nel sistema di data management, la fruizione dei contenuti provenienti dai cataloghi potrà essere gestita in maniera non convenzionale consentendone una più efficace rappresentazione. Il sito web collegato al sistema di catalogazione/descrizione del patrimonio, attingendo quindi direttamente ai repositories documentali, sarà arricchito con percorsi tematici, collezioni di opere e itinerari di visita collegati a interfacce geografiche. Il passaggio dal dato catalogato alla sua presentazione all’interno di percorsi di presentazione graficamente accattivanti e orientati alla didattica è certamente un punto di forza reso possibile dall’integrazione tra i due sistemi.
Il viewer
Questo componente si occupa del recupero e della presentazione degli oggetti digitali e dei metadati (descrittivi e strutturali) associati tramite DAM o contenuti nell’oggetto fisico lato server.
Il visualizzatore di oggetti multimediali sarà realizzato in tecnologia HTML5/JavaScript. Sarà usabile sia su PC che su piattaforme mobile. Sarà in grado di visualizzare file nei seguenti formati:
JPEG
MP3
TEI: il contenuto testuale in formato TEI verrà visualizzato utilizzando un CSS ad hoc
HTML
Video: saranno visualizzati i video realizzati nei formati supportati da HTML5
Sistema di gestione semantica e LOD
Tra gli obiettivi più ambiziosi del progetto vi è lo sviluppo di un sistema di gestione semantica in grado di accompagnare il Polo nel complesso processo della produzione e del mantenimento dei dati aperti linkati (cosiddetti LOD – Linked Open Data). I linked data sono una tecnologia e un insieme di buone pratiche per pubblicare dati sul web in una modalità leggibile, interpretabile e utilizzabile da una macchina; la formulazione fu proposta da Tim Berners-Lee ed è strettamente legata a quella di web semantico. Con WS si intende, in generale, la trasformazione del World Wide Web in un ambiente in cui le risorse pubblicate (pagine html, file, immagini, ecc.) sono associate a informazioni e dati (metadati) che ne specificano il contesto semantico in un formato, come detto, adatto all’elaborazione automatica. Le biblioteche, gli archivi e le istituzioni della memoria già producono dati strutturati di qualità, i quali però restano chiusi, quasi blindati, in database non accessibili, ad esempio, dai motori di ricerca che siamo abituati a usare per accedere alle informazioni via web. Lo scopo del sistema di gestione semantica del Polo digitale è dunque la produzione di dataset all’interno dei quali il valore dei dati sia definito da stringhe costituite da parole e marcatori, e il significato sia stabilito tramite appositi linguaggi costituiti da modelli di dati (RDF per la strutturazione sintattica dell’informazione), ontologie (come menzionato sopra a proposito dell’OPAC di polo, il modello FRBRoo per i domini bibliografico e museale, e il thesauro di concetti archivistici OAD per il dominio archivistico) e vocabolari (per esempio RDA Open Metadata Registy), in modo che sia garantita la comprensione di tali contenuti da parte di agenti non umani, per esempio, agenti semantici in gradi di generare nuova conoscenza, attraverso meccanismi di inferenza.
I dati dovrebbero sempre essere collegati ad altri dataset esterni, a cui altri dataset possono a loro volta riferirsi. Nel progetto di Polo digitale si prevede il collegamento con dataset esterni come Dbpedia (la versione opendata di Wikipedia, ad esempio per le schede di autori che potranno essere in tal modo dinamicamente richiamate); Geonames (per la georeferenziazione dei luoghi, riferibili ai luoghi di edizione di una pubblicazione, ma anche ai luoghi citati nei documenti digitalizzati) e VIAF (per i dati d’authority).
Arricchimento semantico e NER
L'arricchimento semantico sarà utilizzato per collegare alcuni metadati contenuti nelle schede di catalogazione con risorse esterne (le ontologie dei principali dataset sopra richiamati) che potranno consentire approfondimenti o una navigazione più efficace. Questi collegamenti saranno aggiornati in tempo reale e consentiranno di avere una informazione sempre allineata alle fonti esterne. In sostanza il sistema di semantic enrichment analizzerà il contenuto del metadato con tecniche di NLP, lo normalizzerà e creerà un metadato RDF che sarà esportato come tripla utilizzando una proprietà specifica come sameAs, il collegamento alla risorsa esterna sarà risolto in tempo reale attraverso l’URI della risorsa stessa. Tale tecnica consentirà di alimentare con un processo automatico il linking esterno con i principali dataset sopra richiamati.
Le tecniche di semantic enrichment saranno applicate anche al testo trascritto, o all’OCR, con lo scopo di estrarre dall’informazione non strutturata quei metadati che potranno essere usati per descrivere la risorsa in modo semiautomatico.
OPAC e base di conoscenza
Pur essendo tali domini formalmente separati e gestiti sulla base di normative specifiche (SBN: per il materiale bibliografico e anche per il materiale grafico; SAN - isad, per la documentazione d’archivio; normative ICCD per la descrizione del patrimonio artistico), sono diverse le relazioni e, in parte, le sovrapposizioni tra gli oggetti che costituiscono tali domini: gli archivi, residuo e traccia documentale dell'attività istituzionale di un soggetto produttore, possono testimoniare della formazione delle raccolte d'arte; le opere d'arte sono l'oggetto di studi che costituiscono intere bibliografie. Tale modello ontologico costituisce la base di conoscenza imprescindibile per costruire un punto di accesso unificato, il cui modello è rappresentato dalle ontologie di dominio FRBRoo e OAD (di cui tratteremo brevemente più avanti), impiegate nel progetto.
La comunità degli utenti (interni ed esterni):
Per chi impiantare un sistema di questo tipo? Due sono le classi di utenti:
gli utenti esterni: gli studiosi, gli studenti, i lettori e i cultori che orbitano normalmente intorno a tale tipo di istituti culturali. Questa comunità di riferimento è caratterizzata da esigenze informative molto differenziate:
- le esigenze specialistiche dello studioso sono esaudite dai cataloghi di dominio: SBN per la ricerca bibliografica finalizzata all’identificazione e localizzazione dei documenti a stampa (tipica funzione del catalogo); i tracciati di livello inventariale, definiti dalle normative ICCD (D per il disegno, F per la fotografia, S per la stampa e OA per l’opera d’arte) per il patrimonio, che consentono di accedere a una descrizione più dettagliata, più analitica del bene (finalizzata alla sua conservazione); e infine, la descrizione dei complessi archivistici la cui strutturazione gerarchica, analiticità e ricchezza informativa (il modello dati è basato sullo standard internazionale ISAD) garantisce la contestualizzazione dell’informazione veicolata dalla documentazione d’archivio.
- le esigenze informative generiche (l’utente generico): cioè identificare risorse informative di qualsiasi natura correlate in qualsiasi modo a un oggetto, un evento, una persona, una famiglia, un ente. E’ a questo tipo di ricerche integrate che si rivolge l’interfaccia di ricerca cross-domain dell’OPAC (on-line public access catalogue): il discovery tool è basato sui modelli entità-relazione (FRBRoo per l’integrazione dei domini bibliografico-museale e OAD per quello archivistico).
gli utenti interni o operatori delle istituzioni coinvolte: bibliotecari, archivisti, addetti di sala, curatori, dal lavoro dei quali dipende la gestione dei servizi all’utenza. L’introduzione della piattaforma di Polo consente l’ottimizzazione e, lì dove necessario, la reingegnerizzazione dei processi di lavoro in essere. Il reengineering dei processi è uno degli obiettivi primari del progetto.
Un’interfaccia di ricerca innovativa (FRBR) e l’orientamento ai servizi
È ormai acquisita la consapevolezza che le raccolte delle biblioteche, dei musei, degli archivi e di qualsiasi altra istituzione culturale sono insufficienti, considerate singolarmente, a soddisfare le esigenze della maggior parte degli utenti. Le istituzioni della memoria registrata devono cominciare quindi a fare sistema, a collaborare attivamente per creare un servizio che sia in grado di rispondere a richieste sempre più esigenti da parte degli utenti.
Il Polo Digitale ha tra i suoi obiettivi più importanti facilitare l’utente nella ricerca di informazioni utilizzando le attuali tecnologie e operando nell’ambiente digitale.
Come? Attraverso la piena integrazione delle “registrazioni” nel web – in particolare nel web semantico, il cosiddetto web dei dati – fornendo selettivamente i dati che più e meglio rispondono ai bisogni informativi e documentari della comunità di riferimento.
Nello scenario attuale il lettore riceve, in risposta a un’interrogazione, un elenco di record bibliografici che descrivono pubblicazioni sulle quali bisogna poi operare una selezione, talvolta complessa, per individuare le informazioni di interesse: gli oggetti che un sistema tradizionale restituisce sono tutti della stessa natura, sono edizioni pubblicate di date opere.
Il nuovo modello di OPAC intende rispondere in modo puntuale alla richiesta di ciascun utente; la risposta mirata è un vantaggio che deriva dall’adozione della struttura dei dati organizzata sulla base del modello FRBR (Functional Requirement for Bibliographic Record), che distingue le diverse entità – attraverso le quali è organizzabile concettualmente il dominio della conoscenza bibliografica e museografica – e che corrispondono all’approccio della ricerca: un utente, infatti, può essere interessato ad avere informazioni su un’opera (il contenuto artistico o intellettuale identificato da una concatenazione di titolo e autore); può essere interessato a una particolare espressione dell’opera (cioè a un determinato testo, es. una certa traduzione o una determinata edizione dell’opera); oppure può ricercare una particolare manifestazione bibliografica (l’oggetto dei cataloghi tradizionali) della quale conosce dati precisi, come il titolo, il nome dell’autore, la data di pubblicazione etc. Questa puntualità nella risposta è possibile perché lo standard guida cui ci riferiamo prevede la produzione granulare di metadati abbinati alle entità del modello: opera, espressione, manifestazione, item; oggetto, concetto, evento, persona, famiglia, ente.
Il sistema prevede l’integrazione dei seguenti componenti software:
· indicizzazione schede
· indicizzazione metaOpac
· amministrazione ricerche
· modulo di ricerca a faccette
· visualizzazione schede.
Sistema di indicizzazione delle schede secondo i seguenti modelli dei dati:
EAD-EAC
SBNMarc
ICCD (F, D, S, OA)
MODS
TEI-MS (Manus compliant)
Sistema di costruzione dell’indice di mataopac
Questo componente è l’interfaccia di amministrazione in M&W FAD delle modalità di fruzione dell’OPAC per ogni tipologia di scheda e per il profilo comune. E' possibile definire sia i campi di ricerca per la modalità “google like” che quelli per la ricerca avanzata.
Modulo di ricerca a faccette
I risultati delle ricerche, sia quelle semplici che avanzate, saranno presentate corredate di faccette che consentiranno di navigare i risultati apponendo dinamicamente gli opportuni filtri definiti sulla base dei modelli gestiti.
Visualizzazione sintetica e dettagliata
Per ogni tipologia di scheda si prevede una visualizzazione dei dati in forma sintetica che consentirà di presentare i dati più rilevanti insieme all’anteprima del documento (se presenti oggetti digitali collegati). Tutti i dati associati all’oggetto saranno visibili poi in pagine di dettaglio che ne offriranno una vista analitica organizzata per sezioni.
Le interfacce di amministrazione saranno realizzate in javascript con la tecnologia Angularjs, il motore di ricerca sarà sviluppato in SOLR e i servizi da esporre per la gestione delle interfacce di consultazione in PHP.
Conclusioni
Obiettivo primario del progetto è la costituzione di un Centro Servizi a supporto delle attività degli istituti partner, resa possibile dall’implementazione di una piattaforma software che consenta la gestione dei complessi processi di lavoro finalizzati alla digitalizzazione, conservazione e divulgazione di beni culturali documentali e museali.
Sulla base di una convenzione che sarà stipulata tra il consorzio degli istituti costituenti il Polo digitale e l’ICCU, l’insieme delle componenti funzionali del sistema di gestione - sopra sommariamente illustrato - farà parte integrante di una piattaforma di gestione opensource resa disponibile per l’intera comunità di istituzioni servita dall’Istituto Centrale.