Venerdì, 28 Giugno 2013

Conservare nella cloud?

Simone Vettore
Sezione Studi

In una recente intervista [1] Vinton Cerf, “padre” assieme a Bob Kahn del protocollo TCP/IP ed attualmente “Chief Internet Evangelist” presso Google, ha portato all’attenzione del grande pubblico una tematica sulla quale gli archivisti, assieme ai bibliotecari ed altre figure operanti nel campo dei beni culturali, ragionano oramai da anni: come conservare nel lungo periodo la nostra memoria digitale.

L’informatico statunitense, portando come esempio la sua personale esperienza (negativa), ha infatti sottolineato come, a causa dell’obsolescenza cui sono sottoposte le risorse hardware e software delle quali facciamo quotidianamente uso, sia più che concreto il pericolo che in un futuro nemmeno tanto remoto ci troveremo in mano una quantità di dati e documenti digitali inutilizzabili e pertanto perfettamente inutili.

Così come il problema, nemmeno la possibile soluzione ventilata da Cerf suonerà nuova ai più: difatti, al di là dell’immaginifico obiettivo di arrivare a realizzare un “digital vellum” (ovvero una “pergamena digitale” che rappresenti l’equivalente, per robustezza e capacità di veicolare per secoli i messaggi in essa impressi, della pergamena “animale”), Cerf constata come sia di fondamentale importanza conservare i metadati che ci descrivano il dato / oggetto digitale conservato e, soprattutto, l’ambiente informatico nel quale (e per il quale) esso era stato creato e “viveva”. In tal modo si entra in possesso delle informazioni necessarie a far rivivere, anche a distanza di anni (secoli?), un determinato file nel suo ambiente operativo (verrebbe da dire, archivisticamente, nel suo contesto). L’informatico statunitense, in buona sostanza, afferma che l’emulazione è la soluzione dei nostri problemi. Come noto quest’ultima via è stata a lungo presa in considerazione anche dagli archivisti, salvo venire accantonata in favore del metodo della migrazione all’interno di sistemi documentari e di archiviazione affidabili, in quanto ritenuta tecnologicamente di difficile implementazione ed economicamente dispendiosa.

Ed è qui che sta la novità: secondo Cerf infatti non è da escludere che il cloud computing possa venire in soccorso consentendo l’emulazione a prezzi accettabili dei vecchi hardware in cui far girare altrettanto vecchi sistemi operativi ed applicativi.

È proprio su questo aspetto che intendo appuntare in questa sede la mia attenzione: come risaputo molte start-up (soprattutto quelle tecnologiche) sfruttano le infrastrutture “sulla nuvola” (potenti quanto bisogna e scalabili) per testare i propri nuovi programmi / applicativi prima di mettersi sul mercato. In essa queste aziende, in altri termini, trovano il giusto compromesso tra potenza di elaborazione e costi (non serve infatti acquisire una infrastruttura ma si può attendere, prima di compiere questo eventuale passo, il responso del mercato nei confronti dei prodotti / servizi che si vanno offrendo).

Ragionando per analogia non è inverosimile che si possano sfruttare queste caratteristiche del cloud computing per realizzare, ad un costo accettabile, ambienti di emulazione che, peraltro, avrebbero il pregio di essere accessibili da remoto e di essere dunque raggiungibili da una vasta platea di utilizzatori; così facendo il comunque incomprimibile costo di sviluppo dell’ambiente di emulazione potrebbe essere ammortizzato o perlomeno trovare una sua giustificazione economica (ma anche di utilità sociale) in virtù del fatto che esso si rivolge ad una utenza tendenzialmente identificabile come l’intera cittadinanza. 

È esattamente partendo da queste premesse che sono state avviati alcuni progetti, alcuni dei quali in verità fermi a livello di prototipo, per testare fattibilità tecnologica, sostenibilità economica e potenzialità di crescita futura di una simile strategia conservativa.

È curioso osservare, preliminarmente, come molti di essi traggano origine da emulatori sviluppati per consentire ai numerosi patiti di arcade a continuare a baloccarsi con i propri videogiochi preferiti oramai non più funzionanti nei nuovi ambienti operativi [2]. Anche tenendo presente queste importanti esperienze, seppur realizzate con finalità “ludiche”, sono stati successivamente sviluppati progetti ben più “solidi” dal punto di vista archivistico: un esempio è KEEP (Keeping Emulation Environments Portable) [3] ma sono numerosi i programmi e gli studi in corso. Significativa l’esperienza accumulata da PLANETS (concluso il 31 maggio 2010) ma merita di essere menzionato pure quanto fatto dalla Biblioteca Nazionale Centrale di Firenze [4].

In particolare dalle ceneri di PLANETS ha avuto origine l’Open Planets Foundation (OPF) alla quale va il merito di aver approfondito anche dal punto di vista teorico, e qui ritorniamo all’oggetto di questo breve articolo, l’emulazione e la possibilità di combinare questa strategia conservativa con il modello tecnologico del cloud computing. Nello specifico gli esperti dell’OPF hanno fatto proprio il concetto di emulation as a service coniato da Joris Van Der Hoeven, concetto che andrebbe ad affiancarsi alla classica tripartizione con la quale si suole classificare la nuvola informatica, ovvero Software as a Service (SaaS), Platform as a Service (PaaS) e Infrastructure as a Service (IaaS).

Sinteticamente con la prima locuzione si intende la possibilità di accedere ed utilizzare programmi informatici disponibili in remoto, con la seconda quella di accedere a piattaforme costituite non da un singolo programma bensì da diversi servizi, programmi, librerie, etc., ed infine con la terza ci si riferisce all’utilizzo di risorse hardware remote (tipico il caso di quelle di storage che stanno alla base dei cosiddetti “archivi sulla nuvola”).

Personalmente nutro dei dubbi sul fatto che l’EaaS costituisca una nuova tipologia di servizio ma ritengo piuttosto che essa vada a sovrapporsi alla “triade” appena descritta: appare infatti evidente che l’emulazione sulla nuvola è profondamente trasversale configurandosi essa, a seconda delle prospettive, tanto come un servizio (non a caso per l’utilizzatore finale la modalità di fruizione è quella tipica del SaaS, ovvero di un software al quale si accede da remoto e che, nel caso specifico, appare come un’interfaccia amichevole che consente di far girare i propri file diventati obsoleti) quanto come una indispensabile piattaforma (l’emulazione consiste proprio nell’“applicare” ad un ambiente operativo moderno uno più vecchio) ed utile infrastruttura (anche se qui i benefici derivano non tanto dalla possibilità di ampliare le proprie risorse di storage o di calcolo bensì dal lavorare in un ambiente distribuito e scalabile con costi vantaggiosi). 

A prescindere ora da queste quisquilie di ordine terminologico è opportuno passare in rassegna quelli che sono gli indubbi punti di forza dell’EaaS e, al contrario, evidenziare quali sono gli aspetti sui quali bisogna ancora lavorare.

Tra i punti di forza sottolineati dagli esperti dell’OPF vanno assolutamente citati [5]:

§  Centralizzazione, che assicura, a fronte di una minor spesa, un adeguata ridondanza dei servizi e delle strumentazioni

§  Specializzazione: le varie istituzioni possono concentrarsi là dove le loro competenze sono maggiori; tali competenze potranno in un secondo momento essere adeguatamente distribuite, in ottica cooperativa, attraverso la Rete

§  Scalabilità: essendo il numero di ambienti (al momento) limitati, il numero di emulatori richiesti è di conseguenza ridotto

§  Business model  che, qualora sia prevista l’apertura al pubblico e la corresponsione di una somma di denaro per il servizio offerto, potrebbe aprire interessanti scenari per gli archivi (e per gli archivisti).

Tra gli aspetti negativi vanno invece tenuti presenti almeno i seguenti:

§  Realizzare gli emulatori, ovvero la componente centrale del servizio, non è esattamente operazione semplice; al contrario essa richiede, oltre a notevoli conoscenze tecniche ed informatiche, pure di essere in possesso di eventuali autorizzazioni di natura legale all’utilizzo

§  Nonostante i passi da gigante fatti in questa direzione, molte migliorie devono ancora essere apportate in fatto di grafica, user interface, capacità di adattare la risoluzione dello schermo a quelle che erano le caratteristiche dei monitor dell’epoca, di audio, di riproduzione delle modalità di interazione con le varie periferiche di input succedutesi nel tempo (ad es. alle tastiere sono stati aggiunti nel corso degli anni nuovi tasti, joystick e mouse sono andati incontro a profonde trasformazioni, etc.).

Evidentemente c’è ancora molto lavoro da fare prima che si possa affermare di aver raggiunto un livello soddisfacente: un conto è emulare videogiochi, un altro conto importanti documenti (specie se la “resurrezione” è necessaria per tutelare i propri diritti / difendersi in sede legale)!

Quest’ultimo obiettivo è a mio avviso raggiungibile adattando alla nuova realtà tecnologica il mai tramontato (ed anzi ribadito con estrema chiarezza dai vari Inter PARES!) principio dell’ininterrotta custodia: se il servizio di emulazione non fosse infatti un pacchetto a sé stante ma venisse bensì inserito in uno più amplio di archiviazione tout court, l’opponibilità in sede legale ne discenderebbe in maniera pressoché automatica.

L’optimum, poi, sarebbe riuscire a trasferire il tutto sulla nuvola informatica: si tratta in altri termini di passare dal limitato obiettivo dell’Emulation as a Service a quello ben più vasto (e stimolante, anche per le prospettive che si aprono) dell’Archiving as a Service [6].

Si può dunque concludere che il cloud computing, paradossalmente spesso accusato di essere archivisticamente inadeguato (e questo a dispetto delle sue indubbie capacità di salvare, da una qualche parte, i dati / documenti caricati e di farli in qualche modo “sopravvivere” ai mille accidenti cui essi possono andare incontro), potrebbe offrire, seguendo vie completamente diverse rispetto a quelle sinora contemplate, anche un importante contributo alla risoluzione tutti quei problemi connessi alla creazione, archiviazione ed ovviamente conservazione nel lungo periodo dei dati e documenti digitali nonché ad aprire interessanti prospettive per la professione archivistica. 

Ringrazio Raffaele Messuti (@atomotic - https://twitter.com/atomotic) per avermi fornito alcune preziosissime informazioni bibliografiche.

Questo contributo di Simone Vettore è una rielaborazione di un suo precedente articolo, pubblicato sul blog dell'autore, "Memoria digitale". Ringraziamo l'autore[ndr].

_________________________________________

[1]http://www.computerworld.com/s/article/9239790/Cerf_sees_a_problem_Today_s_digital_data_could_be_gone_tomorrow_

[2] È il caso di MESS (Multi Emulator Super System) che si dichiara  «a source-available project which documents the hardware for a wide variety of (mostly vintage) computers, video game consoles, and calculators through software emulation» e del programma gemello MAME (Multiple  Arcade  Machine  Emulator). Vedi rispettivamente http://mess.org/ e http://mamedev.org/.

[3] Il fine di questo progetto «is to facilitate universal access to our cultural heritage by developing flexible tools for accessing, manipulating and storing a wide range of digital objects using emulation tools either to reproduce the original environment in which they were created or to enable those objects to be migrated accurately to another environment. Vedi http://www.keep-project.eu/ezpub2/index.php.

[4] Vedi rispettivamente http://www.planets-project.eu/ e http://www.rinascimento-digitale.it/eventi/tavola-rotonda-2008/rossi.pdf.

[5] Attingo qui abbondantemente dal seguente saggio: Dirk von Suchodoletz, Klaus Rechert, Isgandar Valizada, Towards Emulation-as-a-Service: Cloud Services for Versatile Digital Object Access, in The International Journal of Digital Curation, Volume 8, Issue 1 (2013), pp. 131-42, http://ijdc.net/index.php/ijdc/article/view/8.1.131/302.

 

[6] Tale obiettivo, si badi, è ben di là dall’essere raggiunto: appositi studi hanno ad esempio evidenziato, proponendo correttivi per superarle, le differenze di fondo esistenti tra il modello del cloud computing e quello, oramai preso universalmente come riferimento per i sistemi archivistici digitali, ovvero OAIS. Vedi Jan Ashkoj, Shigeo Sugimoto, Mitsuharu Nagamori, Archiving as a Service -  A Model for the Provision of Shared Archinving Services using Cloud Computing,    http://www.slideshare.net/janaskhoj/archiving-as-a-service-a-model-for-the-provision-of-shared-archiving-services-using-cloud-computing

Devi effettuare il login per inviare commenti