Blog CRAI Universitat de Barcelona

Blog del Centre de Recursos per a l'Aprenentatge i la Investigació de la Universitat de Barcelona


2 comentaris

Pla integral de Preservació digital del CRAI de la Universitat de Barcelona

El CRAI de la Universitat de Barcelona disposa, des del 2014, d’un Pla integral de Preservació digital dels seus fons patrimonials.

Amb la creació del Centre de Digitalització (CEDI) de la Universitat de Barcelona al juny del 2013, el CRAI va definir el nou projecte de digitalització i difusió del seu patrimoni des d’un punt de vista global. El projecte contemplà, des del seu origen, tres àrees d’actuació: un centre de digitalització, un servidor de difusió i un sistema de preservació digital. Aquesta darrera àrea es du a terme a partir del repositori Xanadú, on es preserven tant els resultats del procés de digitalització com els documents digitalitzats pel CRAI amb anterioritat al CEDI. Aquestes tres àrees han definit tres línies estratègiques en l’àmbit de la Gestió de la col·lecció, que han servit per definir les polítiques de gestió dels diferents àmbits i dotar el sistema d’un marc normatiu adient.

Història de la digitalització al CRAI de la Universitat de Barcelona

El CRAI està fent, des l’any 2005, una feina important de difusió del seu ric patrimoni bibliogràfic i documental (format principalment pel fons antic dipositat al CRAI Biblioteca de Reserva, pels fons d’arxius personals, i per les col·leccions bibliogràfiques, personals i temàtiques de la Universitat), a través de la digitalització del seu fons.

El juny del 2013, amb la creació del CEDI, va suposar la dotació d’un centre propi per a la digitalització. A partir d’aquesta data tot el material digitalitzat a través del CEDI s’ha gestionat pensant no sols en la seva difusió sinó també amb la preservació a llarg termini dels fitxers digitals.

L’inici del CEDI va suposar l’establiment d’unes directrius definides:

  • en l’ús d’estàndards internacionals en la digitalització i l’assignació de metadades
  • en la política i el sistema de preservació de les imatges amb dues vessants:
    • dels nous objectes digitals
    • dels fitxers retrospectius originats des del 2005 fins el 2013
  • en la difusió dels fitxers resultants consultables a través de les diferents plataformes BiPaDi, MDC , TDX
  • en la definició de la política de col·leccions digitals del CRAI

      

Fitxers digitals: problemàtica

Els documents digitals presenten una sèrie de perills a diferents nivells: de suport, de format i de programari.

Per lluitar contra aquests perills, majors quan més temps es vol conservar un fitxer, cal mantenir una vigilància continua i comprovar la integritat de les còpies de les dades. Mentre que a curt termini molts dels perills es preveuen tenint una bona política de còpies de seguretat, a mig i llarg termini cal aplicar polítiques més àmplies de preservació digital. És necessari garantir la preservació dels fitxers màsters o originals d’alta qualitat tenint en compte els possibles canvis de formats o obsolescència, i assegurar la seva integritat per sobre de qualsevol incidència tècnica: virus, manipulacions accidentals, errors de maquinari o migracions de format.

Pla de preservació digital

El CRAI té un gran volum de màsters i per tant un volum de dades considerable, raó per la qual és necessari normalitzar les característiques i els noms dels fitxers de diferents procedències.

Guardar o preservar de forma segura vol dir fer més d’una còpia i aquestes còpies no han de ser manipulables ni tan sols per accident. És aquest el concepte de dipòsit segur i sobre el dipòsit s’han de poder aplicar controls sobre què hi entra i quines són les condicions d’entrada així com comprovacions periòdiques de la integritat del seu contingut.

Des de 2013 i de manera ordenada, el CEDI segueix el pla de preservació per als nous objectes digitals i des de 2016 s’està realitzant la tasca de revisió de les còpies de preservació anteriors al CEDI, comprovant la seva procedència, integritat i qualitat abans de preservar-les.

En un futur proper esperem poder incloure en aquest pla integral també tota la producció de documents nascuts digitals que el CRAI difon a través dels repositoris digitals.


Deixa un comentari

Diario de Barcelona: digital i lliure des de l’Arxiu de Revistes Catalanes Antigues

Coincidint amb la celebració dels 225 anys de la publicació del primer número del Diario de Barcelona, i fruit de la col·laboració entre l’Arxiu Històric de la Ciutat de Barcelona, el CRAI de la Universitat de Barcelona i la Biblioteca de Catalunya,  el diari ja es pot consultar en línia des de 1792 fins a 1862 a l’ARCA (Arxiu de Revistes Catalanes Antigues).

Diario de Barcelonauna de les publicacions amb més continuïtat i més influent en la història de la premsa de Catalunya, va ser fundat per Pere Pau Husson amb llicència de Carles IV, i va arribar el 1814 a mans de la família Brusi. La publicació va passar per diverses etapes de desenvolupament, esplendor, crisi i decadència fins que, finalment, el 1994 es va deixar d’editar definitivament en paper. Va aparèixer en format digital de 1998 fins al 2009. Al llarg d’aquests més de dos-cents anys de vida, el Diario de Barcelona va experimentar canvis d’orientació, llengua, títol i suspensions,  que són reflex de la pròpia història i situació política i social del país.

Una part molt important de la digitalització, revisió i edició del Diario de Barcelona s’ha fet al CRAI de la Universitat des del Centre de Digitalització –CEDIi amb la col·laboració dels CRAI Biblioteques de Lletres i del Pavelló de la República.

Aquest és un procés ampli i ambiciós, en el que intervenen diversos actors. Des del CRAI Biblioteca de Lletres es proporciona al CEDI el material necessari per fer la digitalització i processar tots els anys dels que el CRAI és responsable. En cas de necessitar contrastar errades de tipus físic, com números arrencats o edicions fetes malbé, els volums del  CRAI Biblioteca del Pavelló de la República esdevenen indispensables per tal de finalitzar íntegrament el procés.

Pel CEDI, el compromís i volum de feina adquirit amb aquest treball ha esdevingut molt important dins els projectes que du a terme. Pel fet que existeixen diferents edicions dels anys que s’estan treballant i el nombre de pàgines augmenta significativament respecte als primers diaris, la tasca de digitalització, revisió i edició dels arxius es realitza amb molta cura i dedicació. Es per això que, per tal d’optimitzar les cerques dins de cada diari i també les de la resta de projectes, s’ha millorat el motor d’OCR (Optical Caracter Recognition) que rebaixa significativament les interferències produïdes per l’estat del paper o les tintes de l’època. D’altra banda, no només es digitalitzen i processen les imatges, deixant-les preparades per a l’accés públic, si no que també es fan tasques de preservació a llarg termini de les imatges màster, per tal de conservar-les per a futures necessitats.

                      

Fins al dia d’avui, el CEDI ha digitalitzat i processat més de 10.000 edicions del diari, aproximadament uns 4.500.000 arxius digitals, que corresponen als anys del 1851 fins al 1867. 

El portal ARCA –liderat per la Biblioteca de Catalunya– des del qual es pot consultar el Diario de Barcelona digitalitzat, és un repositori digital cooperatiu d’accés obert, en el qual hi col·laboren 34 institucions i entitats públiques i privades, que inclou publicacions periòdiques tancades que han estat representatives dins la cultura i la societat catalana.

La resta d’anys del Diario de Barcelona a partir de 1863, (fins al 1867 ja digitalitzats i processats pel CEDI), s’aniran incorporant progressivament al portal.

Amb aquest projecte es pretén posar de cara al públic els més de dos-cents anys de publicacions  de que consta Diario de Barcelona, des de el 1792 fins al 1994.