Revista Española de Documentación Científica 47 (2)
abril-junio 2024, e384
ISSN: 0210-0614, eISSN: 1988-4621
https://doi.org/10.3989/redc.2023.2.1511

ESTUDIOS / RESEARCH STUDIES

Retos y oportunidades en la preservación digital del patrimonio documental. La experiencia de Repsol

Challenges and opportunities in digital preservation of documentary heritage. Repsol’s experience

Leticia de CastroLeal

Universidad Complutense de Madrid, Facultad de Ciencias de la Información
Departamento de Documentación y Biblioteca de Repsol
Grupo de investigación IDEA Lab. (Facultad de Ciencias de la Información. Universidad Complutense de Madrid)

https://orcid.org/0000-0002-2261-1414

Resumen

Todas las medidas destinadas a la prevención del deterioro del patrimonio documental y a garantizar el acceso a su contenido a través de los años se engloban dentro del concepto de preservación digital en donde Repsol, compañía multienergética global, muestra su compromiso e interés tras depositar su patrimonio digital en el Arctic World Archive. Este suceso ha sido posible gracias a la novedosa técnica de grabación digital de datos en alta resolución utilizando el formato de carrete de archivo, facilitado por la empresa Piql. En este documento se recoge tanto el marco teórico relativo a la preservación digital y patrimonio documental, además de un análisis de la novedosa tecnología facilitada por Piql, estado inicial del patrimonio documental de Repsol y el proceso llevado a cabo para la consecución de este proyecto.

Palabras clave: 
preservación digital; patrimonio documental; Repsol; Piql; Arctic World Archive.
Abstract

All measures aimed at preventing the deterioration of documentary heritage and guaranteeing access to its content over the years are included within the concept of digital preservation in which Repsol, a global multi-energy company, shows its commitment and interest after depositing its digital heritage in the Arctic World Archive. This event has been possible thanks to the innovative technique of digital data recording in high resolution using the file reel format, provided by the company Piql. This document includes both the theoretical framework related to digital preservation and documentary heritage, as well as an analysis of the innovative technology provided by Piql, the initial state of Repsol’s documentary heritage and the process conducted to achieve this project.

Keywords: 
digital preservation; documentary heritage; Repsol; Piql. Arctic World Archive.

Recibido: 28-06-23; 2ª versión: 08-09-23; 2ª versión: 03-10-23; Aceptado: 06-10-23; Fecha de publicación: 12-06-2024

Cómo citar este artículo/Citation: Castro Leal, L. de (2024). Retos y oportunidades en la preservación digital del patrimonio documental. La experiencia de Repsol. Revista Española de Documentación Científica, 47 (2), e384. https://doi.org/10.3989/redc.2023.2.1511

CONTENIDO

1. INTRODUCCIÓN

 

El ser humano ha tenido que conservar momentos o hechos para que éstos permanezcan para la posteridad y que las futuras generaciones los conozcan y, lo que es importante, aprendan a partir de dichos sucesos. Durante mucho tiempo, la forma principal de conservar estos hechos fue con la escritura, especialmente en formato papel. Sin embargo, con el paso del tiempo, se han desarrollado nuevas tecnologías que permiten registrar estos hechos.

Empecemos con una breve revisión del concepto patrimonio documental. La UNESCO (2002) define el patrimonio documental como elementos “movibles”; compuestos por signos, códigos, sonidos e imágenes; susceptibles de conservación; reproducibles; y que son producto de un proceso de documentación deliberado (Mkuwira 2015Mkuwira, R. (2015). Preservation of documentary heritage in Malawi. Journal of the South African Society of Archivist, 48, 55-65. Disponible en; https://www.ajol.info/index.php/jsasa/article/view/129272. Fecha de acceso: 24/09/2023.). Otra definición es la de Edmondson (2015)Edmondson, R. (2015). Memory of the World: The Cinema Challenge. Journal of Film Preservation. 15-19. Fecha de acceso: 26/09/2023., que describe el patrimonio documental como aquél que comprende documentos individuales -o grupos de documentos- de valor significativo y duradero para una comunidad, una cultura, un país o la humanidad en general, y cuyo deterioro o pérdida supondría un empobrecimiento perjudicial. Puede que la importancia de un documento solo se ponga de manifiesto con el tiempo. Para cada Estado, su patrimonio documental refleja su memoria y su identidad, y contribuye así a determinar su lugar en la comunidad mundial.

Según Sawant (2014)Sawant, S. (2014). A study on preservation and conservation practices in academic libraries in Mumbai. Annals of Library and Information Studies (ALIS), 61, 2 http://op.niscair.res.in/index.php/ALIS/article/view/4114 [Fecha de consulta: 25/08/2023] la preservación se refiere a actividades relacionadas con el mantenimiento para su uso, ya sea en su forma física original o en otras formas utilizable. Cinco años más tarde, International Federation of Library Associations, (IFLA, 2019IFLA. (2019). Principios para la preservación y conservación de los materiales bibliográficos. Disponible en: https://www.ifla.org/wp-content/uploads/2019/05/assets/pac/ipi/ipi1-es.pdf. Fecha de acceso: 26/08/2023.), la preservación es la suma de las actividades económicas y administrativas necesarias para garantizar la protección del patrimonio documental. Asimismo, el conjunto de medidas precisas para evitar un deterioro ulterior del documento original y que requieren una intervención técnica mínima, es la conservación. Y la UNESCO (2018)UNESCO. (2018). Preservar la información Disponible en: https://es.unesco.org/themes/preservar-información. Fecha de acceso: 24/09/2023., a través del proyecto Memoria del Mundo, pone de manifiesto que “el patrimonio documental del mundo pertenece a todos, debe preservarse y protegerse plenamente para todos y, mediante el debido reconocimiento de las costumbres y los aspectos prácticos de la cultura, debe ser accesible para todos de manera permanente y sin obstáculos.

La preservación está definida en la Norma ISO 13008International Organization for Standardization. (2022). Information and Documentation. Digital records conversion and migration process (13008). https://www.iso.org/standard/75569.html [Fecha de consulta: 27/08/2023]. como: “Los procesos y operaciones realizados para garantizar la permanencia intelectual y técnica de los documentos auténticos a lo largo del tiempo” (p. 8). Ante esto, la preservación digital pretende asegurar el acceso a la información digital a largo plazo, manteniendo la capacidad de consultar y revisar el documento, sin importar su formato.

En cuanto a preservación digital, la UNESCO (2003)UNESCO. (2003). Directrices para la preservación del patrimonio digital. Programa Memoria del Mundo. Disponible en: https://unesdoc.unesco.org/ark:/48223/pf0000130071_spa. Fecha de acceso: 26/08/2023., en su documento “Directrices para preservación del patrimonio digital”, señala que:

La preservación digital puede definirse como el conjunto de procesos destinados a garantizar la continuidad de los elementos del patrimonio digital durante todo el tiempo que se consideren necesarios. La mayor amenaza para la continuidad digital es la desaparición de los medios de acceso. No puede decirse que se han conservado los objetos digitales si, al ya no existir los medios de acceso, resulta imposible utilizarlos.

Boté (2012)Boté-Vericad, Juan José (2012). Propuesta de un modelo de preservación digital para pequeñas y medianas instituciones sanitarias. Tesis Doctoral. Universitat de Barcelona: Dipòsit Digital de la Universitat de Barcelona. Disponible en: http://hdl.handle.net/2445/35867 , Fecha de acceso: 23/09/2023., define a la preservación digital como las técnicas o procesos que son necesarios para conservar en el tiempo objetos digitales en un sistema de información, asimismo, Leija (2017)Leija, D. (2017). Preservación digital distribuida y la colaboración interinstitucional: Modelo de preservación digital para documentos con fines de investigación en universidades de México. Tesis doctoral. Universidad de Barcelona. Fecha de acceso: 27/08/2023. define la preservación digital como una actividad que integra políticas, estrategias y acciones técnicas para mantener los contenidos digitales de forma accesible a lo largo del tiempo. Y para Edmonson (2018)Edmondson, R. (2018). Archivos audiovisuales: filosofía y principios. UNESCO. Disponible en; https://unesdoc.unesco.org/ark:/48223/pf0000264105. Fecha de accesp: 23/09/2023. la preservación digital “es la totalidad de las cosas necesarias para asegurar el acceso permanente -para siempre”.

El auge de la digitalización de documentos en instituciones GLAM (Galleries, Libraries, Archives and Museums), se adoptó como parte de la transformación y solución para crear copias digitales de objetos físicos en las pasadas décadas. No obstante, la implementación de procesos de digitalización masiva de documentos históricos y culturales ha traído consigo nuevos retos en el ámbito digital, como son el almacenamiento seguro, el acceso continuo, la corrupción espontánea, la migración, etc. Algunos de estos retos han generado la necesidad de estandarizar los criterios de digitalización como, por ejemplo, los distintos estándares ISO para la evaluación de equipos de captura (ISO 19264International Organization for Standardization. (2021). Photography. Archiving systems. Imaging systems quality analysis. Part 1: Reflective originals (19264-1). https://www.iso.org/standard/79172.html [Fecha de consulta: 28/08/2023]. Photography - Archiving Systems - Imaging systems quality analysis) o el Modelo de Referencia para un Sistema Abierto de Información Archivística (OAIS) (Viset y otros. 2018Viset Curiaut, A., Mayea Toledo, Y. y Rosabal Espinosa, G. (2018). Preservación a largo plazo de la información digital. Revista Publicando, 5(3). Disponible en; https://core.ac.uk/display/236643986?source=2. Fecha de acceso: 25/08/2023.)”De acuerdo con Hirtle (2008)Hirtle, P. (2008). The history and current state of digital preservation in the United States. En E. Westbrooks y K. Jenkins (ed.), Metadata and Digital Collections: A Festschrift in Honor of Tom Turner, 121-140. CIP (CU Library Initiatives in Publishing. Fecha de acceso: 26/08/2023., la preservación digital tiene más de 20 años de vida como concepto aceptado (desde 1994) y como actividad formal aplicada a la gestión de información y documentación digitalizada y nacida digitalmente en bibliotecas de Norteamérica.

Otro aspecto fundamental para la preservación digital es el proceso de migración; la Norma UNE ISO 18492International Organization for Standardization /TR. (2013). Long-term preservation of electronic document-based information (18492). https://www.iso.org/standard/38716.html [Fecha de consulta: 21/08/2023] la define como el “proceso de transferir información electrónica basada en documentos de un entorno de software/hardware o soporte de almacenamiento a otro entorno o soporte de almacenamiento con poca o ninguna alteración de su estructura, y sin alteración del contenido y contexto” (AENOR, 2016)

Hoy, el colectivo de instituciones de memoria y organizaciones agrupadas en el acrónimo GLAM es pionero en iniciativas con procesos de digitalización, depósito y preservación digital de archivos documentales. Los métodos y técnicas de preservación digital empleadas por este tipo de instituciones mantienen una afinidad de enfoque tecnológico, pues la finalidad es procurar la integridad y autenticidad de objetos digitales (Capilla, 2020Capilla Aledón, G.B. 2020. Patrimonio cultural, archivo digital: una propuesta de futuro. Revista Internacional de Humanidades, 7(1), 37-60. Disponible en: https://cgscholar.com/bookstore/works/patrimonio-cultural-archivo-digital. Fecha de acceso: 04/09/2023.).

Sin embargo, para poder continuar con este estado de la cuestión, es necesario comprobar la existencia de un patrimonio digital y definirlo. Según la UNESCO (2003)UNESCO. (2003). Directrices para la preservación del patrimonio digital. Programa Memoria del Mundo. Disponible en: https://unesdoc.unesco.org/ark:/48223/pf0000130071_spa. Fecha de acceso: 26/08/2023., se conoce como patrimonio digital a «aquellos recursos de carácter cultural, educativo, científico o administrativo e información técnica, jurídica, médica y de otras clases, que se generan directamente en formato digital o se convierten a éste a partir de material analógico ya existente».

El patrimonio documental de Repsol actualmente se encuentra, prácticamente en su totalidad, en formato digital a excepción de los materiales que por derechos de autor no es posible. El patrimonio documental digital engloba cualquier objeto digital como textos, bases de datos, imágenes físicas o en movimiento, grabaciones sonoras, material gráfico, programas informáticos o páginas Web, entre otros.

A menudo estos objetos son efímeros y se requiere para su conservación una meditada labor que comienza en los procesos de producción, mantenimiento y gestión. Muchos de estos materiales revisten valor e importancia duraderos y constituyen por ello un patrimonio digno de protección y conservación en beneficio de las generaciones actuales y futuras. Este legado puede existir en cualquier lengua, en cualquier parte del mundo y en cualquier campo de la expresión o el saber humanos.

Actualmente, existen diferentes iniciativas a nivel autonómico y nacional, como la creación de Ondarenet, el archivo del patrimonio digital vasco, o Padicat, un proyecto de preservación del patrimonio digital de Cataluña (Llueca, 2006Llueca, C. (2006). “Archivando la Web, el proyecto Padicat (Patrimonio Digital de Cataluña)”. El profesional de la información, 15(6), 473-478. Disponible en: https://dialnet.unirioja.es/servlet/articulo?codigo=2150157 [Fecha de consulta: 28/08/2023]), que pretenden salvaguardar y poner a disposición de la ciudadanía el patrimonio digital.

1.1 Tipos de patrimonio digital

 

La definición de patrimonio digital traslada la idea de la cantidad de diferentes elementos recogidos bajo este término y que hace que otros tipos patrimoniales, como el patrimonio audiovisual puedan ser embebidos dentro de este grupo. El patrimonio audiovisual solo se considera oficial desde 1980, cuando UNESCO publica la «Recomendación sobre la salvaguardia y la conservación de las imágenes en movimiento». Que los documentos audiovisuales puedan considerarse documentos modernos, ya que aparecieron a finales del siglo XIX, no significa ventaja porque el soporte material en el que están grabados les da una gran fragilidad, por lo que la falta de información al respecto y los errores en su manipulación son un problema para su preservación. Este patrimonio lo integran los fondos documentales audiovisuales que gestionan y conservan diversos organismos, instituciones, empresas de titularidad pública o privada y colecciones particulares de todo el mundo

Es de esperar que, con el tiempo, aparezcan nuevos tipos de patrimonio digital. Ya se ha podido comprobar la capacidad innovadora de la tecnología a través de formas tan diversas como el tratamiento de textos, el correo electrónico, los sitios web, las bases de datos relacionales, los modelos y simulaciones informáticos, las grabaciones sonoras y vídeos digitales, las imágenes espaciales y los juegos electrónicos.

1.2 Continuidad digital

 

La continuidad del patrimonio digital es absolutamente crucial en cualquier organización, ya que supondrá el legado a conservar, ya sean actuaciones, eventos, resultados de investigación científica u otros contenidos de interés. Para que nada de esto se pierda o distorsione, la continuidad es indispensable: continuidad de producción, continuidad de existencia y continuidad de acceso, que deben alcanzarse a pesar de numerosas amenazas a tener en cuenta:

  • Los soportes usados para almacenar estos objetos digitales suelen ser inestables y se deterioran tras años o décadas.

  • La utilización de los objetos digitales depende de medios de acceso que funcionan de manera específica, tratándose a menudo de combinaciones complejas de equipos y programas informáticos, que suelen dejar de estar vigentes en pocos años y son reemplazados por otros medios de funcionamiento distinto.

  • Los objetos digitales pueden perderse en caso de ocurrir desastres como incendios, inundaciones, averías de los equipos y ataques directos o con virus, que dañan los datos almacenados y los sistemas operativos.

  • Las barreras de acceso (protección con clave, cifrado, dispositivos de seguridad o vías de acceso altamente codificadas) pueden impedir el acceso permanente de manera mucho más restrictiva que la prevista originalmente.

  • Los objetos digitales pueden estar bien protegidos, pero tan mal identificados y descritos que los usuarios no podrán encontrarlos.

En cualquier caso, la clave ante semejantes amenazas pasa por la definición de un plan de contingencia que permita la salvaguarda de este patrimonio.

2. OBJETIVOS Y METODOLOGÍA

 

El objetivo de este artículo es analizar el proceso llevado a cabo por Repsol para preservar su patrimonio documental. En este sentido, se exponen las diferentes opciones que se han barajado para su perdurabilidad, llegando a la conclusión que la opción presentada por la empresa Piql es la que mejor se ajusta a las necesidades de Repsol.

Podríamos determinar que los objetivos fundamentales de este caso de estudio son los siguientes:

  • Describir el patrimonio documental de Repsol.

  • Analizar los nuevos conceptos y técnicas de preservación digital.

  • Describir la técnica de preservación digital de la empresa piql.

El proyecto para realizar la preservación digital del patrimonio documental de Repsol se dividió en dos fases principalmente: Análisis y de Producción.

2.1 El caso y la experiencia en preservación en Repsol.

 

Fase de Análisis (junio 2021 - febrero 2022)

 

En cuanto a la primera fase del proyecto, se crea un equipo de trabajo interno formado por cuatro documentalistas senior que ha valorado los distintos tipos documentales a preservar y que se digitalizarían para una posterior preservación digital. Una fase interna para preparar los documentos a digitalizar teniendo en cuenta la valiosa y extensa colección de tipos documentales conservados en el Archivo del Patrimonio Documental de Repsol.

La colección.

 

Una buena organización es una condición previa indispensable para la preservación documental. La historia de Repsol se remonta a principios del siglo pasado, con la creación en el año 1944 de la Empresa Nacional Calvo Sotelo (ENCASO). A partir de esa empresa hasta lo que hoy se conoce como Repsol ha pasado un siglo y el patrimonio documental conservado por Repsol numeroso y de gran importancia para la historia de los hidrocarburos en España y en los lugares donde opera o ha operado, a saber, Argentina, Canadá, Malasia, Vietnam, etc.

Para Repsol, el patrimonio documental, tanto bibliográficos, publicitarios, audiovisuales como sonoros, se organizan en un sistema de gestión documental donde se registran y se catalogan atendiendo a la naturaleza del documento y de los distintos soportes (Castro Leal, 2008Castro Leal, L. de (2008). El Archivo Histórico de Repsol YPF: creación y digitalización. Revista de la Asociación de Archiveros de la Comunidad de Madrid, 3, 36-45. Fecha de acceso: 25/08/2023.; Castro Leal, 2019Castro Leal, L. de (2019). El Archivo Histórico Fotográfico de Repsol: Creación y Acceso al material fotográfico. Documentación de las Ciencias de la Información, 42, 117-131. DOI: https://doi.org/10.5209/dcin.65270. Fecha de acceso: 26/08/2023.). Basándose en este principio, en Repsol se cataloga dando respuesta a tres interrogantes qué se ha hecho, cuándo se ha hecho y sobre qué soportes. Registrar por tanto la naturaleza y el estado de conservación de los soportes es un aspecto de especial relevancia que garantiza que puedan recuperarse con seguridad.

En el momento de redactar este artículo, el patrimonio documental de Repsol está compuesto por una gran diversidad de materiales, entre los que podemos mencionar, los siguientes:

  • Las publicaciones periódicas, en formato papel y electrónico, se distribuyen por medios diversos, incluida la difusión en línea o en soportes portátiles como los CD o DVD.

  • Las monografías también en soporte papel y electrónico

  • Los documentos de archivo, registros de actividades de cada empresa que originó Repsol.

  • Las herramientas informáticas, como las bases de datos, los modelos, las simulaciones y los programas informáticos.

  • Los documentos inéditos únicos, como informes de investigación.

  • Las obras audiovisuales, sonoras y gráficas, incluyendo las fotografías y banners realizados por medios digitales. Parte de este patrimonio se encuentra incluido dentro de las colecciones del NO-DO1el Noticiario Cinematográfico Español, más conocido como NO-DO..

La correcta identificación -catalogación, registro, etc.- y el control de las colecciones requiere tiempo y disciplina, pero evita pérdidas innecesarias y dobles manipulaciones.

En su tratamiento, dependiendo del tipo de soporte, se segmentan las unidades de información de tal forma que la colección bibliográfica se encuentra accesible para los usuarios de la Biblioteca -física y digital-, los documentos internos forman parte del Archivo, tanto Histórico como de Oficina y hace dos años se ha creado una sección específica para la gestión del patrimonio documental publicitario. Además, existe una pequeña parte de la colección audiovisual que se custodia en el Instituto de la Cinematografía y las Artes Audiovisuales (ICAA).

2.2 Condiciones de almacenamiento.

 

El patrimonio documental de Repsol, en particular en papel, es numeroso y algunos documentos tienen más de un siglo por lo que el almacenamiento de dichos documentos ha sido y es una prioridad para la empresa. La temperatura, la humedad, la luz, los contaminantes atmosféricos, los animales e insectos, la seguridad material, etc. son condicionantes que actúan sobre la vida de los soportes almacenados, en algunos casos a su favor, prolongando su estabilidad y continuidad y, en otros casos, en su contra, ya que perjudican su conservación.

Los requisitos ideales varían considerablemente en función del tipo de material: por ejemplo, el papel, las películas y las cintas de vídeo requieren diferentes niveles de temperatura y humedad idóneos. Lamentablemente, en muchas instituciones no se reúnen las condiciones óptimas para la conservación de documentos de especial interés patrimonial.

A lo largo de la historia de Repsol, producto de la propia dinámica de la institución y del inexorable paso del tiempo, se han padecido circunstancias poco favorables para la conservación del patrimonio documental. Se han sufrido problemas en los tejados, por goteras, ventanas rotas, cimientos poco firmes que han afectado a las condiciones de almacenamiento, etc. Además, no se han considerado los sistemas de detección/extinción de incendios, ni se han previsto otros posibles desastres o acciones relativas a vigilancia ambiental. Todo ello, junto con los inconvenientes mencionados, han obligado a especificar buenas prácticas de gestión y vigilancia para la preservación documental.

Entre estas prácticas, la posibilidad de digitalizar los diferentes documentos ha permitido el uso intensivo de los mismos, conservando los originales en las mejores condiciones posibles y en instalaciones de almacenamiento adecuado. Por otra parte, la multiplicidad de formas de almacenamiento digital ordenado ha permitido que exista seguridad tanto en su acceso como en los aspectos de seguridad informática y ciberseguridad.

2.3 Prevención y conservación

 

La antigua máxima de que «más vale prevenir que curar» es una verdad generalmente admitida en lo que se refiere al patrimonio documental. Una de las principales prácticas que frenan el deterioro y los daños ocasionados por una incorrecta manipulación o, tal y como se ha podido ver anteriormente, por efectos o circunstancias imprevistas, es la conservación preventiva. Si se lleva a cabo esta práctica, la conservación del patrimonio documental resulta ser más eficiente y menos costosa que cualquier procedimiento de recuperación.

Conservar un documento original y proteger su integridad significa que no se pierda la información, y que no se cierre ninguna posibilidad futura de preservación y acceso. Los documentos originales poseen un valor intrínseco que jamás tendrá una copia. Por ello, numerosas instituciones se lamentan de la destrucción prematura de originales tras haber hecho copias que resultaron ser de inferior calidad. Independientemente del número de copias que se hayan realizado y, como una premisa fundamental, tenemos que considerar que jamás deben eliminarse los originales.

La transferencia de contenido -copiar un documento en un formato diferente- es útil y frecuentemente necesario para poder facilitar el acceso al mismo. De hecho, el programa Memoria del Mundo (2002)2el Programa Memoria del Mundo (Memory of the World Programme) es una iniciativa internacional propulsada y coordinada por la Unesco con el objetivo de procurar la preservación y el acceso del patrimonio histórico documental de mayor relevancia en el mundo, además busca promocionar el interés por su conservación entre los estados miembros de la organización. Para más información se puede consultar: https://en.unesco.org/programme/mow., en los años 90, se encargaba de fomentar la identificación única del documento, habitualmente basada en un código numérico, y la microfilmación como medio de preservación y mejora de acceso universal a los documentos, ya que cualquier tipo de copia, como ya se ha indicado, reduce la presión sobre los documentos originales y contribuye a su preservación. Sin embargo, se advertía que el uso de ciertas tecnologías debería realizarse con cautela. A veces, como ha ocurrido con las microfichas, el soporte de copiado quedó obsoleto, lo que implica una importante pérdida de información si no hemos tenido en cuenta la conservación de lectores de este formato. También puede que no se haya previsto la transferencia de estos documentos microfilmados a otros soportes y formatos más actuales. En cualquier caso, la obsolescencia tecnológica tiene importantes riesgos para la preservación y el acceso, además de importantes efectos económicos para las organizaciones, ya que cualquier cambio tecnológico no previsto puede conllevar inversiones no planificadas. Esta misma advertencia resulta válida también para otros métodos, como la reproducción fotográfica, que hayan podido quedar obsoletos.

Se trata, consecuentemente, de no poner en peligro la preservación a largo plazo, para lo que tendremos que hacer una labor previa de vigilancia tecnológica y mantener unos planes de contingencia actualizados que nos permitan actuar con premura ante posibles amenazas inesperadas. No cabe duda, que intentar satisfacer la demanda de acceso a corto plazo siempre es más sencillo y, a veces, una necesidad política, social, científica, etc., pero es un riesgo que debería evitarse en la medida de lo posible. En los casos en que no existe una copia duplicada de acceso, es preferible exponer el documento original lo menos posible para evitar posibles daños irreversibles.

Después del análisis realizado sobre la colección, se llegó a la conclusión que la preservación del patrimonio documental de Repsol, en sus diferentes formatos, implica no solo la conservación del formato original sino también la conversión en formatos digitales accesibles. Acceso que se estaba realizando a través de plataformas integradas para toda la compañía y sistemas de almacenamiento seguros en la nube, tales como, Azure © Microsoft, y AWS © Amazon.

Pero para la elección de los formatos de preservación se debe tener en cuenta no solo la tecnología actual sino también los estándares de aplicación futuros y la posibilidad de disponer de esos equipos de reproducción/conversión en el futuro.

Fase de Producción (junio 2022 - septiembre 2022)

 

Una vez analizada la colección y considerando las condiciones de almacenamiento y conservación de esta, pasamos a la siguiente fase.

Repsol, además de contar con sistema tradicional de archivo documental en papel, ha apostado por la colección en digital y para que ésta se preserve digitalmente, es decir, que una copia de todo el patrimonio documental de la compañía se quede en custodia en instalaciones específicas y ajenas. Esto lo que permite es la recuperación ante posibles catástrofes que se puedan producir en los edificios (incendios, inundaciones, mal estado de las instalaciones) o incluso en caso de colapso de los sistemas informáticos locales. Solo se han digitalizado los materiales que así lo permiten los derechos de autor y enviado dicha copia en custodia ajena. Por tanto, aunque más de 80% del patrimonio documental de Repsol pueda ser considerado como patrimonio documental digital, hay una parte que no puede digitalizarse (en concreto ciertas monografías) por temas de derechos de autor.

Para la consecución de esta fase, una vez identificados los fondos a preservar digitalmente, el grupo de trabajo lleva a cabo un análisis de los principales proveedores que se explicará en el apartado 2.3.1.

Tras finalizar esta tarea, se define la planificación de esta fase, estableciendo la siguiente hoja de ruta:

Esta fase se inicia el 13 de junio de 2022 y se divide en varias subfases lideradas por el proveedor Piql:

  1. Preparación de la documentación y elementos que intervienen en las siguientes fases. Elaboración del documento de diseño de las dos fases en donde se establecen los objetivos y se define tanto el formato de los metadatos, los contenidos y flujos de trabajo. Además, se realizan pruebas sobre los microfilms para comprobar la correcta impresión de la información.

  2. Producción donde el grupo de trabajo le entrega los datos a Piql para la posterior producción de los microfilms y transporte. (todas las actividades relacionadas con este proceso se detallarán en los siguientes apartados).

Finalmente, dos personas del grupo de trabajo vuelan a Noruega para la Ceremonia de Depósito en donde se deposita la información en el Artic World Archive el 14 de septiembre de 2022.

2.3.1 Preservación digital.

 

Para realizar la preservación digital y por tanto garantizar la continuidad digital en Repsol, tras el análisis previamente mencionado, se ha optado por la tecnología utilizada y patentada por el proveedor noruego Piql (Performance Insightful Query Language). Aunque se estudiaron otras alternativas tales como la migración a una única tecnología o el cambio de sistema de gestión documental, la solución, como veremos a continuación, que ofrece Piql y su posterior depósito en el AWA (Arctic World Archive) fue la seleccionada.

El proceso de selección del proveedor se realizó verificando las necesidades de preservación de Repsol, los requisitos técnico-económicos presentes, así como la evaluación de soluciones en un modelo de benchmarking que permitía valorar los diferentes parámetros críticos por comparación y, también, en casos y usos de referencia en instituciones, gobiernos, universidades, etc. de referencia, como los expuestos en Remote Capture: Digitising Documentary Heritage in Challenging Locations (Butterwoth y otros, 2018Butterworth, J., Pearson, A., Sutherland, P., & Farquhar, A. (Eds.). (2018). Remote Capture: Digitizing Documentary Heritage in Challenging Locations. Open Book Publishers. Disponible en: http://www.jstor.org/stable/j.ctv8j3vh [Fecha de consulta 24/09/2023), en el Modelo para la preservación de documentos digitales (Castillo y Alpízar, 2019Castillo Solano, M.G., y Umaña Alpízar, R. (2020). Modelo para la preservación de documentos digitales. Revista Del Archivo Nacional, 83(1-12), 129–182. Disponible en: https://www.dgan.go.cr/ran/index.php/RAN/article/view/453. Fecha de acceso: 23/09/2023.) o en las Directrices para la producción y preservación de objetos digitales de audio (International Association of Sound and Audiovisual Archives, 2011International Association of Sound and Audiovisual Archives (2009). Directrices para la producción y preservación de objetos digitales de audio. Disponible en; https://www.iasa-web.org/tc04-es/la-produccion-y-preservacion-de-objetos-digitales-de-audio. Fecha de acceso: 20/08/2023.).”.a.

Los parámetros principales que considerar para la selección del sistema más viable fueron los siguientes:

  1. Adaptado a la tipología de documentos, volumen, etc. de los que dispone Repsol y previsión de futuro.

  2. Complementario y sinérgico con los medios de almacenamiento de documentación actuales, fundamentalmente en la nube y archivo físico.

  3. Adaptación tecnológica presente y futura, previsible, que permita que en un amplio rango de tiempo la accesibilidad y recuperación esté asegurada.

  4. Seguridad física, de mantenimiento, de accesibilidad y ciberseguridad con la confidencialidad requerida.

  5. Capacidad de acceso, escalabilidad, modularidad e incremento de fondos si fueran necesarios, incluyendo ubicación física del archivo.

  6. Velocidad de recuperación y eficiencia de los procesos.

  7. Coste adecuado ya que es un coste por incurrir a largo plazo.

  8. Cadena de responsabilidad del gestor sobre los fondos asegurada durante el plazo de custodia.

  9. Simplicidad en la gestión y la tecnología para evitar brechas tecnológicas que impidan el acceso.

Todos estos parámetros se evaluaron tanto interna, en lo referente a recursos documentales, tecnologías, requisitos futuros, como externamente, en la modalidad de mantenimiento, seguridad, velocidad de recuperación y coste. Esto permitió establecer un criterio sobre la forma en la que las necesidades se verían cubiertas de manera óptima.

Hay que indicar que además de los requisitos puramente técnicos y económicos, y cómo se adaptan a la realidad de los recursos documentales de Repsol, del que existen múltiples enfoques y tecnologías, también se debe considerar la seguridad que da la experiencia y confianza de otros fondos documentales, como se ha indicado anteriormente.

La importancia de la preservación digital de los recursos documentales hace que sea necesario tener referencias y conocer experiencias previas de los proveedores para que no solo el parámetro de infraestructura técnica o coste actuales se vuelvan críticos. Dado que este tipo de preservación a muy largo plazo presenta problemas de obsolescencia técnica para su gestión y recuperación, integridad física, e incluso supervivencia física de la empresa todos estos parámetros se deben tener en consideración.

En el futuro cuando exista un mercado más desarrollado de soluciones abiertas para estos propósitos probablemente pueda convertirse en una commodity como se ha convertido el almacenamiento en la nube en la actualidad donde unos pocos proveedores: Amazon Web Services (AWS), Microsoft Azure, Google Cloud Platform (GCP), Alibaba Cloud e IBM Cloud que acaparan en 2023 casi el 75% de las necesidades y, por lo tanto, se han homogeneizado y abaratado los costes de los servicios (Pillen, 2023Pillen, D., y Eckard, M (2023). The impact of the shift to cloud computing on digital recordkeeping practices at the University of Michigan Bentley historical library. Archives Science, 23, 65–80. DOI: https://doi.org/10.1007/s10502-022-09395-2. Fecha de acceso: 27/08/2023.).

Figura 1.  Soporte de almacenamiento para preservación
medium/medium-REDC-47-02-e384-gf1.png

La tecnología de este proveedor, seleccionada como acabamos de mencionar por Repsol para la preservación digital de su colección, se basa en un medio de grabación óptica, utilizado para el almacenamiento digital. Se trata de una película de poliéster de 35 mm de ancho recubierta por una cara, con una emulsión de gelatina que contiene cristales de tamaño microscópico de haluro de plata sensibles a la luz. Los haluros de plata se oscurecen cuando se exponen a la luz, y precisamente se utiliza esta característica para exponer datos binarios en fotogramas a lo largo de dicha película. Ambos componentes de la película, el poliéster y la plata, son extremadamente estables, y su durabilidad puede ser de más de 500 años si se almacenan adecuadamente (las recomendaciones de almacenamiento ambiental de la película son 21ºC y 50% HR) (Piql, 2022Piql. (2022). Físicamente presente- preservado para el futuro: Folleto de los servicios. Disponible en; https://piql.prod.simpleness.no/content/uploads/piql_brochure_spanish.pdf. Fecha de acceso: 26/08/2023.).

Para la grabación digital, se utiliza el formato de carrete de archivo (ARF, del inglés Archival Reel Format) que describe la estructura de la película; ésta es una unidad de almacenamiento lineal que incluye un área de almacenamiento, utilizada como su propio nombre indica para almacenar contenidos (visuales o digitales), con algo de material de película adicional en ambos extremos para permitir el montaje en un lector de películas.

Figura 2.  Ejemplo de la estructura de la película en formato ARF
medium/medium-REDC-47-02-e384-gf2.png

Esta área de almacenamiento se divide en una secuencia lineal de fotogramas. Las dimensiones físicas se ajustan a las de las películas de 35 mm definidas en la norma ANSI/SMPTE 139-19963La norma ANSI/SMPTE 139:1996: “SMPTE STANDARD for Motion Picture Film (35mm) es un conjunto de estándares para la identificación única de fotogramas de vídeo o película con un código o secuencia de tiempo.. La estructura de esta película puede verse representada en la Figura 3.

En la cabeza de la película hay una zona de película principal de al menos 130 cm de longitud (denominada frame líder), y otra zona de película corta en blanco de exactamente 6 perforaciones. A continuación, se encuentra la zona de almacenamiento, una secuencia lineal de fotogramas que almacena el contenido. El primer fotograma de esta área de almacenamiento es el fotograma de referencia cero. Al igual que en la cabeza, hay una tira de película en blanco (frame de cola) al final de la bobina de al menos 130 cm.

En cuanto a la estructura de los fotogramas, debemos tener en cuenta que un fotograma es un área rectangular de la película que se utiliza para almacenar contenido digital y analógico. La estructura del fotograma o frame puede verse con mayor detalle en las ilustraciones. (cada fotograma tiene siempre de tres perforaciones).

Figura 3.  Detalle del fotograma
medium/medium-REDC-47-02-e384-gf3.png

Para poder conservar los datos y recuperarlos automáticamente, un fotograma debe estar construido con las cuatro necesidades básicas:

  1. marcas de seguimiento para localizar un fotograma y su contenido.

  2. información específica del fotograma (metadatos del fotograma).

  3. banda de calibración para determinar el rango dinámico de los píxeles utilizados para grabar el fotograma.

  4. el propio contenido.

El fotograma de conservación, utilizado por Repsol, consta de las siguientes secciones:

  • Sección de contenido: zona rectangular, en el centro del fotograma, donde se almacena el contenido con datos digitales o analógicos.

  • Marcas de esquina: Una marca de referencia se encuentra en cada esquina de un fotograma para permitir el seguimiento automático.

  • Bandas legibles para el ser humano: Las bandas de lectura humana son dos áreas rectangulares situadas en los bordes izquierdo y derecha del fotograma. Estas bandas contienen información legible para el ser humano en forma de información visual relacionada con el marco/contenido.

  • Bandas de referencia: Mientras que las marcas de las esquinas localizan el marco, las bandas de referencia localizan al píxel/dato dentro de la sección de contenido.

  • Banda de calibración: La banda de calibración es una zona rectangular situada en la parte superior del fotograma para calibrar los colores y contribuir a la conservación física de la película.

  • Banda de metadatos: La banda de metadatos es un contenedor de datos que almacena la información específica del fotograma necesaria para decodificar el contenido de la sección.

Figura 4.  Detalle del contenido del fotograma.
medium/medium-REDC-47-02-e384-gf4.png

El sistema de archivo (AFS) define el marco lógico que ocupa un frame físico en el medio de almacenamiento y divide el área de almacenamiento en secciones lógicas, donde cada sección contiene uno o más frames como se ha visto anteriormente en la Figura 3.

El primer fotograma del área de almacenamiento, de la película, es el Marco de Referencia Cero (ZRF)4el ZRF es el primer fotograma de contenido en el carrete con índice de fotograma 0. Este fotograma también se repite al final de la bobina. También existe el ZRM que es la marca de referencia cero. El ZRM es una estructura dentro del ZRF fácilmente reconocible por las aplicaciones de visión artificial. Esta marca de referencia permite la detección automática del inicio de la bobina.. El ZRF es un marco vacío con un pequeño parche negro y se encuentra alineado con la primera perforación del marco.

El fotograma de control o frame de control describe, en formato digital, cómo decodificar el resto de la película. Ésta se divide en dos secciones: metadatos administrativos y técnicos.

Los metadatos administrativos contienen una breve descripción del contenido de los datos: el nombre del autor/creador, las fechas de creación, etc. Mientras que los metadatos técnicos contienen la información necesaria para decodificar el contenido de los datos en el resto del volumen AFS. Apunta al marco con la Tabla de Contenido y tiene una descripción del formato de codificación utilizado.

El parámetro ContentType en los metadatos de esta trama será del tipo ControlFrame. El formato digital utilizado para almacenar la trama de control es XML (eXtensible Markup Language). Si al decodificar el marco de control no se conoce el formato de encapsulado, se utilizarán todos los formatos predefinidos, empezando por el más reciente y descendiendo.

Hay diferentes formas de incorporar contenido a esta parte del sistema de archivo de frames (AFS) y concretamente en Repsol se han utilizado los siguientes:

  • Formato de ingestión PDF/A-1. documento que representa el código fuente de un visor de código abierto para PDF y su respectiva documentación (install, readme, etc). El código fuente es compatible con cualquier compilador de C++ y C.

Es un formato de archivo de documentos para su conservación a largo plazo y es un estándar basado en el PDF Reference 1.4 de Adobe Systems Inc. El objetivo de PDF/A-1 es preservar el aspecto visual estático de los documentos electrónicos a lo largo del tiempo, para apoyar el acceso futuro y las futuras necesidades de migración, proporcionando marcos para incrustar metadatos sobre los documentos electrónicos, y definiendo la estructura lógica y las propiedades semánticas de los documentos electrónicos·

  • Especificación del formato del lenguaje C99, documento que describe el formato del lenguaje de programación C99 (ISO/IEC 9899:1999International Organization for Standardization /International Electrotechnical Commission. (2018). Information technology. Programming languages C. https://www.iso.org/standard/74528.html [Fecha de consulta: 21/08/2023]), que es el lenguaje utilizado para escribir el software de descodificación.

  • Código fuente POSIXTAR, documento que representa el código fuente POSIXTAR, necesario para desempaquetar cualquier código fuente distribuido. El formato de archivo TAR es un programa archivador que almacena los ficheros en un único archivo sin compresión. La aplicación ha sido escrita por Piql utilizando las bibliotecas POSIXTAR.

En resumen, en el fotograma de la Información sobre la representación del contenido se enumera todo el contenido conservado en una película Piql y cumple dos funciones: en primer lugar, actúa como un índice que localiza los datos y metadatos conservados por Repsol y, en segundo lugar, define los formatos de archivo conservados en la bobina y la disposición de las páginas dentro de un solo fotograma. Proporciona instrucciones sobre cómo decodificar y convertir los cuadros de datos en archivos digitales. Este documento se añade automáticamente en formato visual a cada rollo durante la preparación.

Aunque se estudiaron otras alternativas tales como la migración a una única tecnología o el cambio de sistema de gestión documental, la solución, como veremos a continuación, que ofrece PIQL y su posterior depósito en el AWA (Arctic World Archive) fue la seleccionada (PIQL, 2022Piql. (2022). Físicamente presente- preservado para el futuro: Folleto de los servicios. Disponible en; https://piql.prod.simpleness.no/content/uploads/piql_brochure_spanish.pdf. Fecha de acceso: 26/08/2023.).

2.4 Seguridad, integridad y autenticidad.

 

Una vez definido el fotograma y la secuencia de éstos, la tecnología desarrollada por Piql incorpora el contenido seleccionado por Repsol, además de otros datos de control mencionados, a esta película para lo cual se partirá del esquema básico de: escribir - procesar - leer.

El contenido se escribe en la película a través de lo que se denomina el procedimiento de writer, donde una máquina que utiliza fotones transfiere los datos al soporte de la película. Tras éste, se pasa al procedimiento processor, donde se fija químicamente la información escrita en la película. Las partículas latentes de haluro de plata expuestas a la luz se convierten en plata metálica y se fijan para garantizar la permanencia de la imagen y se llega, por último, al procedimiento reader, una máquina que lee los fotogramas de la película y los convierte en imágenes muestreadas que se decodifican de nuevo en datos digitales.

Para recuperar los datos de una película, el único componente necesario es la parte reader. Sin embargo, la parte writer desempeña un pequeño papel en el proceso de preservación proporcionando integridad y autenticidad a los datos.

Hay varios elementos tecnológicos en el writer. El elemento tecnológico principal que proporciona fiabilidad a los datos en la película es la tecnología de imagen. La imagen se basa en un sensor de imagen DLP (Digital Lightning Processing) de Texas Instruments5Texas Instruments Inc. (TI) es una empresa tecnológica estadounidense que diseña y fabrica semiconductores. En 1987, TI inventó el dispositivo de procesamiento digital de la luz (también conocido como chip DLP). Para más información se puede consultar su sede web en: http://www.ti.com/ con una resolución de 4K (4096 x 2160 píxeles), compuesto por más de 8.800.000 micro espejos capaces de escribir píxeles de 6μm de tamaño. Los micro espejos DLP se inclinan hacia la fuente de luz (on) o se alejan de ella (off) creando un píxel claro u oscuro en la superficie de la película proyectada. Para la aplicación digital de Piql, cada píxel representaba un contenedor de datos binarios. Esta tecnología de exposición permite escribir píxeles con un excelente contraste, lo que permite alcanzar una alta densidad de datos por fotograma.

El software utilizado para decodificar los datos es de código abierto, está disponible de forma gratuita y se ha probado utilizando varios sistemas operativos.

Después de exponer la película, el valor de los píxeles no puede cambiarse, proporcionando un verdadero medio de almacenamiento WORM (Write Once Read Many). La tecnología de imágenes, combinada con el software y los procesos de producción, hace que el contenido de datos de esta película sea seguro, íntegro y fiable.

Esta tecnología asegura que los datos digitales de Repsol estén protegidos y sean accesibles, independientemente de los avances tecnológicos. Se pone a disposición de Repsol una solución llave en mano que cumple con OAIS6modelo de referencia OAIS (Open Archival Information System) descrito en la norma ISO 14721:2003.; una alternativa segura, accesible y libre de migraciones para la preservación digital. El modelo de referencia OAIS proporciona las directrices para crear un repositorio digital que debe cumplir los criterios de seguridad, integridad, autenticidad y fiabilidad de los datos, tal y como también se indica en elReference model for an open archival information system (OAIS): recommended practice, elaborado The Consultative Committee for Space Data System Practices (CCSDSConsultative Committee for Space Data Systems (CCSDS) (2012), Reference model for an open archival information system (OAIS): recommended practice. Disponible en; http://public.ccsds.org/publications/archive/650x0m2.pdf. Fecha de acceso: 26/08/2023.).

2.4.1 Seguridad.

 

La seguridad de los datos se ha garantizado durante todo el proceso de conservación, desde la ingesta hasta el almacenamiento físico. Al transferir los datos de Repsol al proveedor Piql, se han aplicado mecanismos de transferencia segura. Existen protocolos seguros de transferencia de datos en línea y servicios seguros de transporte físico. Los protocolos de transferencia en línea utilizados son HTTP (HyperText Transfer Protocol) sobre SSL, SSH FTP y VPN seguros. La ventaja de estos protocolos es la capacidad de aprovechar una conexión segura para transferir archivos. El sistema seleccionado fue configurado para trabajar en un entorno de red cerrado.

En cuanto Repsol envió los datos, el proveedor inició un proceso de codificación creando una bobina virtual de imágenes que representan el flujo binario de los archivos. Estas imágenes se envían a una máquina que inicia los procedimientos de writer y processor, anteriormente descritos para ser expuestas en una película y reveladas. A continuación, se verifica la integridad del contenido de los datos y, finalmente, se envían al almacenamiento físico. Tras este último proceso, los archivos se conservan en un soporte fuera de línea que no puede ser pirateado ni manipulado. Como se ha mencionado anteriormente, la película es un soporte de escritura única y lectura múltiple, lo que significa que no es posible modificar el contenido. Las películas se almacenan y protegen en un contenedor personalizado cuyas propiedades de longevidad han sido comprobadas.

2.4.2 Integridad.

 

Esta tecnología está diseñada para evitar cambios involuntarios en la información y garantizar que todos los datos se escriben y recuperan con la mayor integridad posible. La solución implementa la redundancia de datos mediante la aplicación de algoritmos FEC estándar CIRC (Cross-Interleaved Reed-Solomon Coding) utilizados por los medios de almacenamiento tradicionales como CD, DVD, discos Raid, etc (Flores-Fernández et al., 2022Flores-Fernández, C., Gatica Molina, C., González Correa, A., y Núñez Quinteros, T. (2022). Estrategias de preservación digital de archivos sonoros. Revisión sistematizada. Revista Española De Documentación Científica, 45(2), e321. DOI: https://doi.org/10.3989/redc.2022.2.1864. Fecha de acceso: 24/09/2023.).” El algoritmo FEC proporciona redundancia dentro de una trama, de modo que, si una trama se raya o tiene zonas con daños mecánicos, la información puede recuperarse. Los datos también se distribuyen en varias tramas (división de datos), así que se pueden perder tramas enteras y decodificar los datos. Este complemento para proporcionar integridad son las sumas de comprobación. Una suma de comprobación o hash es un dato de pequeño tamaño calculado a partir de un bloque arbitrario de datos digitales para detectar los errores que puedan haberse introducido durante su transmisión o almacenamiento. Las sumas de comprobación SHA-17La suma de comprobación SHA-1 (Secure Hash Algoritwhm 1) se desarrolló originalmente como una función hash criptográfica, pero se utiliza ampliamente para garantizar que los datos no han cambiado debido a una corrupción accidental. En SHA-1, dados 10.000.000.000 de archivos individuales, la probabilidad de colisión es de ~3,4-29. y CRC64 se utilizan para garantizar la integridad de los datos.

El primer paso de integridad en el proceso de preservación es calcular que las sumas de comprobación de datos no han variado de su paquete de archivo antes de ser transferido. Una vez recibido el archivo, se genera la suma de comprobación (SHA-1) para el archivo y se guarda en la base de datos de Piql para la comprobación final de la integridad. Tras la aprobación de la verificación de la transferencia de datos, el archivo se descodifica y se divide en pequeños elementos de información, forma binaria, que caben en un fotograma. Para cada fotograma que se va a escribir, se genera otra suma de comprobación (Cyclic Redundancy Check -CRC64) y se añade a la trama de datos antes de enviarla a la máquina que realiza el procedimiento de escritura (writer).

Hay un último paso de verificación de los datos antes del almacenamiento físico. Después de exponer y procesar el carrete (processor), éste se escanea y en la máquina donde se aloja el lector (reader), las imágenes escaneadas se decodifican de nuevo en archivos digitales. Las sumas de comprobación de los archivos (SHA-1) se calculan y se comparan con las almacenadas en la base de datos. Después de la verificación exitosa, la película se envía al almacenamiento físico (Sablinski y Trujillo, 2021Slablinski, J., y Trujillo, A. (2021). Piql. Long-term preservation technology study. Archeion, 122, 13-32. DOI: https://doi.org/10.4467/26581264ARC.21.011.14491. Fecha de acceso: 26/08/2023.).”.

2.4.3 Autenticidad.

 

Hay varias capas de autenticidad en la película que van desde el soporte físico hasta los datos conservados. El fabricante de la película comprueba la autenticidad del material escribiendo una firma en el borde de cada película. Esta firma de borde se escribe en la zona del margen fuera de las perforaciones y describe ciertos parámetros que proporcionan una imagen precisa de dónde y cuándo se ha fabricado la película. Este equipo especializado colocado en un proceso de producción intermedio dificulta la copia de la firma después de que la película haya salido de la fábrica.

  • Métodos de determinación de la edad: existen métodos mecánicos o no mecánicos aplicados a la película que sirven de reloj para probar la edad de la película. Se ofrecen varias opciones a los clientes, como el análisis del carbono 143 o la firma radiactiva. Estos métodos son opcionales para el cliente y proporcionan una capa adicional de seguridad que garantiza la autenticidad del soporte. El presente documento no abarca estos métodos, solo destaca las opciones que tienen los clientes para probar la autenticidad del soporte.

  • Autenticidad de los datos. Existen tecnologías de firma digital que proporcionan una prueba de autenticidad de los datos. Estos métodos generan un sello de tiempo que es verificado por el cliente. Una vez verificados los datos, se escriben en una película con esta firma digital. Cuando los datos se restauran, la autenticidad de los datos puede probarse utilizando esta firma.

2.5 Proceso de recuperación

 

Dependiendo de si la tecnología actual está disponible o no en el momento en el que se solicita la recuperación de la información, según las indicaciones de Piql, el procedimiento varía.

En el caso de que la tecnología actual está disponible, Repsol puede acceder a los archivos a través de la aplicación del navegador web y el lector (reader), donde se proporcionan todos los parámetros para la decodificación de los fotogramas, su posterior identificación y envío de los mismos.

Si, por el contrario, no se dispone de la tecnología Piql actual, es necesario construir el software de decodificación, decodificar los fotogramas y revisar que se haya asegurado la continuidad digital en los distintos formatos.

3. PRESERVACIÓN Y CONTINUIDAD DIGITAL DEL PATRIMONIO DOCUMENTAL DE REPSOL EN EL ARCTIC WORLD ARCHIVE (AWA)

 

Todo el patrimonio documental histórico y publicitario de Repsol se encuentra depositado en formato digital en el Arctic World Archive (AWA)8para más información pueden consultarse: https://arcticworldarchive.org/ . El AWA es un archivo en el ártico creado en 2017, concretamente en el archipiélago Svalbard, territorio neutral desde 1925. Según el tratado firmado por hasta 45 naciones, este grupo de islas situadas alrededor del paralelo 78, que está bajo la jurisdicción de Noruega, debería quedar fuera de cualquier tipo de conflicto bélico. Además, todos los países firmantes, España es uno de ellos, tienen la opción de convertirse en residentes y acceder a todos los recursos del archipiélago, es decir utilizar el archivo como si estuviera en su propio territorio.

El AWA se encuentra en la denominada Mina 3 (Mine 3) una mina subterránea en condiciones controladas de seguridad y acceso, que es propiedad y está gestionada por Store Norske Gruve 3 AS (SNG3), empresa filial de Store Norske Spitsbergen Kulkompani (SNSK). Las condiciones frías y secas del permafrost, una capa profunda y permanentemente helada del suelo ártico, aumentan la longevidad de los datos almacenados.

Inspirado en el Banco Mundial de Semillas, los primeros documentos recibidos fueron los Archivos Nacionales de Brasil y México, así como del Centro de Recursos Digitales de los Archivos Municipales de Noruega (KDRS).

Figura 5.  Acceso al Artic World Archive (AWA).
medium/medium-REDC-47-02-e384-gf5.png

La tecnología utilizada para almacenar los datos es tan importante como el archivo en sí. La mayoría de los medios de almacenamiento digital tienen una vida útil limitada y el hardware, el software y los formatos de archivo, como se ha comentado, se quedan obsoletos a medida que la tecnología evoluciona.

El AWA utiliza un medio de almacenamiento digital especialmente diseñado que puede mantener los datos vivos durante más de 1.000 años con una accesibilidad en el futuro.

La tecnología puede resistir una exposición electromagnética extrema y ha sido sometida a extensas pruebas de longevidad y accesibilidad.

Las ventajas de esta preservación digital son las siguientes: no es preciso múltiples migraciones o conversiones que pueden deteriorar los documentos o archivos originales, el formato es inalterable a pesar del uso, es accesible, permanente en sistemas que garantizan su integridad hasta quinientos años, flexibilidad en el modo de archivo, recuperación probada y segura.

En el caso de preservación de larga duración es importante que los diferentes formatos de los archivos de texto, imagen, audio, video, etc. sean estándares generales y no modificables, que permitan su recuperación en el futuro, aunque las diferentes tecnologías avancen.

Se han incluido, en este proyecto de preservación digital por parte de Repsol, 42.245 ficheros con un tamaño de 120GiB. De estos ficheros, 1.200 son imágenes y clips de vídeos y, aproximadamente, 36.000 son documentos en formatos pdf, tif y jpg que corresponden a los documentos más antiguos que se conservan en el Archivo del Patrimonio Documental de Repsol. Entre ellos están las escrituras de constitución de las empresas que dieron lugar a Repsol en 1986 así como las primeras campañas publicitarias y patrocinios deportivos. El resto de los ficheros corresponden a ficheros de audio, iconos y páginas web de las campañas publicitarias.

Actualmente se está trabajando en un sistema de gestión documental (SGD) para la recuperación de la información depositada en el AWA. Dicha información se encuentra en las películas descritas a lo largo de este artículo y estará disponible a través de dicho SGD por lo que no será necesario acudir físicamente a las películas para obtener la información.

Figura 6.  Página de inicio del sistema de gestión documental del AWA.
medium/medium-REDC-47-02-e384-gf6.png
Figura 7.  Detalle de los data sets incluidos en el proyecto de Preservación del Patrimonio Documental de Repsol.
medium/medium-REDC-47-02-e384-gf7.png
Figura 8.  Detalle de los data sets incluidos en el proyecto de Preservación del Patrimonio Documental de Repsol.
medium/medium-REDC-47-02-e384-gf8.png

4. CONCLUSIONES

 

Disponer de la información en el momento oportuno, permite una propicia gestión institucional, ahorro de recursos (económico y de tiempo), servicios de calidad y la salvaguarda del patrimonio documental, estas realidades no sólo no cambian en el ámbito digital, sino que se potencian con la velocidad y facilidad de uso de los nuevos soportes.

El avance tecnológico, como catalizador de cambio, hace que nuestra sociedad se transforme aceleradamente y que las instituciones, Repsol, deban adaptarse de manera oportuna, para mejorar sus servicios y ser más eficientes, mediante un sano equilibrio entre continuidad y la transformación.

La tecnología trae ventajas, su uso como soporte de información es una de ellas, sobre todo en lo que se refiere al acceso inmediato y concurrente de los documentos.

La preservación digital representa uno de los desafíos impostergables que enfrenta la sociedad de la información. Aplicar los avances tecnológicos a todas las acciones enfocadas a la preservación y conservación del patrimonio documental, es esencial para poder acceder a toda la información que recogen en un futuro.

Tras el análisis de los elementos a considerar en un proyecto tan significativo para Repsol, es importante no perder el foco en las tendencias actuales de conservación y preservación, manteniendo la seguridad, autenticidad e integridad de los documentos, permitiendo la recuperación de los documentos de forma sencilla. Ya que, nuestras instituciones se impregnan cada vez más de los cambios que trae consigo la revolución tecnológica, a fin de aprovechar sus ventajas.

5. NOTAS

 
1

el Noticiario Cinematográfico Español, más conocido como NO-DO.

2

el Programa Memoria del Mundo (Memory of the World Programme) es una iniciativa internacional propulsada y coordinada por la Unesco con el objetivo de procurar la preservación y el acceso del patrimonio histórico documental de mayor relevancia en el mundo, además busca promocionar el interés por su conservación entre los estados miembros de la organización. Para más información se puede consultar: https://en.unesco.org/programme/mow.

3

La norma ANSI/SMPTE 139:1996: “SMPTE STANDARD for Motion Picture Film (35mm) es un conjunto de estándares para la identificación única de fotogramas de vídeo o película con un código o secuencia de tiempo.

4

el ZRF es el primer fotograma de contenido en el carrete con índice de fotograma 0. Este fotograma también se repite al final de la bobina. También existe el ZRM que es la marca de referencia cero. El ZRM es una estructura dentro del ZRF fácilmente reconocible por las aplicaciones de visión artificial. Esta marca de referencia permite la detección automática del inicio de la bobina.

5

Texas Instruments Inc. (TI) es una empresa tecnológica estadounidense que diseña y fabrica semiconductores. En 1987, TI inventó el dispositivo de procesamiento digital de la luz (también conocido como chip DLP). Para más información se puede consultar su sede web en: http://www.ti.com/

6

modelo de referencia OAIS (Open Archival Information System) descrito en la norma ISO 14721:2003.

7

La suma de comprobación SHA-1 (Secure Hash Algoritwhm 1) se desarrolló originalmente como una función hash criptográfica, pero se utiliza ampliamente para garantizar que los datos no han cambiado debido a una corrupción accidental. En SHA-1, dados 10.000.000.000 de archivos individuales, la probabilidad de colisión es de ~3,4-29.

8

para más información pueden consultarse: https://arcticworldarchive.org/

6. AGRADECIMIENTOS

 

La autora agradece la valiosa ayuda de Rosario Arquero y Gonzalo Marco, profesores titulares de la Universidad Complutense de Madrid y Universidad de Zaragoza respectivamente en el procesamiento de los datos y a Iciar Rivas en la edición gramatical del documento.

7. DECLARACIÓN DE CONFLICTO DE INTERESES

 

El autor de este artículo declara no tener conflictos de intereses financieros, profesionales o personales que pudieran haber influido de manera inapropiada en este trabajo

8. DECLARACIÓN DE CONTRIBUCIÓN A LA AUTORÍA

 

Leticia de Castro Leal: conceptualización, curación de datos, análisis formal, investigación, interpretación, metodología, visualización, y redacción delo borrador original como de la revisión y edición del artículo.

9. REFERENCIAS

 

Asociación Española de Normalización y Certificación. 2008. Conservación a largo plazo de la información basada en documentos, 18492:2008. Disponible en: https://www.une.org/encuentra-tu-norma/busca-tu-norma/norma?c=N0041813. Fecha de acceso: 23/09/2023.

Boté-Vericad, Juan José (2012). Propuesta de un modelo de preservación digital para pequeñas y medianas instituciones sanitarias. Tesis Doctoral. Universitat de Barcelona: Dipòsit Digital de la Universitat de Barcelona. Disponible en: http://hdl.handle.net/2445/35867 , Fecha de acceso: 23/09/2023.

Butterworth, J., Pearson, A., Sutherland, P., & Farquhar, A. (Eds.). (2018). Remote Capture: Digitizing Documentary Heritage in Challenging Locations. Open Book Publishers. Disponible en: http://www.jstor.org/stable/j.ctv8j3vh [Fecha de consulta 24/09/2023

Capilla Aledón, G.B. 2020. Patrimonio cultural, archivo digital: una propuesta de futuro. Revista Internacional de Humanidades, 7(1), 37-60. Disponible en: https://cgscholar.com/bookstore/works/patrimonio-cultural-archivo-digital. Fecha de acceso: 04/09/2023.

Castillo Solano, M.G., y Umaña Alpízar, R. (2020). Modelo para la preservación de documentos digitales. Revista Del Archivo Nacional, 83(1-12), 129–182. Disponible en: https://www.dgan.go.cr/ran/index.php/RAN/article/view/453. Fecha de acceso: 23/09/2023.

Castro Leal, L. de (2008). El Archivo Histórico de Repsol YPF: creación y digitalización. Revista de la Asociación de Archiveros de la Comunidad de Madrid, 3, 36-45. Fecha de acceso: 25/08/2023.

Castro Leal, L. de (2019). El Archivo Histórico Fotográfico de Repsol: Creación y Acceso al material fotográfico. Documentación de las Ciencias de la Información, 42, 117-131. DOI: https://doi.org/10.5209/dcin.65270. Fecha de acceso: 26/08/2023.

Consultative Committee for Space Data Systems (CCSDS) (2012), Reference model for an open archival information system (OAIS): recommended practice. Disponible en; http://public.ccsds.org/publications/archive/650x0m2.pdf. Fecha de acceso: 26/08/2023.

Edmondson, R. (2015). Memory of the World: The Cinema Challenge. Journal of Film Preservation. 15-19. Fecha de acceso: 26/09/2023.

Edmondson, R. (2018). Archivos audiovisuales: filosofía y principios. UNESCO. Disponible en; https://unesdoc.unesco.org/ark:/48223/pf0000264105. Fecha de accesp: 23/09/2023.

Flores-Fernández, C., Gatica Molina, C., González Correa, A., y Núñez Quinteros, T. (2022). Estrategias de preservación digital de archivos sonoros. Revisión sistematizada. Revista Española De Documentación Científica, 45(2), e321. DOI: https://doi.org/10.3989/redc.2022.2.1864. Fecha de acceso: 24/09/2023.

Hirtle, P. (2008). The history and current state of digital preservation in the United States. En E. Westbrooks y K. Jenkins (ed.), Metadata and Digital Collections: A Festschrift in Honor of Tom Turner, 121-140. CIP (CU Library Initiatives in Publishing. Fecha de acceso: 26/08/2023.

IFLA. (2019). Principios para la preservación y conservación de los materiales bibliográficos. Disponible en: https://www.ifla.org/wp-content/uploads/2019/05/assets/pac/ipi/ipi1-es.pdf. Fecha de acceso: 26/08/2023.

International Association of Sound and Audiovisual Archives (2009). Directrices para la producción y preservación de objetos digitales de audio. Disponible en; https://www.iasa-web.org/tc04-es/la-produccion-y-preservacion-de-objetos-digitales-de-audio. Fecha de acceso: 20/08/2023.

International Organization for Standardization. (2022). Information and Documentation. Digital records conversion and migration process (13008). https://www.iso.org/standard/75569.html [Fecha de consulta: 27/08/2023].

International Organization for Standardization. (2021). Photography. Archiving systems. Imaging systems quality analysis. Part 1: Reflective originals (19264-1). https://www.iso.org/standard/79172.html [Fecha de consulta: 28/08/2023].

International Organization for Standardization /International Electrotechnical Commission. (2018). Information technology. Programming languages C. https://www.iso.org/standard/74528.html [Fecha de consulta: 21/08/2023]

International Organization for Standardization /TR. (2013). Long-term preservation of electronic document-based information (18492). https://www.iso.org/standard/38716.html [Fecha de consulta: 21/08/2023]

Leija, D. (2017). Preservación digital distribuida y la colaboración interinstitucional: Modelo de preservación digital para documentos con fines de investigación en universidades de México. Tesis doctoral. Universidad de Barcelona. Fecha de acceso: 27/08/2023.

Llueca, C. (2006). “Archivando la Web, el proyecto Padicat (Patrimonio Digital de Cataluña)”. El profesional de la información, 15(6), 473-478. Disponible en: https://dialnet.unirioja.es/servlet/articulo?codigo=2150157 [Fecha de consulta: 28/08/2023]

Mkuwira, R. (2015). Preservation of documentary heritage in Malawi. Journal of the South African Society of Archivist, 48, 55-65. Disponible en; https://www.ajol.info/index.php/jsasa/article/view/129272. Fecha de acceso: 24/09/2023.

Pillen, D., y Eckard, M (2023). The impact of the shift to cloud computing on digital recordkeeping practices at the University of Michigan Bentley historical library. Archives Science, 23, 65–80. DOI: https://doi.org/10.1007/s10502-022-09395-2. Fecha de acceso: 27/08/2023.

Piql. (2022). Físicamente presente- preservado para el futuro: Folleto de los servicios. Disponible en; https://piql.prod.simpleness.no/content/uploads/piql_brochure_spanish.pdf. Fecha de acceso: 26/08/2023.

Sawant, S. (2014). A study on preservation and conservation practices in academic libraries in Mumbai. Annals of Library and Information Studies (ALIS), 61, 2 http://op.niscair.res.in/index.php/ALIS/article/view/4114 [Fecha de consulta: 25/08/2023]

Slablinski, J., y Trujillo, A. (2021). Piql. Long-term preservation technology study. Archeion, 122, 13-32. DOI: https://doi.org/10.4467/26581264ARC.21.011.14491. Fecha de acceso: 26/08/2023.

UNESCO. (2003). Directrices para la preservación del patrimonio digital. Programa Memoria del Mundo. Disponible en: https://unesdoc.unesco.org/ark:/48223/pf0000130071_spa. Fecha de acceso: 26/08/2023.

UNESCO. (2018). Preservar la información Disponible en: https://es.unesco.org/themes/preservar-información. Fecha de acceso: 24/09/2023.

UNESCO. (2010). Safeguarding the documentary heritage of humanity. https://unesdoc.unesco.org/ark:/48223/pf0000187733 [Fecha de consulta 24/09/2023]

Viset Curiaut, A., Mayea Toledo, Y. y Rosabal Espinosa, G. (2018). Preservación a largo plazo de la información digital. Revista Publicando, 5(3). Disponible en; https://core.ac.uk/display/236643986?source=2. Fecha de acceso: 25/08/2023.