Los datos masivos o big data recopilados a través de distintas herramientas tecnológicas o extraídos de grandes colecciones de información en distintos formatos son capaces de generar nuevo conocimiento en los sectores más diversos, pero, a la vez, plantean problemas tanto de titularidad como de su uso posterior. El estudio analiza el concepto de análisis de datos, los distintos tipos de datos y su posible regulación, presentando un panorama sobre cómo en los últimos años los países más avanzados en apertura de datos han comenzado a aplicar unos esquemas de licencias abiertas que remueven los obstáculos legales para incorporar estos tipos de datos a la creación de nuevo conocimiento. La investigación realizada muestra cómo distintos gobiernos y otras corporaciones y organismos internacionales productores de datos públicos han encontrado en estas licencias —en particular, las modalidades PPDL y CC0 en las que se renuncia a todos los derechos sobre las bases de datos— un mecanismo adecuado para favorecer el uso y reutilización de estos grandes volúmenes de datos.
El uso de los datos se intensifica cada año. Estos datos sirven para ayudar en soluciones tan diversas como en el diagnóstico de daños cerebrales, a encontrar el lugar ideal para la instalación de parques eólicos, a evitar la congestión del tráfico o a prever el rendimiento de los cultivos en países en desarrollo (Comisión Europea,
La eclosión de estos datos masivos recopilados a través de diferentes métodos y herramientas tecnológicas (tratamiento masivo de textos y datos de todo tipo, sensores, satélites, cámaras…) da lugar a nuevas actividades mediante las cuales se analiza la información resultante para obtener nuevo conocimiento de todo tipo (McKinsey Global Institute,
El contenido del artículo está estructurado en las siguientes partes:
El concepto de análisis de contenido o minería de datos.
Protección legal de los datos.
Aplicación de las licencias libres a los datos públicos abiertos.
Conclusiones.
Los objetivos fundamentales de la investigación son los siguientes:
Analizar los nuevos conceptos y técnicas de tratamiento de los datos mediante los cuales se obtienen nuevas posibilidades de uso y reutilización para generar nueva información y conocimiento.
Estudiar las características básicas de las bases de datos y sus formas de protección por derechos de autor. La revolución de los datos pone de relieve la necesidad de abordar transformaciones en su marco regulatorio (en particular, en las bases de datos y las licencias), de modo que las bases de datos sean fácilmente consultables para cualquier propósito.
Determinar las licencias que mejor se adecúan a la puesta a disposición de los datos abiertos organizados para su reutilización en forma de bases de datos.
Examinar los tipos de licencias que emplean los portales gubernamentales mejor considerados a nivel internacional y las condiciones de reutilización de los datos públicos accesibles.
Contrastar y comparar el uso de las licencias estándar y compatibles para determinar que licencias se adaptan mejor a la oferta de datos públicos abiertos.
Con este propósito, se ha llevado a cabo una pormenorizada búsqueda en los portales gubernamentales de once países (los diez primeros más España, 13º) que están entre los más avanzados en la apertura de datos, conforme a los resultados del Open Data Barometer (WWW Foundation,
Además del apartado empírico, este trabajo también se nutre de la experiencia obtenida en diversos proyectos, así como de estudios y trabajos sobre activos de información en el ámbito de los datos y contenidos abiertos llevados a cabo por el grupo de investigación Publidoc-UCM desde 2006 (MHAP,
La minería de datos es el término más tradicional para designar el uso de tecnología y arquitectura diseñadas para detectar información procesable y así obtener rendimiento económico y social del gran volumen de información depositado en bases de datos y que es accesible directamente o través de Internet, ámbito conocido como datos masivos o Big Data
Frente a un concepto más clásico que se centraba sólo en la minería sobre los datos, las nuevas capacidades tecnológicas permiten incluir textos, imágenes, figuras y todo tipo de materiales digitales o elementos documentales, lo cual ha conducido a una pérdida de valor del concepto original y al surgimiento de denominaciones alternativas a minería de datos, tales como minería de textos, minería de contenidos, análisis de datos…
De tal modo que, en primer lugar debemos sistematizar los elementos que integran el concepto que ahora se conoce como análisis de datos o minería de contenidos:
La minería de datos es una técnica computacional que permite cruzar variables en un entorno informático para descubrir nuevo conocimiento a partir de la información contenida en las bases de datos. De una forma más precisa, “la minería de datos es un conjunto de técnicas, métodos y algoritmos que permiten extraer información útil desde fuentes de distinto tipo”, señala Mendoza (
En cuanto a la tipología de los datos, Hand y otros (
Por su parte, la minería de textos es una actividad de más reciente aparición, surge con los procesos de digitalización masiva iniciados en 2004 con el proyecto Google Books, razón por lo que el término ha recibido menos atención que la minería de datos (Truyens y Van Eecke,
Algunos autores (Triaille y otros,
Por su parte, la expresión minería de contenidos es la preferida por otros autores (Guadamuz y Cabell,
Como se observa, esta nueva actividad es el resultado de la capacidad de análisis que proporcionan los grandes sistemas de información, haciendo posible la obtención de nuevo conocimiento a partir del análisis de grandes volúmenes de datos. Desde el punto de vista legal, este nuevo fenómeno debe de ser estudiado en el marco regulatorio de las bases de datos. Es decir, las recopilaciones de obras, de datos o de otros elementos independientes dispuestos de manera sistemática o metódica y accesibles individualmente por medios electrónicos o de otra forma, es la realidad sobre la que se asienta toda esta actividad de análisis de datos que es nuestro objeto de estudio.
En sí mismo, el dato es un componente que aislado no tiene ningún significado (Mendo y otros,
Como resulta evidente, todos los datos para su tratamiento y gestión automatizada están organizados en conjuntos o bases de datos, aspecto esencial para determinar las posibilidades de acceso y uso de la información allí contenida. La legislación europea (Parlamento Europeo,
Asimismo, están protegidas las bases de datos que no cumplen el requisito de la originalidad, pero en las que se ha realizado una inversión sustancial, ya sea financiera, de esfuerzo o de tiempo, para la “obtención, la verificación o la presentación de dicho contenido”(art. 7), es lo que la Directiva europea denomina bases de datos
De acuerdo a la definición y al contenido de la información de dichas bases de datos, podemos establecer las cuatro categorías que se especifican a continuación, si bien una misma base de datos puede tener protección jurídica en una o varias de esas categorías, aspecto a tener en cuenta en cuanto a su acceso, consulta y uso. Es especialmente relevante que las condiciones de la licencia seleccionada se adecúen al uso o reutilización pretendidos.
Como decíamos más arriba, la protección de los derechos de autor se refiere a su estructura en cuanto forma de expresión o disposición de los contenidos, sin alcanzar a estos. Lo que se protege es la selección o disposición de tales contenidos, con independencia de éstos, ya sea por su diseño, formato o la sistemática de las anotaciones u ordenación de los elementos. Asimismo, los contenidos pueden estar también protegidos, en el caso de que por sí mismos constituyen obras protegibles (por ejemplo, un artículo académico incorporado a una base de datos científica). Sólo podrá consultarse sin autorización del autor con fines de ilustración de la enseñanza o de investigación científica, en la medida justificada, sin fines comerciales e indicando la fuente.
El segundo tipo de bases de datos mencionado en la Directiva de 1996, se refiere a las bases de datos “no originales” (López,
Como se ha señalado desde el lado latinoamericano, al igual que desde otros países y posiciones, el principal argumento en contra de la protección de las bases de datos fácticas no es que proteja las bases de datos en sí mismas, sino “la información en ellas contenida, con el consiguiente riesgo de que se establezcan límites a la circulación de aquella, incluso de la que hasta el presente se mantiene en el dominio público” (López,
Además de estas críticas en contra del monopolio que suponen estas bases de datos, ha surgido también un movimiento igualmente poderoso a favor del libre uso de la información bajo el presupuesto de que su uso abierto y generalizado fomenta el bienestar social y crea riqueza.
Los datos públicos existentes en organismos públicos de la Unión Europea tienen un tratamiento específico en virtud de las Directivas de reutilización de información del sector público de 2003 y 2013, en las que se prevé la puesta a disposición del público para la reutilización de sus documentos “cualquier contenido sea cual sea el soporte (escrito en papel o almacenado en forma electrónica o como grabación sonora, visual o audiovisual —art. 2.3—)” conservados por organismos del sector público para fines comerciales o no comerciales. El principio general es la libre puesta a disposición de tales contenidos, en caso de aplicar alguna tarifa, ésta “se limitará a los costes marginales en que se incurra para su reproducción, puesta a disposición y difusión” (art. 6.1)
La información del sector público es tradicionalmente el principal proveedor de información sistematizada, estructurada y de buena calidad en la mayoría de los sectores (información geoespacial, meteorológica, catastral, etc.). Desde la década de los noventa del siglo XX esta información fue objeto de atención especial ante la visión de que en una sociedad basada en la información, la generada en el sector pública iba a ser una materia prima esencial para la innovación y el crecimiento económico (Comisión Europea,
Entonces, el panorama era muy distinto a un lado y otro del Atlántico, mientras que en Estados Unidos la Ley de Libertad de Información (U.S. Department of Justice,
El procedimiento que se pretende generalizar es el de acceso a través de licencias abiertas para permitir el libre uso de los datos, es decir, “el dato es legalmente abierto cuando o bien está en dominio público o con una licencia que permite el uso y reutilización comercial y no comercial sin restricciones”, tal como señala la Guía de datos abiertos de la ONU (
Estas bases de datos, como su nombre indica, contienen datos referidos a las personas
Como queda explicado, el acceso, uso y posible reutilización de la información contenida en las bases de datos está regulado por las leyes, así como mediante contratos y/o licencias. Las licencias de información
El debate sobre el acceso y uso de la información en Internet, es decir, qué tipo de protección de derechos de autor deben tener los contenidos, se ha extendido también a si deben estar protegidas las bases de datos en las actividades de minería de datos. Las posiciones no son muy diferentes a las que existen en torno al acceso abierto y al acceso comercial en los contenidos protegibles por derechos de autor; sin embargo, en el aspecto concreto del análisis de datos parece abrirse paso una excepción a los derechos de autor en favor de permitir ciertos usos, al menos los que tienen por finalidad la investigación.
Por lo descrito hasta ahora resulta difícil encontrar una base de datos cuyo acceso no pueda ser restringido por su titular, pues aun en los casos en que sean contenidos que están en dominio público o datos del sector público, sus recopiladores pueden ejercer la titularidad en base a la inversión económica efectuada, baste pensar en las colecciones digitales como Google Libros, u otras muchas colecciones digitales de las bibliotecas en donde aparece con frecuencia el símbolo de protección de los derechos de autor (©). De modo más rotundo, Truyens y Van Eecke (
Una cuestión clave en el debate sobre el análisis de datos es si los autores deberían estar autorizados a prohibir el uso de una obra para un propósito diferente al de la creación original, por ejemplo, en los casos en que 100 horas de grabaciones o de mil novelas que sean tratadas para analizar aspectos tales como la imagen de la mujer, el grado de uso de una tecnología o el vocabulario o la sintaxis empleada en un grupo social. La solución es difícil que sea concluyente, en un primer momento la respuesta debería de ser negativa porque los derechos de autor protegen la expresión creativa, mientras que el análisis de datos de cada obra constituye una materia prima (
En este contexto se ha abierto un debate en Europa y en otras partes del mundo sobre si es posible la introducción de una excepción legal en el ámbito de la propiedad intelectual en las actividades de análisis de datos asegurando un equilibrio de los diferentes intereses implicados. La excepción ya está en aplicación o en estudio en algunos países (Japón o Reino Unido).
Un estudio muy sólido encargado para la Comisión Europea (Jean Paul Triaille y otros,
La introducción de una excepción legal para permitir una utilización menos restringida de los datos ofrecería seguridad, sin embargo, esa solución es lenta, más en el entorno de la Unión Europea, en donde a la aprobación de las directivas hay que sumar otro período de aplicación en cada país. Por el contrario, las licencias de información ofrecen una solución sencilla en la circulación por Internet de contenidos protegidos por derechos de autor. La aparición en 2003 de Creative Commons y en 2004 de Open Knowledge Foundation (Murray-Rust,
Como es sabido, mediante estas licencias abiertas o libres (Liang,
Señaladamente, en el ámbito del tratamiento de los datos científicos, un gran número de organizaciones del sector han optado por poner los datos y bases de datos a libre disposición de la comunidad científica mediante este tipo de licencias (Hrynaszkiewicz y Cockerill,
A continuación, reseñamos las características más relevantes de estos dos grupos de licencias en el uso de los datos abiertos:
Dentro del conjunto de licencias de Creative Commons (Ramos,
En el ámbito de las licencias Creative Commons los otros dos tipos de licencia que se usan con frecuencia en la apertura de datos son la licencia CC-BY (Reconocimiento) y CC-SA (Compartir igual). En la primera, el titular de los datos exige que se reconozca su titularidad. En la segunda, CC-SA, el titular permite reutilizar y compartir los datos con tal de que la distribución de esos datos resultantes se haga con la misma licencia. Estas dos licencias no son específicas para compartir bases de datos
La familia de licencias Open Data Commons (ODC), fue creada en 2006 a partir de un borrador elaborado por Talis Platform (Miller; Styles; Heath,
Public Domain Dedication and License (PDDL) — “Public Domain for data/databases”. La licencia es, como la licencia CC0, una cesión al dominio público, mediante la cual el titular de los derechos de autor ofrece la obra al beneficio público y renuncia a los derechos de autor y derechos
Attribution License (ODC-By) — “Attribution for data/databases”. La licencia permite a los usuarios compartir libremente, modificar y usar la base de datos con el único requisito de atribuir la paternidad de la obra, libre de derechos, no exclusiva por todo el tiempo que dure la protección de la base de datos, con derecho de extracción y reutilización de la base de datos. La base de datos puede estar protegida por otros derechos que no están contenidos en la licencia (datos personales, contratos privados o marcas…), asimismo recoge la renuncia a los derechos morales del titular. Es similar a la CC-BY (Reconocimiento de la autoría).
Open Database License (ODC-ODbL) — “Attribution Share-Alike for data/databases”. La licencia es la tercera de las opciones y su finalidad es permitir a los usuarios compartir libremente, modificar y usar la base de datos manteniendo esa misma libertad para otros usuarios, es decir, con cláusula “copyleft”. Por lo demás, la licencia es similar a la anterior en cuanto cobertura temporal y derechos de acceso y uso de la base de datos, no afectando los contenidos individualmente. Esta licencia también es muy parecida a la licencia CC-SA, de modo que las obras derivadas deben disponer de la misma licencia para compartir las obras.
Al igual que en el ámbito científico, en el sector público se toma conciencia de que la información es una fuente de progreso y riqueza, de ahí la necesidad de poner a disposición de los ciudadanos y de las empresas la información y datos generados por el sector público. Si la Unión Europea, como mencionamos arriba, ya había adoptado en 2003 la Directiva de reutilización de información del sector público (modificada en 2013), la OCDE adoptó sendos documentos para impulsar el uso de datos abiertos en todos los países miembros (OCDE,
Interesa subrayar la recomendación que incide en favorecer las condiciones de acceso y transparencia en la reutilización, “haciendo disponible y desarrollando un sistema de licencias automatizadas en línea para dar cobertura a la reutilización cuando se aplican licencias, teniendo en cuenta los derechos de autor”. En este sentido se recomienda favorecer la reutilización para facilitar su acceso y uso, incluyendo mecanismos de licencias sencillas para hacer las obras ampliamente accesibles al público.
De hecho, a partir de 2009, coincidiendo con la declaración de Obama sobre datos abiertos (The Obama Administration’s…
Información accesible en Internet.
En formatos procesables electrónicamente.
Licencia abierta que permita la reutilización comercial.
Libre de cargas y sin restricciones de reutilización.
De tal modo que las Licencias para un “Gobierno abierto” se asientan sobre estos principios básicos “Open Government”, tal como la impulsada por el gobierno británico (HM Government,
Libertad para copiar, publicar, distribuir y transmitir información.
Adaptar la información.
Hacer uso comercial, combinarla con otras informaciones o incluirla en los propios productos o aplicaciones.
Con la obligación básica de incluir la fuente de información y la licencia empleada.
En este contexto, en la
A pesar de la variedad de situaciones se aprecia una clara tendencia en el predominio de la aplicación de las licencias libres cuyas características reseñamos en el epígrafe anterior. Aunque todavía falte mucho camino por recorrer en la homogeneización de los requisitos para el acceso a los datos y su reutilización —como demuestra con mucha precisión Morando (
Algunos informes nacionales de los organismos de datos abiertos, como el de Holanda, reconocen el liderazgo indiscutible que ejercen en esta materia Reino Unido y Estados Unidos, por cuanto hacen disponibles los datos en un portal nacional lo cual resulta adecuado para un gobierno abierto y transparente. En esta cuestión sobrevuela el debate de si la apertura de datos y la libertad de información son dos aspectos complementarios o en competencia. Sobre este aspecto, diversos análisis realizados en el ámbito europeo ponen de relieve que la apertura de datos repercute en las solicitudes de información en base a las leyes de transparencia, ya que si los gobiernos gestionan bien la información los costes de cada petición bajarán. En el mismo sentido, cuanto mayor es el coste de un servicio público mayor resulta el impacto que produce la transparencia y apertura de datos en ese servicio, según se pone de relieve en el informe holandés (Open Data Trend Report,
Los resultados revelan algunos aspectos peculiares en cuanto a las licencias y el uso de los datos:
La licencia del gobierno británico sobre datos abiertos es la piedra angular que ha servido de referencia a todos los gobiernos, como se reconoce ampliamente y se recoge en el cuadro.
El número de reutilizadores de información pública es muy escaso todavía, tal como ponen en evidencia algunos datos, por ejemplo, en Francia.
Asimismo, la oferta de datos públicos, aunque crece a buen ritmo, es desigual y la calidad de los mismos es mediana (Francia, Holanda, Dinamarca, España). Como se pone de manifiesto en la excelente página de ayuda que contiene el portal francés, a veces se deben extraer los datos de documentos cerrados (en pdf o de tabulaciones en páginas web).
Hay muchos organismos públicos que no ofrecen datos abiertos, como también se desprende de los datos manejados.
En el aspecto positivo, con respecto a hace unos años (Ramos y otros,
Cada vez son más populares los encuentros para avanzar en la mejora de los datos y su reutilización (
Como se observa en la
Parece interesante señalar la diferencia entre las versiones 3.0 y 4.0 de la licencia Creative Commons. Frente a las versiones anteriores que permitían adaptaciones nacionales y generaban confusión sobre si quedaba licenciado el uso de las bases de datos no originales, la versión 4.0, lanzada en 2013, considera expresamente incluidos en la licencia tanto la información como los datos protegidos por derechos de autor o por el derecho sui generis sobre bases de datos vigente en la Unión Europea y otros países (
Mención aparte merece la puesta a disposición de la información y datos que hacen los portales de los gobiernos estadounidense y sueco. En la página dedicada al uso de los datos se pone muy de relieve que los datos del Gobierno de Estados Unidos se ofrecen, en dominio público, sin ninguna reserva de derechos, situación preferible a la información licenciada. Al abordar la compatibilidad se indica que las licencias CC0 y PDDL son muy similares, ambas son una renuncia a los derechos sobre los contenidos y allí donde no sea de aplicación la renuncia, permite una plena reutilización. En cambio, “
La investigación pone de relieve que los portales gubernamentales adoptan licencias por defecto compatibles con declaraciones internacionales sobre gobierno abierto o licencias libres estándar de uso internacional (Creative Commons y Open Data Commons) que permiten acceder y usar los datos en distintas modalidades con un mecanismo relativamente sencillo. Muchas de estas iniciativas asumen unos principios básicos que permiten la transformación de los datos, sin más requisitos que la cita de la fuente, e incluso se abren paso las licencias orientadas al libre flujo de datos y metadatos, más próximas al concepto de dominio público, como PPDL y CC0. El uso de estas licencias facilita el libre flujo de datos y su reutilización. Sin embargo, será necesario avanzar también en el uso de metadatos y en la expresión de derechos en Internet, puesto que en este aspecto la asignación de derechos y la combinación de contenidos (por ejemplo, que haya distinta licencia para los datos y el texto de un artículo), se convierte en un asunto de cierta complejidad tecnológica, pues hay que aplicar un lenguaje de derechos para cada tipo (REL, por sus iniciales en inglés). (Abelson y otros,
El concepto tradicional de minería de datos realizado sobre las bases de datos se ha extendido al análisis de textos, datos e imágenes, tratamiento que ahora se realiza sobre datos masivos o macrodatos (big data), de modo que estas actividades son conocidas como análisis de datos o análisis de contenido, fundamentales en todos los sectores sociales y económicos por cuanto son muy eficaces para analizar pautas históricas y, a partir de ahí, diseñar modelos y respuestas.
La gestión de estos grandes volúmenes de datos debe ser puesta en relación con su posible colisión con algunos derechos. Se suele afirmar que salvo en los datos en dominio público, el análisis de datos puede afectar a los derechos de los autores o de los titulares de las bases de datos no originales. Si bien los argumentos en torno a la protección de los datos por su originalidad son bastante débiles, la protección de tales bases datos por razón de la inversión o el esfuerzo realizado supone que todas las bases de datos cuenten con algún tipo de protección legal, así sucede en todo el ámbito de la Unión Europea.
La cuestión clave en el debate sobre los datos y la autoría es dirimir si los autores deberían estar autorizados a prohibir el uso de una obra para un propósito diferente al de la creación original, en donde no se analiza la creatividad o la forma de expresión de las ideas sino, simplemente, a partir de grandes volúmenes de estos contenidos (grabaciones, novelas…) se obtienen datos de utilidad social y comercial que no están directamente relacionados con la actividad creativa. Por ahora el acceso a estos grandes volúmenes de datos muy demandados, sólo puede hacerse mediante la aprobación de una excepción a los derechos de los autores, o bien mediante el uso de licencias de acceso a dichos datos. El debate está muy condicionado por la evolución constante de la tecnología.
Por su parte, el uso de licencias de información resulta, en principio, una solución más fácil y práctica. Sin embargo, algunos estudios ponen de relieve que en muchos casos no se explicita la vía de acceso a las bases de datos y cuando sí existe no siempre la licencia resulta adecuada a los datos, por lo cual se aboga por una simplificación de las licencias y cesiones de los datos, así como por la formación de usuarios y proveedores, así como por modificar hábitos seculares (Boustany,
Por último, aunque sea desde una perspectiva muy subjetiva, en el caso de los portales gubernamentales de datos abiertos se pone de relieve una clara evolución en estos últimos años desde unos términos de uso con declaraciones muy heterogéneas entre sí a la situación actual, algo más sencilla centrada en el uso de una licencia de datos abiertos por defecto. Pero no perdamos de vista que los conjuntos de datos públicos que se ofrecen a libre reutilización son relativamente pocos en algunos países, como queda claro en la tabla II. El tiempo nos dirá cuántos organismos públicos no se acogen a la licencia por defecto de datos abiertos y a qué sectores pertenecen. El desconocimiento del impacto de los
Este trabajo forma parte de los resultados del proyecto de investigación titulado “Organización del acceso, uso y reutilización de la información del sector público en España. Hacia la consolidación de una industria de la información”, financiado por el Plan Nacional de I+D en España (Ref.: CSO2010-17451).
This study is part of the results of the research project entitled “Organization of access, use and reuse of public sector information in Spain. Towards the consolidation of information industry”, funded by the National R + D Plan in Spain (Ref .: CSO2010-17451).
La consultora IDC (
La Directiva 2013 ha sido incorporada al Derecho interno español mediante la Ley 18/2015, de 9 de julio, por la que se modifica la Ley 37/2007, de 16 de noviembre, sobre reutilización de información del sector público (BOE, 10/07/2015). En el texto legal se prevé la aplicación de tarifas por el suministro de documentos para su reutilización, “limitándose la misma a los costes marginales en que se incurra para su reproducción, puesta a disposición o difusión”, literalmente igual que en el texto de la Directiva.
La Ley de Libertad de Información de Estados Unidos (FOIA, por sus siglas en inglés), ha tenido varias modificaciones desde su aprobación inicial en 1966. El texto actualizado con las modificaciones de 2016 está disponible en
La Directiva 95/46/CE del Parlamento Europeo y del Consejo, de 24 de octubre de
La mencionada Directiva 95/46/CE, relativa a la protección de las personas físicas en lo que respecta al tratamiento de datos personales y a la libre circulación de estos datos, establece que en los Estados miembros no se podrá ni restringir ni prohibir el uso de los datos personales por la razón de garantizar el derecho a la intimidad en lo que respecta al tratamiento de los datos personales.
Preferimos este término “licencias de información” en lugar de recursos de información, para referirnos al amplio ámbito de licencias que regulan contenidos informativos sujetos a derechos de autor intercambiados a través de Internet, así lo utiliza en español el profesor Fernández Molina, véanse las referencias bibliográficas correspondientes.
Según se ha anunciado en septiembre de 2016, esta propuesta de facilitar el acceso a los datos de investigación parece abrirse camino en la Unión Europea (ver propuesta de Directiva (COM (
Remitimos a los apartados del capítulo de esta obra sobre Europeana en el que se explican las licencias para acceder al contenido y los metadatos accesibles desde Europeana. Al igual que sucede en muchos portales de datos abiertos, es necesario distinguir los metadatos que contiene la base de datos del portal respecto de los contenidos a los que enlaza y que pertenecen a distintas instituciones, con lo cual las condiciones de acceso pueden ser diferentes de unas bases de datos a otras e incluso entre las bases de datos accesibles dentro de la misma institución. Todo lo cual hace compleja la descarga y uso de los datos.
Ese ha sido el camino seguido por varios países. El primero fue el Reino Unido, país pionero en el uso de licencias en línea por la OPSI (Office Public Sector Information) hasta su desaparición y que después adoptó la licencia Open Government Licensing para ofrecer sus datos públicos, la cual es esencialmente equivalente a CC-BY u ODC Attribution. Esta misma práctica fue seguida por Francia e Italia que también adoptaron los principios de esas licencias libres a su propia licencia nacional (Morando,