Proyectos de web semántica

Las bibliotecas llevamos ya un largo período de tiempo tratando de adaptar nuestros catálogos a la web semántica, convirtiendo nuestras descripciones bibliográficas en datos abiertos enlazados. El proceso se verá culminado cuando adoptemos completamente dentro de nuestros estándares las nuevas reglas internacionales de descripción, las RDA (Resource Description and Access). Mientras redactamos los nuevos perfiles de catalogación, traducimos listados de términos normalizados y nuestros softwares de gestión bibliotecaria mudan al nuevo modelo entidad-relación, desde Galiciana-BDG hemos explorado algunos proyectos que nos sitúan un poco más cerca de la ansiada web semántica.

  • Grafo de conocimiento de la revista Nós
  • Publicación de la LEMAG como datos abiertos enlazados

Grafo de conocimiento de la revista Nós

En el año 2020 se cumplían 100 años de la salida del primer número de la revista Nós. Nós no fue una publicación más; se convirtió en un de los referentes de la cultura gallega del siglo XX, de tal manera que resulta imposible imaginar la Galicia de hoy sin su contribución. Galiciana-BDG, en colaboración con la Amtega, quiso celebrar esta efeméride con la elaboración de una web específica que mostrara el grafo de conocimiento de la revista Nós.

Un grafo de conocimiento es un sistema que entiende que todas las partes que lo componen (nodos-conceptos) están relacionadas entre sí, mostrando así un sistema interconectado que hace más entendible al usuario cualquier parcela del conocimiento.

Para elaborar el grafo se creó una ontología semántica específica que muestra todo el universo de Nós: los números que salieron a lo largo de sus 15 años de vida, los artículos publicados, los autores que colaboraron, las instituciones de las que formaron parte los autores y los acontecimientos históricos que contextualizan la revista. La ontología crea los caminos por los que va a transitar la navegación en la web; sería como el esqueleto del grafo.

El siguiente paso consistió en alimentar el grafo con los datos extraídos de Galiciana-BDG. Los artículos se tomaron de la catalogación analítica de la revista, a la que se añadieron las imágenes fruto de la digitalización; mientras que los autores y las instituciones provienen de la catalogación enriquecida de autoridades. Los datos de autores e instituciones que no ofrecían el nivel de enriquecimiento que requiere el grafo, y todos los datos relativos a los acontecimientos históricos, se tomaron del proyectos de datos de la Wikipedia, el Wikidata.

El resultado es una web con tres apartados en el que todo está conectado: cronología, autores, la revista. En "cronología" podremos navegar por la línea del tiempo donde se ofrecen de forma visual los acontecimientos históricos más relevantes para la historia de Galicia desde 1846 hasta 1936, en tres niveles de relevancia: relevante para Galicia, relevante para España y relevante para el resto del mundo. El apartado "autores" ofrece información sobre cada colaborador de Nós en formato ficha, uno "grafo social" donde podremos explorar las relaciones de cada autor con otros autores y con las instituciones en las que participó; y por último podremos navegar por los artículos escritos por cada autor en la revista. A través del último apartado de la web ("la revista") podremos navegar por los distintos números publicados a lo largo de la historia de Nós.

Imaxe_parte_home_revistanos

Además de ofrecer a los usuarios una nueva forma de acceder a los datos de Galiciana-BDG, el proyecto revistanos.gal, nos sirvió en la Biblioteca de Galicia, y desde un punto de vista profesional, para hacernos una idea de cómo podría ser un catálogo semántico: ontología + datos, donde todo gira alrededor de las relaciones. También pudimos comprobar a través de este proyecto la importancia de la calidad de los datos que ofrecemos a través de nuestros catálogos. Un sistema de información donde lo importante son las relaciones entre los datos, estos, necesariamente tienen que estar depurados. El desarrollo de todo el enorme potencial de las RDA va a depender, en gran medida, del nivel de depuración y enriquecimiento de nuestros catálogos.

Publicación de la LEMAG como datos abiertos enlazados

En el año 2013 el Ministerio de Cultura publica la Lista de Encabezamientos para Bibliotecas Públicas (LEMBP) adaptada a los principios de los datos abiertos enlazados o vinculados (Linked Open Data). Dentro de este proyecto, también se tradujeron a formato SKOS (Simple Knowledge Information System) los listados de materias en catalán, vasco y gallego.

Aprovechando este proyecto del Ministerio, en el 2017 la Biblioteca de Galicia decide incorporar el LEMAG (Listado de Encabezamientos para Bibliotecas en Gallego) a su proyecto Galiciana-BDG. El objetivo era dotar de más consistencia a los registros de materia de la base de datos de Galiciana.

El procedimiento consistió en la exportación del fichero LEMAG-LOD del Ministerio a partir de registros Marc21. Sobre este fichero se realizan una serie de procesos de mejora y enriquecimiento de datos.

Galiciana-BDG disponía ya en ese momento (2017) de su base de datos estructurada conforme a RDF según la ontología de Europeana Data Model (EDM) y SKOS. Esta utilidad le permitía estar adecuadamente configurada para la implementación de la tecnología necesaria para ofrecer servicios Linked Data. Con tal fin se adquiere el software Brújula y el servidor SPARQL Endpoint.

Logo LEMb

El resultado de todo este proyecto se puede consultar a través del apartado de Datos Abiertos de Galiciana-BDG. Aquí los usuarios en general pueden consultar el LEMAG pero también pueden explorar toda la base de datos según el Europeana Data Model. Esta nueva forma de acceder a los datos de Galiciana-BDG se ofrece a través de sendos buscadores para materias y objetos digitales. Para el especialista informático, Galiciana ofrece también un punto de acceso SPARQL destinado fundamentalmente a que las máquinas (software y aplicaciones) accedan a los recursos SKOS/RDF de forma masiva, posibilitando la reutilización.

Este primer proyecto de acercamiento de Galiciana a la Web semántica se llevó a cabo con la colaboración de la Agencia para la Modernización Tecnológica de Galicia (Amtega), por lo que ese conjunto de datos también está presente en el catálogo de datos abiertos de la Xunta de Galicia.