Proxectos de web semántica

As bibliotecas levamos xa un longo período de tempo tratando de adaptar os nosos catálogos á web semántica, convertindo as nosas descricións bibliográficas en datos abertos enlazados. O proceso verase culminado cando adoptemos completamente dentro dos nosos estándares as novas reglas internacionais de descrición, as RDA (Resource Description and Access). Mentras que redactamos os novos perfís de catalogación, traducimos listaxes de termos normalizados e os nosos softwares de xestión bibliotecaria mudan ao novo modelo entidade-relación, desde Galiciana-BDG temos explorado algúns proxectos que nos sitúan un pouco máis preto da ansiada web semántica.

  • Grafo de coñecemento da revista Nós
  • Publicación da LEMAG como datos abertos enlazados

Grafo de coñecemento da revista Nós

No ano 2020 cumpríanse 100 anos da saída do primeiro número da revista Nós. Pero non foi unha publicación máis; Nós converteuse nun dos referentes da cultura galega do século XX, de tal xeito que resulta imposible imaxinar a Galicia de hoxe sen a súa contribución. Galiciana-BDG, en colaboración coa Amtega, quixo celebrar esta efeméride coa elaboración dunha web específica que mostrase o grafo de coñecemento da revista Nós.

Un grafo de coñecemento é un sistema que entende que tódalas partes que o compoñen (nodos-conceptos) están relacionadas entre sí, mostrando así un sistema interconectado que fai máis entendible ao usuario calquera parcela do coñecemento.

Para elaborar o grafo creouse unha ontoloxía semántica específica que mostra todo o universo de Nós: os números que saíron ao longo dos seus 15 anos de vida, os artigos publicados, os autores que colaboraron, as institucións das que formaron parte os autores e os acontecementos históricos que contextualizan a revista. A ontoloxía crea os camiños polos que vai transitar a navegación na web, sería o esqueleto do grafo. 

O seguinte paso consistiu en alimentar o grafo cos datos extraídos de Galiciana-BDG. Os artigos tomáronse da catalogación analítica da revista, á que se engadiron as imaxes froito da dixitalización; mentres que os autores e as institucións proveñen da catalogación enriquecida de autoridades. Os datos de autores e institucións que non ofrecían o nivel de enriquecemento que require o grafo, e tódolos datos relativos aos acontecementos históricos, tomáronse do proxectos de datos da Wikipedia, o Wikidata.

O resultado é unha web con tres apartados no que todo está conectado: cronoloxía, autores, a revista. En “cronoloxía” poderemos navegar pola liña do tempo onde se ofrecen de forma visual os acontecementos históricos máis relevantes para a historia de Galicia desde 1846 ata 1936, en tres niveis de relevancia: relevante para Galicia, relevante para España e relevante para o resto do mundo. O apartado “autores” ofrece información sobre cada colaborador de Nós en formato ficha, un “grafo social” onde poderemos explorar as relacións de cada autor con outros autores e coas institucións nas que participou; e por último poderemos navegar polos artigos escritos por cada autor na revista. A través do último apartado da web (“a revista”) poderemos navegar polos distintos números publicados ao longo da historia de Nós.

Imaxe_parte_home_revistanos

Ademais de ofrecer aos usuarios unha nova forma de acceder aos datos de Galiciana-BDG, o proxecto revistanos.gal, serviunos na Biblioteca de Galicia, e dende un punto de vista profesional, para facernos unha idea de cómo podería ser un catálogo semántico: ontoloxía + datos, onde todo xira ao redor das relacións. Tamén puidemos comprobar a través deste proxecto a importancia da calidade dos datos que ofrecemos a través dos nosos catálogos. Un sistema de información onde o importante son as relacións entre os datos, estes, necesariamente teñen que estar depurados. O desenvolvemento de todo o enorme potencial das RDA vai depender, en gran medida, do nivel de depuración e enriquecemento dos nosos catálogos.

Publicación da LEMAG como datos abertos enlazados

No ano 2013 o Ministerio de Cultura publica a Lista de Encabezamientos para Bibliotecas Públicas (LEMBP) adaptada aos principios dos datos abertos enlazados ou vinculados (Linked Open Data). Dentro deste proxecto, tamén se traduciron a formato SKOS (Simple Knowledge Information System) as listaxes de materias en catalán, vasco e galego.

Aproveitando este proxecto do Ministerio, no 2017 a Biblioteca de Galicia decide incorporar o LEMAG (Listaxe de Encabezamentos para Bibliotecas en Galego) ao seu proxecto Galiciana-BDG. O obxectivo era dotar de máis consistencia aos rexistros de materia da base de datos de Galiciana.

O procedemento consistiu na exportación do ficheiro LEMAG-LOD do Ministerio a partir de rexistros Marc21. Sobre este ficheiro realízanse unha serie de procesos de mellora e enriquecemento de datos.

Galiciana-BDG dispoñía xa nese momento (2017) da súa base de datos estructurada conforme a RDF segundo a ontoloxía de Europeana Data Model (EDM) e SKOS. Esta utilidade permitíalle estar adecuadamente configurada para a implementación da tecnoloxía necesaria para ofrecer servizos Linked Data. Con tal fin adquírese o software Brújula e o servidor SPARQL Endpoint.

Logo LEMb

O resultado de todo este proxecto pódese consultar a través do apartado de Datos Abertos de Galiciana-BDG. Aquí os usuarios en xeral poden consultar o LEMAG pero tamén poden explorar toda a base de datos segundo o Europeana Data Model. Esta nova forma de acceder aos datos de Galiciana-BDG ofrécese a través de sendos buscadores para materias e obxectos dixitais. Para o especialista informático, Galiciana ofrece tamén un punto de acceso SPARQL destinado fundamentalmente a que as máquinas (software e aplicacións) accedan aos recursos SKOS/RDF de forma masiva, posibilitando a reutilización.

Este primeiro proxecto de achegamento de Galiciana á Web Semántica, levouse a cabo coa colaboración da Axencia para a Modernización Tecnolóxica de Galicia (Amtega) polo que ese conxunto de datos tamén está presente no catálogo de datos abertos da Xunta de Galicia.