Desarrollar tecnología de datos robusta es clave para asegurar que la ciencia sea abierta
El ecosistema científico español dispone ahora de una Estrategia Nacional para la Ciencia Abierta (ENCA), una hoja de ruta que vela para que en 2027 los principios de la ciencia abierta se hayan integrado en cómo se ejecuta, se financia, se evalúa y se comunica la investigación en el estado español. Esta estrategia no solo supone un cambio de paradigma para las personas involucradas en hacer ciencia, sino que plantea un reto con mayúsculas: desarrollar tecnología de datos lo suficientemente potente y segura para llevar a cabo esta transformación y conectarse con el ecosistema abierto europeo. Una de las tecnologías que se necesitan son las llamadas infraestructuras de datos. Consisten en sistemas de gestión de la información que pueden tratar con datos diversos (de investigación, industria o incluso personales) con diferentes objetivos y para distintos usuarios finales.
El CREAF participa en este desafío mediante proyectos innovadores como AquaINFRA, AD4GD, OEMC y EOSC Focus. Este último está definiendo el futuro de la Nube Europea de Ciencia Abierta (EOSC por sus siglas en inglés), una iniciativa financiada por la Comisión Europea a través del programa Horizon 2020. Detrás de las siglas EOSC se concentra la voluntad de garantizar que los datos y servicios científicos financiados con fondos públicos europeos puedan accederse fácilmente y se reutilicen para investigar, innovar y educar con más calidad, transparencia y eficiencia. El CREAF se adhirió como miembro de esta red en 2020, pocos meses después de su constitución, para reforzar su compromiso con poner sus datos de investigación a disposición de la comunidad científica europea.
“Desarrollar una tecnología web robusta y fiable, junto con el compromiso de aportar datos abiertos, amplía el alcance de los datos disponibles y permite analizar el estado de salud de nuestro planeta desde diferentes prismas”.
KAORI OTSU, investigadora del CREAF
Además, la investigadora del CREAF Kaori Otsu está participando activamente en el despliegue técnico de este ecosistema digital a través del proyecto EOSC Focus. Su logro más reciente ha sido colaborar en la organización de un campus para expertos en Thessaloniki (Grecia). La Winter School 2024 ha reunido a más de 100 profesionales que están construyendo la EOSC a través de proyectos Horizonte 2020 con el objetivo de identificar sinergias y oportunidades de colaboración.
El equilibrio entre abrir y cerrar
Uno de los lemas más repetidos al hablar de ciencia abierta es que los datos deben estar tan abiertos como sea posible, pero tan cerrados como sea necesario. Esto significa que las infraestructuras donde se alojan no solo deben facilitar el acceso, sino también asegurar que los datos sensibles, como los que afectan a la privacidad o la salud de las personas o aquellos que son confidenciales para las empresas, estén seguros, controlados y mantengan su propiedad intelectual. “Esta es exactamente la función de los punteros espacios de datos que también estamos desarrollando: unos entornos virtuales donde poder intercambiar datos entre usuarios bajo un acuerdo establecido entre las partes”, explica el investigador del CREAF Joan Masó.
El acceso responsable puede garantizarse a largo plazo si los datos de investigación y servicios derivados siguen los principios internacionales FAIR (Localizable, Accesible, Interoperable y Reutilizable) y cumplen normas como el Reglamento General de Protección de Datos de la Unión Europea (GDPR por sus siglas en inglés). También es fundamental que los datos sean interoperables, es decir, que usen conceptos y variables de medida consistentes basados en vocabularios comunes y en estándares internacionales. El investigador Joan Masó ha colaborado en la descripción de algunos de estos estándares, como por ejemplo el OGC API Tiles.
Lo local es global y viceversa
La democratización de datos puede romper con las fronteras si estas tecnologías incluyen desde un principio a comunidades diversas, lo cual enriquece enormemente a la comunidad científica”, afirma Kaori Otsu.
Los entornos de datos abiertos desarrollados por las entidades supranacionales son más útiles si están conectados con la realidad local, que es la que habitualmente proporciona los datos. “La democratización de datos puede romper con las fronteras si estas tecnologías incluyen desde un principio a comunidades diversas, lo cual enriquece enormemente a la comunidad científica”, afirma Kaori Otsu. Por ejemplo, durante la implementación de la EOSC también se espera reflejar los principios CREA (Control, Responsabilidad, Ética, Aprovechamiento para el beneficio colectivo), que defienden los derechos que tienen los pueblos indígenas sobre sus datos.
Y no solo eso, la investigación local puede contribuir a la ciencia europea y viceversa; es una relación que beneficia a ambas escalas. Por ejemplo, el proyecto AD4GD, coordinado por el CREAF, está probando un posible uso de un espacio de datos dedicado a los objetivos del Pacto Verde Europeo. Para ello, están recopilando datos sobre conectividad de hábitats que provienen de diferentes orígenes, tanto locales como europeos: datos de la Global Biodiversity Information Facility (GBIF), mapas de cubiertas de suelo, sensores y cámaras de trampeo, ciencia ciudadana, datos gubernamentales, etc. La conectividad es uno de los factores que más condicionan la dispersión de animales y plantas por el territorio y funciona como un indicador de biodiversidad. Esta información, por tanto, puede llegar a ser crítica para que un pequeño ayuntamiento decida dónde construir una nueva carretera y a la vez esencial para que el Parlamento Europeo evalúe los objetivos de la nueva ley de restauración de la naturaleza.
El papel de la ciencia ciudadana
La EOSC está preparando su entorno digital para integrar datos de ciencia ciudadana de forma segura y fiable.
La ciencia ciudadana es el proceso de generación de conocimiento científico en el que participan voluntariamente personas que no son especialistas y que cuentan con el apoyo de profesionales del sector. "Nosotros creemos que la ciencia ciudadana puede ser plenamente científica”, sostiene Kaori Otsu; “es un tipo de investigación que genera una fuerza grupal muy poderosa que contribuye al conocimiento”. La EOSC está preparando su entorno digital para integrar este tipo de investigación de forma segura y respetando la privacidad de las personas que las generan.
Esta integración es relevante ya que, por ejemplo, los índices de conectividad de hábitats de los que hablábamos antes podrían afinarse si incorporan datos de observaciones de especies en el territorio, que pueden provenir de iniciativas de ciencia ciudadana. El CREAF, de hecho, ya participa en proyectos revolucionarios como por ejemplo Mosquito Alert, RitmeNatura, AlertaForestal o en algunos de los servicios desarrollados por el proyecto Cos4Cloud.
El futuro de la EOSC
La EOSC como espacio virtual de ciencia abierta es una acción impulsada por la European Research Area (ERA) Policy Agenda, igual que lo son el programa marco de investigación e innovación Horizon Europe y la Coalition for Advancing Research Assessment (CoARA), un acuerdo que busca reformar los criterios de evaluación de la investigación y al cual el CREAF también se ha adherido recientemente.
La reunión de expertos en Thessaloniki en la que participo Kaori Otsu desveló los retos que se deberán afrontar en el futuro para transformar todas las necesidades de la EOSC en tecnología eficiente. Entre ellos destacan seguir trabajando para la interoperabilidad de datos, la implementación de los principios FAIR o el despliegue de los llamados identificadores persistentes, que permiten generar referencias imperecederas para documentos, archivos y series de datos, como ya hacen los conocidos DOIs.