Presentación Tesis Doctoral "Contribuciones al análisis automático de grandes volúmenes de datos en el contexto de la Ciencia de la Información Geográfica"
Se presenta una tesis multidisciplinar en el contexto de la Ciencia de la Información Geográfica dónde convergen sinérgicamente metodologías de Geoestadística, Teledetección, Ciencia Computacional y Sistemas de Información Geográfica con el objetivo de estudiar y ofrecer nuevas soluciones que permitan la automatización de determinados algoritmos de análisis espacial y de procesamiento de imágenes.
TÍTULO
Contribuciones al análisis automático de grandes volúmenes de datos en el contexto de la Ciencia de la Información Geográfica
AUTOR
Lluís Pesquer Mayos
DIRECTOR
Xavier Pons Fernández
LUGAR
Auditorio del Centre de Recerca Matemàtica.
FECHA
13 de junio de 2014 a las 11:00 h
RESUMEN
La automatización de estos algoritmos está enfocada a posibilitar y mejorar la eficiencia del procesamiento masivo de grandes volúmenes de datos geoespaciales.
La automatización de estos procesos está fundamentada en dos pilares principales:
- El aprovechamiento adecuado de los metadatos en la toma de decisiones automáticas. Estos metadatos pueden ser generados tanto por el proveedor de los datos originales como por los resultados intermedios derivados de los procesos implicados en los algoritmos estudiados. Este importante rol de conductor de los procesos de análisis espacial añade a los metadatos una componente más geográfica que otros usos más habituales como son las buscas sobre catálogos.
- El estudio y adaptación específico del algoritmo a la automatización. Se ha analizado y rediseñado cada algoritmo hasta conseguir una solución automática que mantenga la máxima calidad posible: kriging, análisis del variograma, interpoladores óptimos, modelos de regresión multivariante o logística adecuados y correcciones radiométricas.
Adicionalmente, la automatización ha permitido aplicar las metodologías de distribución de cómputo entre diferentes unidades de procesamiento y reducir de forma significativa los tiempos de ejecución (se ha conseguido speed-ups próximos a 60 en algún caso, y próximos a un comportamiento lineal en otras). Estas mejoras computacionales se han llevado a cabo mediante la paralelización de los códigos en lenguaje C y el envío de datos entre procesadores mediante Message Passing Inteface (MPI) en un entorno de elevadas prestaciones computacionales (HPC).
Las automatizaciones se han aplicado a varios campos y a varios tipos de datos, siendo las series temporales de imágenes de Teledetección el principal ámbito de investigación y aplicación. Por ejemplo, en esta tesis se propone un método que mejora la selección de imágenes (reflectividades de Terra MODIS) de elevada calidad respecto a la que sólo se efectúa en función de las máscaras de calidad que acompañan estos productos.
El nuevo método añade un análisis automático del variograma que detecta las posibles anomalías radiométricas y geométricas respecto a un patrón espacial tipo, definido también con criterios geoestadísticos.
Conseguir corregir radiométricamente de forma automática imágenes Landsat de varios sensores en base a valores radiométricos de referencia desde polígonos pseudo-invariantes, también generados automáticamente, es otro de los logros de esta tesis. Esta aportación permite procesar largas series temporales de imágenes de elevada resolución espacial para ámbitos geográficos extensos con un elevado rigor radiométrico y, por lo tanto, abre la puerta a realizar análisis del territorio con un niveles de detalle hasta ahora no viables.
Finalmente, en el campo de la compresión con pérdida de imágenes de Teledetección se ha realizado aportaciones que añaden una visión más espacial (y por lo tanto territorial) sobre visiones más clásicas en el ámbito general del tratamiento de imágenes. La compresión de imágenes es una de las metodologías ampliamente aceptadas hoy para gestionar de forma eficiente grandes volúmenes de datos y, nuevamente, el análisis geoestadístico ha permitido conducir las compresiones hacia resultados que conserven mejor las propiedades espaciales de las imágenes comprimidas.