ESRI, la firma privada de referencia en el mundo de las geotecnologías, ha lanzado recientemente un set de herramientas en código abierto para manejar la componente espacial de los datos a través de HDFS (Hadoop Distributed File System)

GISForHadoop

Con esta librería vamos a poder tanto mapear nuestros datos masivos en un GIS (sistema de información geográfica), como realizar geoprocesamiento de los mismos.

Según una vieja cita, el 80% de los datos en el mundo tiene algún tipo de componente espacial. Piensa algo que no pueda ser referenciable en el espacio, es difícil dar con una sóla cosa! Esta peculiaridad hace nos interese seguir de cerca los pasos en la dirección de visualizar correctamente los macrodatos mediante geoservicios y, no menos importante, poder realizar cálculos y operaciones relacionadas con la distribución espacial de los mismos.

Algunas otras aplicaciones relacionando el mundo de las geotecnologías y big data son el servicio que ofrece Maptimize o tags de código como el <Region> en kml (keyhole markup language, el lenguaje de los archivos que pueden ser cargados en Google Earth) que nos facilitan la visualización ordenada de grandes cantidades de datos localizados de una forma sencilla.

Resulta fascinante cómo los mapas de hoy día son mapas sociales, tal es el caso de esta imagen de las autopistas de tweets sobre Europa:

6a010534b1db25970b0192aa8e1829970d-800wi

Social data: the arteries of the world, in tweets

Esta visualización está hecha por Miguel Ríos (Engineering Manager, Data Visualization at Twitter) y representa los tweets geolocalizados en Europa desde 2009. ¿Cómo se hace esto? Tan solo 20 líneas de código en R usando el paquete ggmap y voilá!

Hic sunt dracones,

Sin título

(*)