¿Podría gobernarse España a través del big data?

Esta es la pregunta con la que Gonzalo Herrera, editor web de la revista online VICE España me abordó hace unos días. La respuesta es bastante extensa, ya que es una entrevista en torno a un tema del cual es fácil ver escenarios del estilo Matrix o Terminator.

¡Feliz Año, por cierto!

A continuación os pongo la entrevista completa, he añadido algún enlace adicional, pero os recomiendo visitar también la página en VICE. Podéis ir a la entrada en VICE España en este enlace.

https://www.vice.com/es/article/big-data-gobierno-tecnologia-inteligencia-artificial

VICE: ¿Son las datos y las tendencias que se extraen neutrales? Al final siempre hay alguien que tiene que analizarlos y en ese análisis pueden intervenir muchos factores externos y subjetivos, ¿puede evitarse eso o es parte del juego?
Jorge Ubero: Los datos son siempre neutrales. Hay que diferenciar el dato, que sólo es un número, de la información o el conocimiento. Estos dos últimos sí son susceptibles de perder la neutralidad. Para obtener información de los datos debemos aplicar análisis, a su vez el conocimiento se consigue mediante la información y la experiencia. Es en estos procesos cuando puede, y de hecho suele aparecer algún tipo de sesgo o conclusión subjetiva, que son naturales en la condición humana por otro lado. Se puede evitar la subjetividad recurriendo estrictamente a una misma metodología lo más neutral posible o a un agente externo e imparcial que se encargue de extraer conclusiones de nuestros datos. Este problema es más complejo de lo que puede parecer, lo cierto es que puede resultar difícil hacer análisis y conclusiones objetivas en una organización, según esta sea más o menos abierta culturalmente.

Actualmente nuestros datos están en manos de grandes corporaciones (Google, Facebook…). De hecho, los datos son su principal activo, el más valioso. Por tanto, si disponen de más información que nadie, ¿hasta qué punto es factible que acaben interviniendo en cuestiones públicas, si estas se basan precisamente en este tipo de información?
En la medida en que son empresas y tienen unos objetivos concretos, diría que sí es factible. En el caso de las dos que mencionas (pero no serían las únicas), ambas empresas tienen unas directrices y una forma de ver el mundo que, de un modo u otro acaba influyendo en la sociedad. Ahora bien, volviendo a lo comentado anteriormente si solamente tomáramos los datos en bruto de Google y Facebook para analizarlos junto con otras fuentes no habría un sesgo ya que los datos en sí, mientras no se falseen, van a ser neutros.

Quizás suena un poco a ciencia ficción, pero en los últimos años los gobiernos se han estado interesando por la big data y sus posibilidades de cara a gobernar un país, ¿es descabellado pensar que va a llegar un momento en el que nos pongan en “modo automático”? (Es decir en el que el gobierno deje de actuar como intermediario y se convierta simplemente en garante de que se respete lo que marcan los datos, sea lo que sea eso).
En mi opinión, estamos muy lejos de este escenario de manera general. Sí que es necesario que los gobiernos aprovechen las tecnologías (no sólo big data, sino inteligencia artificial) pero para aspectos concretos. En España la lucha contra el fraude fiscal se ha visto enormemente reforzada gracias al uso de gigantescas bases de datos que cruzan la información que antes poseían las distintas administraciones por separado y era muy difícil manejar en su conjunto (LINK).

Volviendo al escenario que planteas, pienso que hay todavía muchos inconvenientes no resueltos y la misma naturaleza de un ‘gobierno automático’ supondría un problema de tipo moral para muchos. Por un lado, la mayoría de los datos que se recaban masivamente provienen de redes sociales y del e-commerce. La población no usa en su conjunto de igual manera estos servicios, incluso hay amplios sectores de la población que no están en las redes sociales o no compran por internet; por lo que la representación de los ciudadanos sería de entrada desigual en un escenario así.

Por otra parte las inteligencias artificiales (AI) que, todavía en fase de experimentación, han sido puestas en marcha para comprobar qué decisiones tomarían en áreas como la política han tenido resultados que distan mucho de satisfacer lo que entendemos como ‘buen gobierno’. Se da el caso de experimentos en los que una AI se le ha pedido escribir un guion, pintar un cuadro o elegir una ideología y los resultados, para el ojo humano han sido completamente absurdos, llegando incluso a abrazar ideologías totalitarias y que podríamos calificar como nazis.

La inteligencia máquina tiene capacidades que superan claramente a la humana en cuestiones como el cálculo o el procesamiento de información. Sin embargo, la inteligencia humana es muy potente, al menos tal como lo vemos los humanos, en ideas abstractas, cultura y política. En ciertos ámbitos -por ejemplo, interpretar la ironía en el lenguaje- a las máquinas les cuesta, les cuesta y mucho. La clave está en poder combinar las dos inteligencias.

Si estamos hablando de datos que se derivan de nuestras acciones cotidianas, de cara ese hipotético “gobierno automático” ¿sería más fácil o más difícil manipularlos? Al fin y al cabo para conseguir cambios políticos que fuesen contra nuestro comportamiento habitual tendríamos que forzarnos a vivir a pensar e interesarnos por cosas diferentes.
Un gobierno automático, como decía antes, lo veo poco factible más allá de entrar en una posible manipulación. Hace años, cuando se eligió por segunda vez a Obama, surgió una ola de optimismo en torno a esta idea, al menos en lo que respecta a las elecciones. Un conocido analista llamado Nate Silver acertó en los resultados de todos los estados utilizando modelos matemáticos. A su vez la campaña de Obama en aquellas elecciones estuvo muy centrada en el análisis de datos; bien para conseguir más financiación, más apoyos o impacto en sus acciones. El equipo de analistas que tenían los demócratas en Chicago popularizó el apodo de ‘la cueva’ (the cave); otros partidos en otros países han seguido esta práctica desde entonces. Pero ahora, con los fiascos que se han venido experimentando en las encuestas y sondeos electorales por todo el mundo, sería impensable decir eso de ‘para qué ir a votar si podemos predecir todo’.

Los grandes bancos de datos recogen información global pero ¿cómo está segmentada esa información? ¿Podrías decirme si hay más tendencias entre similares por géneros o clases sociales que a nivel nacional? ¿A dónde nos llevaría eso en un mundo globalizado?
La segmentación de los usuarios en sectores como la banca parte de la premisa de que las preferencias entre personas similares, son a su vez similares. Esto es, una mujer de Santander de 37 años con estudios universitarios y trabajando en seguros tendrá un comportamiento parecido frente a decisiones como aceptar una tarjeta de crédito si la comparamos con otras mujeres, de Santander con su edad, nivel de estudios y sector laboral similares.

Esto es algo que estadísticamente se cumple bastante bien pero no es infalible, claro. Una clave aquí es precisamente establecer correctamente esos grupos en los que clasificar a los usuarios y eso es algo que se puede hacer muy bien con big data y modelos de minería de datos conocidos como ‘clustering’ o agrupamiento.

El sexo o los estudios no tienen por qué ser significativos a la hora de contratar una hipoteca, y este tipo de ‘insights’ o revelaciones nos las ha facilitado mucho el poder manejar grandes datos masivos (conocidos como ‘data lakes’) y hacerles preguntas.

Quizás esta pregunta entra en el campo de la ética, pero, ¿hasta que punto sería legítimo usar esos datos cuando son el producto de un consumo masivo que constantemente se retroalimenta? ¿De que forma estarían legitimados?
El uso que una empresa hace con los datos que recogen de sus usuarios tiene que estar especificado en sus condiciones legales y ser aceptado por dichos consumidores. De entrada, los datos relacionados con un producto o servicio, no pueden ser utilizados para otro ámbito, por lo que no sería lícito (al menos en el marco actual de protección de datos) hacer ese trasvase de datos de las empresas a un gobierno.

terminator2

¿Un escenario distópico o la posibilidad de mejorar la gestión? (Imagen: Terminator, película)

¿No sería un poco “1984” todo?
A mí me recuerda más al gobierno de las máquinas de Terminator o Matrix…después de todo el Gran Hermano de 1984 que Orwell describe era un dictador humano.

Me parece que la realidad va a ser menos apocalíptica y es que mientras no se lleve a una generalización que roza con lo absurdo, la gobernanza puede verse enormemente mejorada con el big data y es algo que estamos viendo en nuestros días ya.