Data Virtualization: la nueva frontera…

Por Michele Iurillo*

Hay muchas definiciones de Data Virtualization, la que dan fuentes académicas o la que directamente los mismos fabricantes declaran. Podemos resumir que la virtualización de datos es cualquier enfoque de la gestión de datos que permite a una aplicación recuperar y manipular datos sin requerir detalles técnicos sobre los datos, como por ejemplo cómo se formatea en la fuente, o dónde está físicamente ubicada, y puede proporcionar una única vista al cliente de los datos globales.

Imagen: Esquema gráfico de virtualización en datos (fuente: TDWI)

Imagen: Esquema gráfico de virtualización en datos (fuente: TDWI)

La virtualización de datos representa un enfoque ágil para la integración de datos. Proporciona al consumidor de datos una capa de abstracción que oculta la mayoría de los aspectos técnicos de cómo y dónde se almacenan, procesan y acceden los datos. Permite acceder a los recursos sin entrar en detalles como:

  • donde se almacenan los datos,
  • qué tecnología o plataforma se utiliza para almacenar datos,
  • qué tecnologías se utilizan para procesar y almacenar datos,
  • qué interfaces son necesarias para acceder a los datos.

A diferencia del proceso tradicional de extracción, transformación, carga (“ETL”), los datos permanecen en su lugar y se da acceso en tiempo real al sistema fuente de los datos. Esto reduce el riesgo de errores de datos, de la carga de trabajo que mueve los datos que nunca se suelen utilizar, y no intenta imponer un único modelo de datos. La tecnología también soporta la escritura de actualizaciones de datos de transacciones a los sistemas, el proceso es bidireccional si el usuario lo quiere así. Para resolver las diferencias en los formatos fuente y consumidor y la semántica, se utilizan diversas técnicas de abstracción y transformación. Este concepto y software es un subconjunto de integración de datos y se utiliza comúnmente en inteligencia de negocio, servicios de datos de arquitectura orientada a servicios, cloud computing, búsqueda empresarial y administración de metadatos.

La virtualización de datos está orientada intrínsecamente a producir una visión rápida y oportuna de múltiples fuentes sin tener que embarcarse en un importante proyecto de datos con una extensa ETL y su almacenamiento en un Data Warehouse clasico. Sin embargo, la virtualización de datos también puede ampliarse y adaptarse para satisfacer los requisitos de almacenamiento de datos tradicional.

Un mercado en alza según Gartner

En la reciente Guía del mercado para la virtualización de datos de Gartner, el gigante de la investigación tecnológica describe detalladamente qué tipo de impacto tendrá la virtualización de datos en la empresa en los próximos años. Gartner proyecta que para el año 2020, el 35% de las organizaciones empresariales implementarán la virtualización de datos de alguna forma.

Al explicar la trayectoria actual del software de virtualización de datos, Gartner declara: “Como parte cada vez más importante de una estrategia integral de integración de datos, la virtualización de datos está atrayendo un renovado interés a medida que las organizaciones reconocen su potencial para una creciente gama de casos de uso. Existen diversas formas en las que la tecnología de virtualización de datos puede añadir valor como parte de las capacidades de integración y uso compartido de datos de la infraestructura de información. La mayoría de estas oportunidades implican aumentar las estructuras de datos físicamente integradas y proporcionar enfoques coherentes orientados a servicios para que las aplicaciones y los servicios empresariales accedan a los datos. Al hacer que los recursos de datos sean útiles, independientemente de cómo se desplieguen o dónde residan, esta tecnología lee los datos “.

Algunos players del sector

  • Actifio
  • Cisco
  • Data Virtuality
  • Denodo
  • Gluent
  • IBM
  • Informatica
  • Information Builders
  • OpenLink Software
  • Oracle
  • Primary Data
  • Progress
  • Querona
  • Red Hat
  • Rocket Software
  • SAP
  • SAS
  • Stone Bond Technologies
  • Tibco

Hay quien dice que si “el big data” es el nuevo petróleo la virtualización de datos es la nueva refinería, no sabemos si es cierto lo que sabemos que la DV y los LDW están destinado a ser parte de las inversiones en TI en los próximos años.

querona

Querona LDW

Querona simula un almacén de datos virtual emulando SQL Server in modo nativo. Todas las herramientas de presentación de BI reconocen a Querona como una instancia de SQL Server que es un almacén de datos con todos los datos de todos los sistemas fuente ya cargados. Querona soporta tanto el acceso en tiempo real a los sistemas fuente, como también todas las vistas que hacen un “virtual data mart” y puede ser almacenada en caché en una base de datos separada.Como resultado, Querona reúne fuentes de datos de la nube (Dynamics CRM Online), fuentes de datos locales (bases de datos, Dynamics AX, etc.) y un almacén de datos alojado en la nube.

Características únicas de Querona:

  • Totalmente compatible con Microsoft SQL Server stack
  • Centrado en el autoservicio
  • Soporta ~ 100 tipos de fuentes de datos
  • Permite una seguridad completa en todas las fuentes de datos (similar a SQL Server, además de seguridad de acceso a filas, enmascaramiento de datos dinámicos, pseudoanonimización transparente full compliance GDPR)
  • Expone un clúster HDInsight como un lago de datos virtual compatible con SQL Server con carga de datos en tres clics.

Tecnologia LDW

El nuevo concepto del Logical Data Warehouse permitirá a los departamentos de TI cumplir sus tareas y responsabilidades en cuestiones relacionadas con la BI. La capa lógica proporciona varios mecanismos para visualizar datos en el DW y en otras partes de una empresa sin necesidad de reubicar y transformar los datos antes del tiempo de visualización. De esta forma los datos son más frescos y la estructura de los datos suministrados se crea en tiempo de ejecución, sin limitar los datos a las estructuras de DW preconstruidas. Lograr estos beneficios ha sido un reto en el pasado, ya que el software, el hardware y las redes simplemente carecían de la velocidad, la escalabilidad y la fiabilidad requeridas para las instalaciones pero Virtualización y Cloud han abierto nuevos escenarios.

michele

Imagen: Michele Iurillo (LinkedIn)

*Michele Iurillo es actualmente Country Manager de Querona en Italia y España. Se ha ocupado de Inteligencia de Negocios durante los últimos 10 años. Ha sido Country Manager en España de TARGIT y colabora con diferentes medios de comunicación y dicta conferencias sobre la necesidad de que las empresas descubran el tesoro de los datos que sus sistemas generan a diario.

Otros articulos sobre LDW y Querona: