Big Data genómico, una especialización de apoyo para la investigación moderna.

La genómica constituye la rama de la ciencia que estudia el material genético. El genoma de una persona se integra por casi 25.000 genes y son necesarias grandes capacidades de hardware y software para almacenar esta información y ponerla al servicio de los investigadores. Es por ello que la genómica está absolutamente ligada al Big Data y da origen a una especialización: el Big Data genómico, quien se encarga de proveer a los investigadores y a la práctica médica, de los algoritmos e infraestructura necesarios para la secuenciación, manejo, almacenamiento, visualización y análisis de datos genómicos.

La aplicación de estas tecnologías ha permitido a la investigación médica evolucionar hacia una mayor precisión de hipótesis y diagnósticos basados en datos, soportado en la utilización de modelos predictivos y la aplicación de técnicas analíticas. En esta nueva etapa de la investigación vinculada al Big Data genómico, será muy importante que  los médicos e investigadores además de apoyarse en analistas y científicos de datos, adquieran habilidades y conocimientos sobre Big Data que faciliten la toma de decisiones.

Entre los principales retos del Big Data genómico, podemos citar:

  • Almacenamiento de información genómica.
  • Algoritmos para secuenciación de datos genómicos.
  • Visualización de datos: visores genómicos (herramientas para visualizar información en el contexto de la secuencia genómica).
  • Análisis de datos: Desarrollo de sistemas cognitivos para la identificación precisa de excepciones relevantes (por ejemplo, mutaciones genéticas). Desarrollo de herramientas más intuitivas diseñadas para los investigadores.
  • Formación en Big Data orientada a usuarios funcionales: investigadores, médicos y analistas clínicos.
  • Buenas prácticas organizativas y de procesos.
  • Seguridad, legalidad y privacidad de los datos genómicos.

En España organizaciones privadas y públicas del sector de sanidad e investigación, desarrollan estrategias en esta línea. En el foro Big Data y Medicina de Precisión organizado por Sanitas en el pasado mes de noviembre, se evidenciaron ejemplos concretos. Es de destacar el Proyecto 1.000 Genomas, desarrollado por el Ciberer, red española de investigación en enfermedades raras, y la Plataforma Genómica y Bioinformática de Andalucía. Quienes desde 2011, han conseguido identificar 60 genes patogénicos en el marco de un proyecto de colaboración que vincula a hospitales públicos como el Ramón y Cajal de Madrid, Hospital del Mar de Barcelona, Virgen del Rocío de Sevilla o La Fe de Valencia y al Departamento de Genómica Computacional del Centro de Investigación Príncipe Felipe.