imagen: pitacoradeclase.wordpress.com

imagen: pitacoradeclase.wordpress.com

En este mes y algo más que hemos lanzado SoyData – La Ciencia de Datos a tu alcance, se ha producido un daño colateral que vamos a resolver inmediatamente: todo el trabajo que nos ha costado poner en marcha la plataforma y darla a conocer ha hecho que pase más de un mes… sin publicar nada aquí, en BD4S, nuestra amada casa! :-)

Por ello, y tras ver el ‘chorrete’ de novedades que hay desde semanas atrás, vamos a empezar por hacer un digest con lo más destacado y así nos ponemos al día todos. Empezamos!

Grandes compañías USA crean una gran alianza

General Electric, Verizon, Pivotal, IBM y Hortonworks entre otras se alían para formar un bloque conjunto, fundamentalmente para elaborar una lista de estándares de trabajo con Hadoop.

Microsoft lanza su Azure Machine Learning Platform

En la pasada Strata Conference, Microsoft anunció oficialmente su nueva plataforma cloud, en el marco de Azure, para gestionar todos los datos de una organización en la nube mediante el aprendizaje automático o machine learning. Algo después la empresa de Redmond ha lanzado a su vez su propio Data Lake

Pivotal libera el código fuente de su suite analítica

Algunas partes que son clave en su plataforma de análisis de grandes datos fueron hechas open source, siguiendo el principio de compartir el conocimiento y permitir la innovación abierta. Las consecuencias positivas para la comunidad a buen seguro que tardarán poco en llegar. No en vano, Pivotal es una de las mayores empresas BD&A pese a no tener un nombre tan reconocible como Cloudera o HW. De hecho, supera a estas dos últimas empresas en facturación. Junto con la ya mencionada alianza con grandes empresas, esta liberación de parte del código será uno de los movimientos tácticos más importantes de la compañía en los próximos años.

Ibermática se suma al sector Big Data con su nueva línea de servicios

Buscando abarcar el ciclo completo de los grandes datos en una empresa, Ibermática se ha lanzado al mercado BD&A con su nuevo plan que contempla desde la consultoría e implantación de clústeres Hadoop hasta el desarrollo in-memory y la analítica avanzada.

Information Builders se alía con MapR

Además se ve reforzado en reporting financiero con un nuevo partership con Capital Markets. En cuanto a la integración de las soluciones de MapR con la ya existentes de Information Builders se busca ofrecer a sus clientes una mayor eficiencia y robustez en la analítica y gestión de datos.

Jobandtalent consigue 23 millones para impulsar su inteligencia de datos

Es una nueva ronda de financiación enfocada en extender la empresa española en Estados Unidos. Esta plataforma de análisis lingüístico que conecta a empresas y trabajadores se vé así reforzada y aún tiene pendiente cerrar una nueva ronda con otros inversores.

Una nueva guía para entender el Big Data en el sector Salud

Navigating the Health Big Data Ecosystem de la famosa editorial O’Reilly nos habla de las 6 C’s que hay que tener en cuenta para comprender el campo de los datos sanitarios en la era de la medicina de precisión.

Una ontología en la Ciencia de Datos

No me resisto a poneros este extenso y enjundioso artículo de Don Philip Faithfull en el que nos habla sobre la necesidad de construir un código moral, análogo a otras profesiones como la medicina, que nos establezca unos límites claros entre lo que se puede hacer y lo que no.

Big Data as a Service, la nueva ‘Gran Cosa’

Es cierto que esta coletilla de ‘as a Service’ empieza a desvirtuarse por sí misma, pero ciertamente lo que todos ansiamos es ejecutar sin problemas de configuración ni de requerimientos cuantos más procesos y aplicaciones mejor. Ahí va la última: el BDaaS o big data as a service. IBM ya se ha puesto manos a la obra y anuncia su propio servicio con estas características.

Lo que necesita el NoSQL es…SQL

Ejem…pues sí. Esta especie de eterna batalla-culebrón entre los que quieren jubilar el SQL y los que quieren que el lenguaje estructurado se inserte en el nuevo paradigma de lo no estructurado continúa. No es ningún secreto para los ingenieros que gestionan bases de datos que el SQL ha sido y es la lengua franca. Hay muchas ventajas y tiene cierta lógica intentar a toda costa que este sistema se pueda integrar dentro del mundo NoSQL. En las últimas lecturas de nuestro curso en SoyData sobre MySQL el instructor, Eduardo Montilla, hace algunas referencias sobre este asunto.

Airtable permite manejar bases de datos complejas en mobile

Con una financiación de 3millones de dólares que les fue concedida un par de meses atrás, esta startup se enfoca en la gestión de bases de datos desde dispositivos móviles

Revelaciones estratégicas en esta nueva encuesta del sector Data Science

Seguro que ya os las sabéis ;-p vamos allá: no hay suficientes científicos de datos en activo, el término Data Science es nuevo pero hace referencia a algo ya existente, el open source domina entre las soluciones, programar es la habilidad más demandada..Estas son algunas de las revelaciones de un nuevo estudio que vio la luz allá por febrero. Para nosotros, la solución al principal problema que se menciona pasa por una capacitación masiva de los perfiles que buscan hacerse un hueco en el sector. En esto es en lo que hemos apostado!

Hortonworks no presenta los beneficios esperados en el primer cuatrimestre

La salida a bolsa no le sienta bien a las empresas tecnológicas. La compañía HW presentó su pimer cuatrimestre como empresa cotizada y los resultados son algo inferiores a lo que se esperaba.

Top de los principales reclutadores de científicos de datos

Aviso: es un artículo enfocado sólamente a los USA. Sin embargo, dado el volumen de actividad tan diferencial que existe entre estados unidos y practicamente el resto del mundo, nos interesa ponerlo aquí y seguir de cerca lo que se está cociendo en las áreas de San Francisco y Nueva York. ¿Los principales? WoozAllen, KPMG, Apple, CapitalOne y Walmart. Ya despues iría HP, Netflix, teradata, etc etc. Conclusión: las grandes empresas hoy en día son tecnológicas y data-céntricas, sean o no del sector de las TIC o BD&A

Cuadrante de Gartner para plataformas de analítica avanzada

Qué mejor manera de cerrar este repaso que con el nuevo cuadrante que se publicó para este 2015. SAS se posiciona como líder, seguido por IBM(…mal que les duela a muchos defensores de R!) y fijaos el recorrido tan amplio que experimenta Microsoft  para convertirse en una de las plataformas categorizadas como ‘visionarios’.

Gartner MQ for Advanced Analytics Platforms, 2014 vs 2015