Todo el mundo habla del aprendizaje automático, o Machine Learning en inglés.

Sin duda esta época es en la que más fuerza ha cogido este término, que es anterior al Big Data. No en vano, y que no se asuste nadie, en el último Hype Cycle de Gartner (2015), el Big Data queda fuera, y Machine Learning está dentro (Oh My God! ;-))

emerging-tech-hc.png;wa0131df2b233dcd17

imagen: gráfico de adopción de tecnologías emergentes de Gartner 2015

Ahí lo tenéis, en toda la cresta de la ola. Le rodean la IoT, los wearables, los bitcoins… Como indicabamos anteriormente, el aprendizaje automático no es exactamente una tecnología emergente, en el sentido de que sea ‘nueva’. Hace ya diez años en un master de la Universidad de Alcalá recuerdo que nos explicaban las técnicas para clasificar imágenes de satélite utilizando entrenamiento supervisado o no supervisado. De tal forma que a un sistema le ‘enseñábamos’ a distinguir por su cuenta si unos píxeles de las imágenes son suelo urbano o un bosque caducifolio, por poner un ejemplo. Spark y Hadoop sin embargo no existían entonces.

Si que hemos de reconocer lo obvio: hay un revival del Machine Learning. Motivado por las increíbles aplicaciones que de este paradigma se están llevando a cabo sobre todo en el ámbito de identificar comportamientos del cliente. Así pues, si me permitís la analogía, del suelo urbano o el bosque que era identificado en los píxeles de la imagen satelital pasamos a un cliente satisfecho y dispuesto a comprar o uno que no está interesado en los productos de nuestra empresa. Todo ello extraído no de una simple imagen de satélite, ni de una foto aérea, sino de un data lake formado entre otras cosas por los datos que los usuarios van dejando en redes sociales, transacciones efectuadas, transporte, datos meteorológicos, IoT, y un largo etcétera. ¿La técnica? groso modo, viene siendo la misma.

Nota: En el pico de las expectativas de la gráfica se lee ‘Advanced Analytics with Self-Service Delivery’…y eso no es Big Data as a Service?? Gartner, Gartner…