Big Data: necesidades y aplicaciones

3 Comments

La primera gran necesidad del Big Data es el propio almacenamiento de los datos. Cuando se llega a esta magnitud es difícil diseñar una estructura monolítica que pueda albergar toda la información. Se imponen soluciones distribuidas, pero que permitan el acceso a las fuentes de información de forma unificada. En muchas aplicaciones para Internet es necesario, además, que estos datos se almacenen y procesen rápidamente para ofrecer analítica en tiempo real. Es necesario también considerar la naturaleza y estructura de los datos, que en estos casos suele ser bastante heterogénea. Las soluciones basadas en bases de datos no relacionales (NoSQL) ofrecen una mejor adaptación a este escenario que otras tradicionales en la mayor parte de los casos.

Captura de pantalla 2013-04-10 a la(s) 09.50.16

Una vez que se ha conseguido dar con una solución para el almacenamiento y acceso de grandes cantidades de datos, un gran número de aplicaciones emergen de la posibilidad de realizar análisis sobre los mismos. Las tecnologías de análisis distribuido de los datos, tales como Hadoop y MapReduce ofrecen esta funcionalidad, abriendo un gran número de posibilidades de aplicación como las que se listan a continuación.

Aplicaciones

Sistemas de recomendación: Utilizan la información de comportamiento de cada usuario para predecir sus intenciones e intereses, y ofrecerles así contenidos adecuados. Son muy utilizados en comercio electrónico.

Análisis de sentimientos: Basándose en conversaciones públicas (e.g. twitter, foros) y otros elementos 2.0, se intentan predecir los gustos y el comportamiento de cada usuario con finalidades de diferente tipo.

Predicción de catástrofes: Las grandes cantidades de datos disponibles se utilizan en la detección de eventos como incendios o terremotos, de tal manera que se pueda predecir su impacto y generar una reacción temprana.

Juegos: Ajedrez (Deep Blue) o Preguntas (Watson) son ejemplos de programas que analizan grandes cantidades de datos de partidas para derrotar a contrincantes humanos.

Categorización y reconocimiento: De lugares, caras o personas, mediante el análisis el gran volumen de datos de este tipo disponible online.

Medicina: La medicina genómica personalizada (aún en el campo de la investigación) analiza e integra datos genómicos y clínicos para el diagnóstico precoz y una mejor aplicación de las terapias.

Comportamiento inteligente de servicios públicos: Utilizando la información proveniente de datos recopilados por sensores inteligentes puede mejorarse la distribución y consumo de recursos fundamentales como el agua o la energía eléctrica.

Modelado de riesgos: Algunas entidades bancarias y firmas de inversión punteras utilizan tecnologías de análisis de grandes cantidades de datos para determinar el riesgo de operaciones, evaluando un gran número de escenarios financieros hipotéticos.

Detección de fraude: Utilizando técnicas para combinar bases de datos comportamiento de usuarios y datos transaccionales puede detectarse actividad fraudulenta, como por ejemplo el uso de una tarjeta de crédito robada.

Monitorización de redes: Las redes de servidores producen una gran cantidad de datos que pueden ser analizados para identificar cuellos de botella o ataques. Este tipo de análisis puede aplicarse también a otros tipos de redes, tales como redes de transportes, con el fin, por ejemplo, de optimizar el consumo de combustible.

Investigación y desarrollo: Algunas empresas con fuerte componente investigadora, como las farmacéuticas, realizan análisis de grandes volúmenes de documentación (por ejemplo artículos científicos) y otro tipo de datos históricos para mejorar el desarrollo de sus productos.

——————-

Fuentes:

http://wikibon.org/wiki/v/Big_Data:_Hadoop,_Business_Analytics_and_Beyond

Suscríbete a nuestra newsletter