• Reducir  fuente
  • Aumentar  fuente
21 Jul 2014

El futuro en los datos: Big Data y Data Science


data

Comenzamos una nueva entrega de firmas invitadas en este blog con Diego Bodas, co-director en el programa Experto en Big Data de U-tad, Centro Universitario de Tecnología y Arte Digital, quién nos adentra en conceptos tan novedoso como el Data Science:

Big Data es un término que en los últimos años está apareciendo periódicamente en medios de comunicación y foros empresariales. Si consultamos el gráfico que proporciona Google Trends y que analiza el interés del término a lo largo del tiempo basándose en las búsquedas realizadas, observamos que la gráfica entra en tendencia claramente alcista a partir del año 2011. La misma herramienta de Google nos proporciona una lista de términos relacionados, entre los que destacan “data analytics” o “big data analytics”. Pero, ¿qué entendemos por Big Data? ¿Qué es la analítica Big Data?

Edd Dumbill (O’Reilly Media) considera que Big Data hace referencia a los datos que exceden la capacidad de procesamiento de los sistemas de bases de datos tradicionales. Estos datos se caracterizan por su volumen, se generan a una gran velocidad y no suelen ajustarse a una estructura fija, suelen ser datos desestructurados, con formatos varios (texto, imagen, sonido…) y composición diversa. El procesamiento de este tipo de datos exige de nuevas estrategias, tecnologías y arquitectura dando lugar al paradigma Big Data.

En estrecha relación con el paradigma Big Data se encuentra el concepto de Data Science. No todos los problemas se pueden solucionar con base en el empleo de tecnología y análisis de datos. El objetivo del Data Scientist es saber cuáles son los problemas que se pueden resolver mediante el empleo de estos recursos. Informático, estadístico, matemático, programador web, diseñador… No es posible aglutinar en un único perfil todo el abanico de conocimientos que requiere un departamento de Data Science. Por ello, este tipo de trabajos debe estar centrado en el equipo, un equipo multidisciplinar que funcione como una máquina perfectamente engrasada. De forma muy abreviada, podríamos definir Data Science como conjunto de conocimientos estructurados que permiten la toma de decisiones basadas en el análisis de grandes cantidades de datos.

A pesar de que estamos hablando continuamente de grandes cantidades de datos, debemos recalcar que no existe un convenio fijo y universal que dicte a partir de qué tamaño tenemos un problema Big Data. Ciertas compañías, por ejemplo, no tratan con un volumen de datos descomunal similar al volumen de información que circula por los servidores de Google, Yahoo o eBay, pero, sin embargo, sí que tienen que trabajar con información tremendamente heterogénea y variable, por esta razón, las tecnologías y Big Data han supuesto un alivio inmediato a sus necesidades. Finanzas, medicina, ciencia, dirección de operaciones, mantenimiento de motores, gestión de riesgos… todos ellos son campos donde el Big Data tiene un gran potencial de desarrollo.

Un error frecuente es pensar que el paradigma Big Data viene para reemplazar las bases de datos tradicionales o los sistemas clásicos de Business Intelligence, de ningún modo. Las tecnologías Big Data son complementarias y no sustitutivas de las anteriores, nos permiten llegar más allá apoyando la toma de decisiones proactiva mientras que, con los sistemas tradicionales, debíamos contentarnos con un análisis reactivo en la mayoría de los casos.

Big Data será una pieza esencial en el futuro tecnológico inmediato, con múltiples oportunidades y retos que resolver, como los derivados de la privacidad y protección de los datos. Es un trabajo apasionante que requiere de profesionales completos, dinámicos y ávidos de conocimiento. Las empresas que quieran liderar el futuro deberán trabajar codo a codo con estos profesionales.

Foto en Flickr de Idaho National Laboratory



Los comentarios están cerrados.