Big Data es una iniciativa del negocio

Es habitual considerar que Big Data se refiere a conjuntos de datos que crecen tan rápidamente que no pueden ser manipulados por las herramientas de gestión de bases de datos tradicionales. Lo importante es entender que Big Data no es una iniciativa surgida del área de tecnologías de información, sino del negocio.

El área de tecnologías de información (TI) tiene que limitarse a gestionarlo como un servicio más y darle soporte tecnológico. Acordará un nivel de servicio en base a los requerimientos del negocio. El científico de los datos es un perfil a medio camino entre ambos mundos, negocio y tecnología.

Big Data

El problema

El Big Data, como desafío de trabajar con datos desestructurados o semiestructurados, se caracteriza a menudo por las cinco V.

Volumen

Elevado volumen se define como el espacio de almacenamiento requerido para almacenar los datos. Por ejemplo gestionar 12 terabytes de tweets creados cada día, para mejorar el análisis de opinión de un producto.

Velocidad

Tiene dos posibles interpretaciones. Por un lado se define como la cantidad de información por unidad de tiempo que debemos obtener simultáneamente de los diferentes orígenes de datos y por otro puede interpretarse como la velocidad a la que los datos van a prescribir. A medida que aumentan los volúmenes, el valor de los datos individuales tiende a disminuir más rápidamente con el tiempo. Una idea de velocidad puede ser analizar diariamente 500.000.000 de registros detallados de llamadas en tiempo real, para predecir la pérdida de clientes más rápido.

Variedad

Se define como la complejidad de los datos de esta clase: Texto, datos de sensores, audio, video, data streams, archivos de logs y otros Esta complejidad imposibilita los medios tradicionales de análisis.

Variabilidad

Definido como las diferentes formas en las que los datos pueden ser interpretados. Las diferentes consultas requieren diferentes interpretaciones.

Veracidad

La información debe ser verificada para poder apoyarse en ella en la toma de decisiones. La Integridad como atributo de seguridad deberá preservarse.
Queda claro a pesar del nombre (Big Data), que el tamaño no es el único problema al que enfrentarse en la búsqueda de una solución. Toda esa información hay que:

  • Capturarla
  • Almacenarla
  • Consultarla
  • Gestionarla
  • Analizarla

Para muchas empresas es necesario mantener a lo largo de tiempo, ya sea por imposición legal o por pura operatividad, un gran número de datos estructurados y no estructurados, como pueden ser grandes masas de documentos, emails, y otras formas de comunicación electrónica que es necesario almacenar o consultar y que no hacen otra cosa que crecer de forma exponencial.

Diferencia entre Big Data y BI

¿Dónde empieza el Big Data y acaba el BI (Business Intelligence)?

Business Intelligence

Es una “vista de retrovisor” ya que se basa en un análisis de lo que ha ocurrido en el pasado. Se analizan los datos, en la mayoría de los casos estructurados, de volumen razonable, generados por la propia compañía y se descubre cómo ha estado funcionando el negocio para poder sacar conclusiones y tomar algún tipo de decisión.

Big Data

Dispone además de la capacidad de proporcionar predicción analítica, esto es, capacidad real de anticipación a las tendencias futuras que permitan adelantarse al mercado. El volumen, variedad, velocidad o diferentes fuentes de origen de los datos lo justifican al requerir una capacidad de análisis más avanzada.

Fuente: José Luis Colom Planas, Aspectos Profesionales

Adaptado por la División Consultoría de EvaluandSofware.com

 

¿qué software es apto para su empresa?

Acceda a nuestros evaluadores

Deja un comentario