En el momento en que nace una idea de negocio en particular, suponemos que se inicia la generación de los datos relacionados con la misma. Como consecuencia directa, del flujo de datos es necesario analizar esa cantidad y obtener conclusiones especiales e información sobre algún área del proceso de negocios.

El uso de datos analíticos como uno de los procesos clave en el enfoque de negocios moderno no es una nueva tendencia. Por el contrario, durante décadas, se lo ha relacionado con las finanzas, la economía y los negocios en general. Podríamos decir que en el momento en que nace una idea de negocio en particular, suponemos que se inicia la generación de los datos relacionados con tal idea. Como consecuencia directa, del flujo de datos es necesario analizar, de alguna manera, esa cantidad y obtener conclusiones especiales e información sobre algún área del proceso de negocios.

Al comienzo nos ocupamos pequeñas cantidades de datos que es relativamente fácil seleccionar, clasificar, analizar y representar los resultados obtenidos. Pero la mayoría de los factores que se relacionan con una empresa no son constantes.

Estamos tratando con variables, datos y fuentes que crecen y cada vez se han más complejas. El flujo que comienza siendo gotas de lluvia se transforma en una cascada. De pronto, nos encontramos lidiando con enormes volúmenes que deben dar información rápidamente. A esta altura no podemos hablar de conjunto de datos. Debemos definir el concepto de Big Data para el negocio.

La pregunta lógica que surge es por qué se hace tanto énfasis en Big. Después de todo los datos son datos sin importar su tamaño o volumen. Eso es correcto desde el punto de vista filosófico, pero desde el punto de vista del Business Intelligence necesitamos mejorar nuestro potencial de negocios, de alguna forma, con esa gran cantidad de datos.

Nuestro objetivo es proporcionar las respuestas con la velocidad adecuada, queremos manipular con datos tan pronto como sea posible, deseamos la gestión de datos en tiempo real.
datos
Asumamos que cada uno de la mitad de los 1.000 asistentes pertenecen a una única organización y que cada una de ellas está relacionada con 50 investigadores que, a su vez, publicaron 20 trabajos. Así que disponemos de 500 fuentes para recopilar datos. De manera que el volumen de datos que debemos recolectar es un mínimo de 500.000 datos para este caso particular (500 organizaciones x 50 investigadores x 20 trabajos presentados). Hablamos de un mínimo, ya que utilizamos una aproximación de cada elemento. Pero, como se sabe, en el mundo real la situación es más compleja. De hecho cada trabajo presentado, conocido también como “paper”, contiene al menos los nombres de los autores, nombre del documento, año, resumen, cantidad de páginas y otros datos más.

¿Y si los organizadores realizan más de una conferencia y desean analizar los datos combinados de todos los eventos de los últimos cinco años?

Como una prueba de lo mencionado más arriba, presentamos los resultados del análisis de los datos almacenados en Estados Unidos en el año 2009. Llegamos a la conclusión que ahora, muchos años después, el volumen de datos debe ser aún mayor.

Como se puede ver en el gráfico 1, se pueden alcanzar un amplio volumen de datos, que crecen velozmente y sumamente variados.

datos

Datos no estructurados y de negocios

En el pasado todos los datos de negocio con los que trabajamos eran estructurados. Las decisiones se tomaban basados estrictamente en datos localizados en las bases de datos de las compañías. Había casos de uso de fuentes externas, pero la cantidad de fuentes eran pequeñas y se usaban bajo normas muy estrictas de la empresa.

Un ejemplo típico es la medición de la satisfacción del cliente sobre algunos productos de la compañía para decidir sobre su continuidad o discontinuación. El proceso se inicia con entrevistas a los clientes, con preguntas y respuestas muy definidas, generalmente del tipo sí/no. Luego se medían la cantidad de una u otra respuesta y se decidía qué hacer.

Con este enfoque las empresas no tenían la capacidad de obtener una imagen real de sus consumidores y del uso del producto. De hecho se interrumpió la venta de muchos de ellos que no habían sido fracasos.

Todo esto cambió en los últimos años. Las comunicaciones masivas comenzaron a jugar un rol muy importante en todos los ámbitos de la vida empresarial y en el estilo de vida de los clientes. Las soluciones de negocio modernas están utilizando un nuevo tipo de datos llamado no estructurados, también conocidos como ad hoc. Dos ejemplos sencillos: el correo electrónico y las redes sociales.

Correo electrónico

Es la comunicación dominante en el mundo empresarial. Técnicamente cada mensaje tiene estructura: cabecera, cuerpo y pié.

La parte más desestructurada del mensaje es el cuerpo. Contiene piezas de información que nos pueden ser muy útiles si pudiéramos en términos de inteligencia de negocios. Se pueden descubrir patrones de comunicación. No obstante pueden ser cambiados fácilmente por el remitente. Esto cambios son parte de la naturaleza humana. Por ejemplo el mismo lenguaje humano. Su interpretación es muy difícil pues nos expresamos con percepciones en lugar de hacerlo con hechos.

Veamos un ejemplo. Se le debe comunicar a un clientes sobre el retraso de una entrega. Es muy probable que el responsable de hacerlo escriba “Debo informarle que el transporte del producto tal vez llegue un día más tarde”.

La palabra “tal vez” es la que puede cambiar el sentido de todo. Nosotros sabemos interpretarla pero un sistema no es capaz de decidir con un simple análisis de esa expresión.

La mayor parte de las comunicaciones tiene este tipo de construcción que posee cierta incertidumbre. Pero es una frase dentro de una oración. Y un mensaje de correo electrónico puede contener una docena de expresiones similares.

Redes sociales

Hay quienes dicen que las redes sociales llegaron a la escena y cambiaron el mundo. Lo cierto es que su población crece rápidamente.

Las dos palabras claves para las decisiones de negocios son: todo y todos. Esto significa que en este momento las empresas tienen un mejor flujo de datos para sus propósitos y que no se refieren estrictamente a los que se utilizan dentro de los sistemas de gestión de las compañías. Veamos un ejemplo.

Una empresa de América Latina con sucursales en Europa y Estados Unidos lanza un producto en los tres mercados. El cliente A se encuentra en Serbia y el cliente B en Estados Unidos. Ambos quieren decir algo acerca de ese nuevo producto.

Ninguno llamaría a la sede en América Latina porque el costo de las llamadas es alto. Tampoco escribirían un mail porque piensan que recibirán una respuesta automatizada tal como reciben todos los clientes.

Entonces ¿Qué hacen?

Inician la sesión es una de las redes de las que forman parte, se unen a algún grupo de discusión relacionado con el producto o la empresa o los usos y discuten con otros miembros. Incluso, puede llegar a pasar que A y B interactúen entre sí.

De este sencillo ejemplo, podemos concluir que gran cantidad de datos se genera dentro de las redes sociales y por fuera de la red corporativa de la empresa.

El primer problema es que la compañía no sería consciente de estos datos cruciales. El segundo es que los clientes pueden discutir de todo lo que quieren y en algún lugar de esa discusión el producto será nombrado unas pocas veces.

Fuente: Snezana Stolic (PhD student at Megatrend University, Serbia); Dinko Primorac (University North, Croatia); Big data as a new approach for better social impacts of business decisions; 5th Eastern European Economic and Social Development Conference on Social Responsibility

Traducido y adaptado por la División Consultoría de EvaluandoSoftware.com