¿Qué Software es apto para su empresa?

Acceda a nuestros evaluadores

Conforme avanza el tiempo y evoluciona la tecnología, la competitividad de las empresas y su agilidad son más dependientes de decisiones que son apoyadas por la inteligencia de negocio o Business Intelligence (BI), informes y análisis. Los analistas de datos de las empresas exploran diferentes escenarios de negocio mediante la combinación de varios conjuntos de datos de gran tamaño que, en muchos, casos contienen información tanto estructurada como no estructurada.

Ante la dependencia del Business Intelligence (BI) no debería ser una sorpresa que los usuarios analistas deban tener confianza absoluta en sus procesos de toma de decisiones, lo que implica contar con datos confiables y disponibles para ellos.

La calidad de los datos es especialmente importante ya que los volúmenes y el número de fuentes de los mismos crece, pero ¿Que se entiende por “datos de alta calidad”?

Los profesionales de la gestión de datos suelen definir calidad en términos de “aptitud para el uso”, pero ese concepto se vuelve rápidamente obsoleto como consecuencia de las numerosas maneras en que los mismos conjuntos de datos son reutilizados muchas veces.

Calidad de datos de Business Intelligence

Desde el punto de vista de análisis, la calidad de los datos se define mejor en términos del grado en que los defectos de datos afectan los resultados analíticos. Dentro de una organización, puede evaluarse utilizando las siguientes dimensiones:

Integridad

Mide si un conjunto de datos contiene el número total de registros o instancias que debería, así como el grado en que cada instancia de datos tiene un conjunto completo de los valores de los elementos de datos obligatorios. Los datos incompletos pueden tener un efecto perjudicial en el análisis, en particular en el contexto de las agregaciones (por ejemplo, sumas y los promedios), están sesgadas por valores de datos faltantes.

Precisión

Es el control de los valores de datos versus sus contrapartes del mundo real. Por ejemplo, confirma que los números de teléfono introducidos en un sistema coinciden con los números reales. Un pequeño número de inexactitudes en un gran conjunto de datos podría no tener relevancia estadística; pero como con un conjunto de datos incompletos, un mayor número de inexactitud sesgaría los resultados. Además, los valores incorrectos pueden exponer a su organización a los impactos de negocio tales como la pérdida de oportunidades para la generación de ingresos, el aumento de los costos y mayores riesgos.

Moneda

Se centra en cómo, hasta la fecha, son los conjuntos de datos que se analiza. No es aconsejable tomar decisiones críticas de negocio basadas en datos obsoletos, por lo que asegurar que los datos analíticos son actuales es vital.

Consistencia

Considera el grado en que la información de diferentes conjuntos de datos se puede corroborar, así como el valor dentro y a través de conjuntos de registros. Por ejemplo, en un registro que representa a los términos de un contrato, una fecha que es posterior en el tiempo a la fecha de finalización del contrato sería una incoherencia. Los conjuntos de datos que son inconsistentes plantean temas de integración y fusión, lo que lleva a la información duplicada y potencialmente inexacta.

Errores: No hay daño, no hay falta

¿Cómo se puede determinar si los datos de origen son adecuados para sus potenciales múltiples usos? La respuesta se simplifica mediante la correlación de los errores de datos y los problemas con el potencial de impacto en el negocio “aguas abajo”. La calidad de un conjunto de datos normalmente es aceptable siempre y cuando los errores no afectan a los resultados del negocio. En consecuencia, las empresas deben utilizar un enfoque de colaboración para definir las medidas, métodos de puntuación y los niveles de aceptabilidad para todos los escenarios de uso analíticos.

Esta visión de la calidad de los datos se puede ilustrar con un ejemplo: un mega-minorista en línea puede analizar millones de transacciones diarias para buscar patrones emergentes que crean oportunidades para los paquetes de productos y la venta cruzada. Debido al volumen de los registros y el resultado es de esperar y tolerar, un pequeño número de errores de datos. Sin embargo, la misma empresa no puede tolerar los defectos de datos cuando se utiliza el mismo conjuntos de datos para responder a preguntas específicas de atención al cliente.

En otras palabras, los requisitos de calidad de datos están directamente relacionados con la forma en que los datos se utilizan en aplicaciones de negocios individuales, incluyendo inteligencia de negocios (BI) y análisis. Establecer el nivel necesario de confianza en los datos analíticos implica comprometer a los usuarios de negocio y comprender lo que van a hacer con los datos.

Con el conocimiento específico de cómo los errores de datos pueden afectar la toma de decisiones, se pueden incorporar controles en los procesos de gestión del ciclo de vida de datos para:

  • Garantizar el cumplimiento de las reglas de calidad
  • Monitorear la calidad frente a los niveles de aceptabilidad acordados.
  • Alertar a los administradores de datos sobre los problemas de calidad, mientras que podría suceder la
  • limpieza automatizada para satisfacer las necesidades de los que siguen en la cadena de uso o análisis (aguas abajo).

Cuando se hace correctamente, los beneficios son enormes: La implantación de medidas de gestión y control de calidad de datos eficaz como parte de su programa de Business Intelligence (BI) ayudará a conducir a la coherencia, la previsibilidad y la confiabilidad que son tan importantes para el éxito de las iniciativas de análisis de negocios.

Fuente,
Adaptado por la División Consultoría de Evaluando Software.

 

¿Qué Software es apto para su empresa?

Acceda a nuestros evaluadores