Un data mart es una base de datos departamental, especializada en el almacenamiento de los datos de un área de negocio específica. Se caracteriza por disponer la estructura óptima de datos para analizar la información al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento.
Los data mart son subconjuntos de datos con el propósito de ayudar a que un área específica dentro del negocio pueda tomar mejores decisiones. Los datos existentes en este contexto pueden ser agrupados, explorados y propagados de múltiples formas para que diversos grupos de usuarios realicen la explotación de los mismos de la forma más conveniente según sus necesidades.
Históricamente, los datos de una empresa suelen residir en bases que se diseñaron principalmente para introducir y almacenar datos, mediante el llamado Proceso de Transacciones Online (OLTP). Este método es idóneo para insertar, modificar o borrar registros, pero no lo es tanto para responder a complejas consultas.
La relación entre los datos responde, cuando existe, a unas técnicas llamadas de Entidad-Relación (modelo-Relacional).
Data warehouse y data mart
Los data warehouse surgen precisamente en respuesta a los problemas asociados a realizar análisis de datos sobre bases de datos del tipo OLTP. La solución propuesta por el data warehouse es extraer los datos de una (o más) bases operacionales y moverlos a una base de datos independiente y orientada a las consultas.
Pero el problema surge cuando los data warehouse crecen y se tornan más complejos. Debido a esto, el rendimiento de las consultas decae y el modelo centralizado deja de ser óptimo. En estos casos, la solución es crear unos almacenes de datos especializados por áreas como Ventas o Compras, que reciben los datos desde el almacén centralizado (DW) y que pueden residir en diferentes máquinas, bases de datos, redes, etc. Cada uno de estos almacenes se conoce como data mart.
Dado que un data mart soporta menos usuarios que un data warehouse, se puede optimizar para recuperar más rápidamente los datos que necesitan los usuarios.
Clasificación del data mart
Data mart dependiente
Los data mart dependientes son aquellos que reciben los datos desde una data warehouse. En este tipo de Datamart, la fuente de los datos es única.
Data mart independiente
Son aquellos que toman sus datos directamente desde los sistemas transaccionales y no dependen de otros data warehouse. Este tipo de Datamart se alimenta generalmente de las organizaciones.
Data mart híbrido
Los data mart híbridos permiten combinar las fuentes de datos de un data warehouse corporativo con otras fuentes de datos, tales como sistemas transaccionales y/o operacionales.
Tipos de DataMarts
Data mart OLAP
Se basan en los populares cubos OLAP, que se construyen agregando, según los requisitos de cada área o departamento, las dimensiones y los indicadores necesarios de cada cubo relacional.
Data mart OLTP
Pueden basarse en un simple extracto del data warehouse, no obstante, lo común es introducir mejoras en su rendimiento (las agregaciones y los filtrados suelen ser las operaciones más usuales) aprovechando las características particulares de cada área de la empresa.
Los data mart que están dotados con estas estructuras óptimas de análisis presentan las siguientes ventajas:
- Poco volumen de datos.
- Mayor rapidez de consulta.
- Validación directa de la información.
- Facilidad para la historia de los datos.
División consultoría de EvaluandoSoftware.com