Tratamiento de los datos: OLTP, OLAP, Data Warehouse

Obtener información de un sistema sería muy difícil si los datos no estuvieran organizados o si no hubiera una forma sistemática de recuperarlos. Por lo tanto en todo sistema de información, los recursos de datos deben estructurarse y organizarse de cierta manera lógica.

Sistemas Olap

La naturaleza competitiva y dinámica del entorno empresarial de hoy está impulsando la demanda de sistemas de información por parte de gerentes y analistas empresariales, que puedan proporcionar respuestas rápidas a consultas empresariales complejas.

La industria de los sistemas de información respondió a estas demandas con desarrollos como las bases de datos analíticas, los almacenes de datos, las técnicas de explotación de datos, las estructuras de bases de datos multidimensionales y con servidores especializados y productos de software que respaldan el procesamiento analítico en líneas (OLAP).

Se pueden considerar los sistemas OLAP (Online Analytical Processing) como pertenecientes a los sistemas de información para ejecutivos, conocidos como EIS, siglas del inglés Enterprise Information System, utilizados para proporcionar al nivel estratégico información útil para la toma de decisiones.

Con OLAP los datos son clasificados en diferentes dimensiones las que pueden ser vistas unas con otras en cualquier combinación para obtener diferentes análisis de los datos que contienen. En un modelo de datos OLAP, la información es vista como cubos, los cuales consisten de categorías descriptivas (dimensiones) y valores cualitativos (medidas). El modelo de datos multidimensional simplifica a los usuarios formular consultas complejas, arreglar datos en un reporte, cambiar de datos detallados y filtrar o rebanar los datos en subconjuntos significativos.

datos

Por ejemplo, las dimensiones típicas de un cubo que contenga información de ventas incluirían: tiempo, región producto , canal, organización y escenario (planeado o real). Las medidas típicas incluirían: ventas de dólares (u otra moneda), unidades vendidas, número de personas, ingresos y gastos.

Operaciones a realizar con una herramienta OLAP

OLAP comprende varias operaciones analíticas básicas, incluidas la consolidación, “drill-down” y “ slicing and dicing”:

Consolidación

Comprende el conjunto de datos. Este puede involucrar acumulaciones simples o agrupaciones complejas que incluyen datos interrelacionados. Por ejemplo, las oficinas de ventas pueden agruparse respecto a los distritos, y los distritos respecto a las regiones.

Drill-down

OLAP puede moverse en la dirección contraria y presentar automáticamente datos detallados que abarcan datos consolidados. Esto recibe el nombre de drill-down. Por ejemplo, podría accederse fácilmente las ventas por productos individuales o representantes de ventas que conforman las ventas totales de una región.

Slicing and dicing

Se refiere a la capacidad de visualizar a las bases de datos desde diferentes puntos de vista. Una parte de la base de datos de ventas podría mostrar todas las ventas del tipo de producto dentro de las regiones. Otra parte podría mostrar las ventas por canal de ventas dentro de cada tipo de producto. El slicing and dicing con frecuencia se realiza a lo largo de un eje de tiempo con el fin de analizar tendencias y encontrar patrones.

Los usuarios de negocio y la vista de los Datos

La vista de los datos como un cubo es una extensión natural de cómo la mayoría de los usuarios de negocios interactúan.
Ellos ven a un problema de negocios en términos de un cierto número de componentes (dimensiones) tales como productos, tiempo, regiones, fabricantes, o artículos. Los usuarios de negocios desean poder analizar un conjunto de números usando cualquier par de estos componentes, como así también poder intercambiarlos para lograr distintas vistas.

Un ejemplo podría ser el siguiente: la mayoría de los usuarios desearían ver cómo se desarrollan las ventas a lo largo del tiempo. Para ello, se necesitan varias hojas de la planilla de cálculo. Estas mismas celdas de datos pueden ser visualizadas mediante un cubo.

datos

Dado que las celdas de datos pueden ser fácilmente representadas en un cubo, se puede tomar rebanadas del mismo para responder a una diversidad de preguntas. Esta Idea es esquematizada en la siguiente figura:

Modelos de Almacenamientos

Existen tres modelos de almacenamientos:

  • MOLAP
  • ROLAP
  • HOLAP

MOLAP – OLAP multidimensional

En estos sistemas los datos se encuentran almacenados en una estructura multidimensional. Para optimizar los tiempos de respuesta, el resumen de la información es, usualmente, calculado por adelantado. Estos valores precalculados o agregaciones son la base de las ganancias de desempeño de este sistema. Algunos sistemas utilizan técnicas de compresión de datos para disminuir el espacio de almacenamiento en disco debido a los valores precalculados.

ROLAP

Son sistemas en los cuales los datos se encuentran almacenadas en una base de datos relacional.Típicamente, los datos son detallados, evitando las agregaciones y las tablas se encuentran normalizadas. Los esquemas más comunes sobre los que se trabaja son estrella o copo de nieve, aunque es posible trabajar sobre cualquier base de datos relacional.

HOLAP – OLAP Híbrido

Estos sistemas mantienen los registros detallados en la base de datos relacional, mientras que los datos resumidos o agregados se almacenan en una base de datos multidimensional separada.

OLTP

OLTP son los sistemas conocidos como On-Line Transactional Processing. Estos procesan las transacciones de tiempo real de un negocio. Contienen estructuras de datos optimizadas para la introducción y a la adición de los datos.

Su principal desventaja es que proporciona capacidades muy limitadas para la toma de decisiones.

Se podría decir que estos sistemas definen el comportamiento operacional de un entorno operacional de gestión:

  • Altas, bajas, modificaciones, consultas.
  • Consultas rápidas y encuestas.
  • Poco volumen de información.
  • Transacciones rápidas.
  • Gran volumen de concurrencia.
  • Diferencias entre OLTP y OLAP

Las principales diferencias existentes con los sistemas OLAP se pueden observar en la siguiente tabla:

Diferencias entre OLTP y Data Warehouse

Las principales diferencias existentes entre los sistemas OLTP y Data Warehouse son los siguientes:

  • Las aplicaciones OLTP están organizadas para ejecutar las transacciones para las cuales fueron hechas; en cambio el Data Warehouse está organizado en base a conceptos.
  • El número de usuarios de un Data Warehouse en general es menos que el existente en un sistema OLTP.
  • Los sistemas OLTP realizan cientos de transacciones por segundos, mientras que en una sola consulta en una Data Warehouse podría llevar varios minutos.
  • El diseño de un OLTP es considerablemente normalizado mientras que un DW tiende a ser desnormalizado.
  • Por lo general los OLTP son de menor tamaño que los DW, debido a que estos últimos están formados por información de varios OLTPs.
  • El OLTP normalmente está formado por un número mayor de tablas, con pocas columnas; mientras que en un DW el número de tablas es menor, pero cada una de éstas tiende a ser mayor en número de columnas.
  • Los OLTP son continuamente actualizados por los sistemas operacionales del día, mientras que los DW son actualizados en batch de manera periódica.
  • Las estructuras de los OLTP son muy estables, rara vez cambian, mientras las de los DW sufren cambios constantes derivados de su evolución.
Fuente: María de los Ángeles Ibarra, Procesamiento Analítico en Línea, Diseño y administración de datos, Universidad Nacional del Nordeste, Argentina.

Adaptado por la División consultoría de EvaluandoSoftware.com

 

¿qué software es apto para su empresa?

Acceda a nuestros evaluadores

Deja un comentario