OLAP y el diseño de cubos

Los cubos son elementos claves en OLAP (online analytic processing), una tecnología que provee rápido acceso a datos en un almacén de datos (data warehouse). Los cubos proveen un mecanismo para buscar datos con rapidez y tiempo de respuesta uniforme independientemente de la cantidad de datos en el cubo o la complejidad del procedimiento de búsqueda.

Los cubos son subconjuntos de datos de un almacén de datos, organizado y sumarizado dentro de una estructura multidimensional. Los datos se sumarizan de acuerdo a factores de negocio seleccionados, proveyendo el mecanismo para la rápida y uniforme tiempo de respuesta de las complejas consultas.

La definición del cubo, es el primero de tres pasos en la creación de un cubo. Los otros pasos son, el especificar la estrategia de sumarización diseñando las agregaciones (elementos precalculados de datos), y la carga del cubo para procesarlo. Para definir un cubo, seleccione una tabla objetivo y seleccione las medidas (columnas numéricas de interés a los usuarios del cubo) dentro de esta tabla. Entonces seleccione las dimensiones, cada compuesta de una o mas columnas de otra tabla. Las dimensiones proveen la descripción categórica por el cual las medidas son separadas para su análisis por los usuarios del cubo.

Dimensiones

Las Dimensiones son categorías descriptivas por los cuales los datos numéricos (Las Mediciones) en un cubo, son separados para su análisis. Por ejemplo, si una medición de un cubo es el conteo de la producción, y las dimensiones son Tiempo, localización de la fábrica y el producto, los usuarios del cubo, podrán separar el conteo de la producción, dentro de varias categorías de tiempo, localización de la fábrica y productos.

Una dimensión puede ser creada para usarse en un cubo individual o en múltiples cubos. Una dimensión creada para un cubo individual, es llamada dimensión privada. Por el contrario si esta puede ser usada por múltiples cubos, se le llama dimensión compartida. Estas podrán ser usadas dentro de todo cubo, en la base de datos, así se optimiza el tiempo y se evita el andar duplicando dimensiones privadas.

Las dimensiones compartidas, también habilitan la estandarización de las métricas de negocios entre cubos. Por ejemplo, el estandarizar las dimensiones compartidas para el tiempo y localización geográfica, aseguran que los datos analizados, desde diferentes cubos, estén organizados similarmente.

Medidas

Las Medidas, son datos numéricos de interés primario para los usuarios del cubo. Algunas medidas comunes son Ventas en unidades, ventasen pesos, costo de ventas, gastos, conteo de la producción, presupuesto, etc. Estas son usadas por el procedimiento de agregación de los servicios de OLAP y almacenadas para su rápida respuesta a las peticiones de los usuarios.

Se puede crear una medida calculada y calcular miembros de dimensiones, combinando expresiones multidimensionales ( MDX ), fórmulas matemáticas y funciones definidas por el usuario (UDFs). Esta facilidad, habilita a usted a definir nuevas medidas y miembros de dimensión, basados sobre una sintaxis de fórmulas sencillas. Se pueden registrar adicionales bibliotecas de UDFs, para utilizarse en la definición de miembros calculados.

Propiedades de Miembros

Usted puede definir propiedades para los miembros de dimensión y usar datos para estas propiedades dentro de un cubo. Por ejemplo, si los miembros de la dimensión producto son sus número de partes, es lo mismo hacer varias propiedades asociadas con este número de parte tales como, el tamaño, color, etc. Usted puede especificar tales propiedades, como una propiedad miembro y utilizarla en las búsquedas analíticas.

Cubos Virtuales

Usted puede juntar cubos, dentro de cubos virtuales, muy parecido al proceso de juntar tablas con vistas en las bases de datos relacionales. Un cubo virtual, provee acceso a los datos en los cubos combinados, si la necesidad de construir un nuevo cubo, mientras permite que se mantenga en mejor diseño en cada cubo individual.

Un cubo podrá ser actualizado, procesando solo los datos que han sido añadidos, en vez de hacerlo con el cubo entero, se puede usar la actualización incremental para actualizar un cubo mientras se este usando.

Agregaciones

Así se le llama al proceso de precalcular sumas de datos, para ayudar a disminuir los tiempos de respuestas, en los procesos de búsquedas de información.

Seguridad

Usando las facilidades de seguridad manejadas por Microsoft SQL Server OLAP services, usted puede controlar quien accesa los datos y los tipos de operaciones que los usuarios pueden ejecutar con los datos. OLAP services soporta el sistema de seguridad integrado que ofrece el sistema operativo Windows NT y permite que usted asigne permisos de acceso, a la base de datos y al cubo incluyendo a los cubos virtuales.

La seguridad es manejada vía los derechos de control de acceso que son manejados por los Roles, estos determinan el tipo de acceso a los datos. Los Roles definen, categorías de usuarios con los mismos controles de acceso.
Modos de Almacenaje

Para los cubos, se ofrece tres formas de almacenar su información:

1.- MOLAP – Multidimensional OLAP.
2.- ROLAP – Relacional OLAP.
3.- HOLAP – OLAP híbrido.

MOLAP

Los datos fuente del cubo son almacenados junto con sus agregaciones (sumarizaciones) en una estructura multidimensional de alto rendimiento. El almacenaje de MOLAP, provee excelente rendimiento y compresión de datos. Como se dice, todo va en el cubo.

Tiene el mejor tiempo de respuesta, dependiendo solo en el porcentaje y diseño de las agregaciones del cubo. En general este método, es muy apropiado para cubos con uso frecuente por su rápida respuesta.

ROLAP

Toda la información del cubo, sus datos, su agregación, sumas etc., son almacenados en una base de datos relacional. ROLAP no almacena copia de la base de datos, accesa las tablas originales cuando necesita responder a preguntas, es generalmente, mucho mas lenta que las otras dos estrategias de almacenaje.

Típicamente ROLAP se usa, para largos conjuntos de datos que no son frecuentemente buscados, tales como datos históricos de de los años mas recientes.

HOLAP

HOLAP combina atributos de MOLAP y ROLAP, la agregación de datos es almacenada en una estructura multidimensional usada por MOLAP, y la base de datos fuentes, en una base de datos relacional. Para procedimientos de búsqueda que accesan datos sumarizados, HOLAP es equivalente a MOLAP, por el contrario si estos procesos accesarán datos fuentes como los drill down, estos deben de buscar los datos en la base de datos relacional y esto no es tan rápido comparado a si los datos estuvieran almacenados en una estructura MOLAP.

Los cubos almacenados en como HOLAP, son mas pequeños que los MOLAP y responden mas rápidos que los ROLAP.

HOLAP es generalmente usado para cubos que requieren rápida respuesta, para sumarizaciones basadas en una gran cantidad de datos.

Cita esta página

Martínez Orol Jorge Alfredo. (2007, marzo 22). OLAP y el diseño de cubos. Recuperado de https://www.gestiopolis.com/olap-y-el-diseno-de-cubos/
Martínez Orol Jorge Alfredo. "OLAP y el diseño de cubos". gestiopolis. 22 marzo 2007. Web. <https://www.gestiopolis.com/olap-y-el-diseno-de-cubos/>.
Martínez Orol Jorge Alfredo. "OLAP y el diseño de cubos". gestiopolis. marzo 22, 2007. Consultado el . https://www.gestiopolis.com/olap-y-el-diseno-de-cubos/.
Martínez Orol Jorge Alfredo. OLAP y el diseño de cubos [en línea]. <https://www.gestiopolis.com/olap-y-el-diseno-de-cubos/> [Citado el ].
Copiar

Escrito por:

Imagen del encabezado cortesía de 53384689@N06 en Flickr