Los cubos son subconjuntos de datos de un almacén de datos,
organizado y sumarizado dentro de una estructura multidimensional. Los
datos se sumarizan de acuerdo a factores de negocio seleccionados,
proveiendo el mecanismo para la rápida y uniforme tiempo de respuesta de
las complejas consultas.
La definición del cubo, es el primero de tres pasos en la creación de un
cubo. Los otros pasos son, el especificar la estrategia de sumarización
diseñando las agregaciones (elementos precalculados de datos), y la
carga del cubo para procesarlo. Para definir un cubo, seleccione una
tabla objetivo y seleccione las medidas (columnas numéricas de interés a
los usuarios del cubo) dentro de esta tabla. Entonces seleccione las
dimensiones, cada compuesta de una o mas columnas de otra tabla. Las
dimensiones proveen la descripción categórica por el cual las medidas
son separadas para su análisis por los usuarios del cubo.
Dimensiones
Las Dimensiones son categorías descriptivas por los cuales los datos
numéricos (Las Mediciones) en un cubo, son separados para su análisis.
Por ejemplo, si una medición de un cubo es el conteo de la producción, y
las dimensiones son Tiempo, localización de la fábrica y el producto,
los usuarios del cubo, podrán separar el conteo de la producción, dentro
de varias categorías de tiempo, localización de la fábrica y productos.
Una dimensión puede ser creada para usarse en un cubo individual o en
múltiples cubos. Una dimensión creada para un cubo individual, es
llamada dimensión privada. Por el contrario si esta puede ser usada por
múltiples cubos, se le llama dimensión compartida. Estas podrán ser
usadas dentro de todo cubo, en la base de datos, así se optimiza el
tiempo y se evita el andar duplicando dimensiones privadas.
Las dimensiones compartidas, también habilitan la estandarización de las
métricas de negocios entre cubos. Por ejemplo, el estandarizar las
dimensiones compartidas para el tiempo y localización geográfica,
aseguran que los datos analizados, desde diferentes cubos, estén
organizados similarmente.
Medidas
Las Medidas, son datos numéricos de interés primario para los usuarios
del cubo. Algunas medidas comunes son Ventas en unidades, ventasen
pesos, costo de ventas, gastos, conteo de la producción, presupuesto,
etc. Estas son usadas por el procedimiento de agregación de los
servicios de OLAP y almacenadas para su rápida respuesta a las
peticiones de los usuarios.
Se puede crear una medida calculada y calcular mienbros de dimensiones,
combinando expresiones multidimensionales ( MDX ), fórmulas matemáticas
y funciones definidas por el usuario (UDFs). Esta facilidad, habilita a
usted a definir nuevas medidas y miembros de dimensión, basados sobre
una sintaxis de fórmulas sencillas. Se pueden registrar adicionales
bibliotecas de UDFs, para utilizarse en la definición de miembros
calculados.
Propiedades de Miembros
Usted puede definir propiedades para los miembros de dimensión y usar
datos para estas propiedades dentro de un cubo. Por ejemplo, si los
miembros de la dimensión producto son sus número de partes, es lo mismo
hacer varias propiedades asociadas con este número de parte tales como,
el tamaño, color, etc. Usted puede especificar tales propiedades, como
una propiedad miembro y utilizarla en las búsquedas analíticas.
Cubos Virtuales
Usted puede juntar cubos, dentro de cubos virtuales, muy parecido al
proceso de juntar tablas con vistas en las bases de datos relacionales.
Un cubo virtual, provee acceso a los datos en los cubos combinados, si
la necesidad de construir un nuevo cubo, mientras permite que se
mantenga en mejor diseño en cada cubo individual.
Un cubo podrá ser actualizado, procesando solo los datos que han sido
añadidos, en vez de hacerlo con el cubo entero, se puede usar la
actualización incremental para actualizar un cubo mientras se este
usando.
Agregaciones
Así se le llama al proceso de precalcular sumas de datos, para ayudar a
disminuir los tiempos de respuestas, en los procesos de búsquedas de
información.
Seguridad
Usando las facilidades de seguridad manejadas por Microsoft SQL Server
OLAP services, usted puede controlar quien accesa los datos y los tipos
de operaciones que los usuarios pueden ejecutar con los datos. OLAP
services soporta el sistema de seguridad integrado que ofrece el sistema
operativo Windows NT y permite que usted asigne permisos de acceso, a la
base de datos y al cubo incluyendo a los cubos virtuales.
La seguridad es manejada via los derechos de control de acceso que son
manejados por los Roles, estos determinan el tipo de acceso a los datos.
Los Roles definen, categorías de usuarios con los mismos controles de
acceso.
Modos de Almacenaje
Para los cubos, se ofrece tres formas de almacenar su información:
1.- MOLAP - Multidimensional OLAP.
2.- ROLAP - Relacional OLAP.
3.- HOLAP - OLAP híbrido.
MOLAP
Los datos fuente del cubo son almacenados junto con sus agregaciones (sumarizaciones)
en una estructura multidimensional de alto rendimiento. El almacenaje de
MOLAP, provee excelente rendimiento y compresión de datos. Como se dice,
todo va en el cubo.
Tiene el mejor tiempo de respuesta, dependiendo solo en el porcentaje y
diseño de las agregaciones del cubo. En general este método, es muy
apropiado para cubos con uso frecuente por su rápida respuesta.
ROLAP
Toda la información del cubo, sus datos, su agregación, sumas etc., son
almacenados en una base de datos relacional. ROLAP no almacena copia de
la base de datos, accesa las tablas originales cuando necesita responder
a preguntas, es generalmente, mucho mas lenta que las otras dos
estrategias de almacenaje.
Típicamente ROLAP se usa, para largos conjuntos de datos que no son
frecuentemente buscados, tales como datos históricos de de los años mas
recientes.
HOLAP
HOLAP combina atributos de MOLAP y ROLAP, la agregación de datos es
almacenada en una estructura multidimensional usada por MOLAP, y la base
de datos fuentes, en una base de datos relacional. Para procedimientos
de búsqueda que accesan datos sumarizados, HOLAP es equivalente a MOLAP,
por el contrario si estos procesos accesaran datos fuentes como los
drill down, estos deben de buscar los datos en la base de datos
relacional y esto no es tan rápido comparado a si los datos estuvieran
almacenados en una estructura MOLAP.
Los cubos almacenados en como HOLAP, son mas pequeños que los MOLAP y
responden mas rápidos que los ROLAP.
HOLAP es generalmente usado para cubos que requieren rápida respuesta,
para sumarizaciones basadas en una gran cantidad de datos.
Ingeniero Informático y actualmente cursa una Maestría en Informática Aplicada. Cuba.
Acerca de GestioPolis
Participar en la comunidad
Derechos de Autor
GestioPolis es la primera comunidad de conocimiento en negocios de Hispanoamérica
Derechos Reservados sobre el concepto del sitio web
GestioPolis.com
© 2008 Carlos López
| Hazte miembro de GestioPolis |
|
Y Descarga 11 eBooks
GRATIS |