Modelo Dimensional Fact
Publicado el 20/06/2009 por admin en Cazzella Business Intelligence

Entre los diversos formalismos desarrollados por la academia para la definición de los modelos multidimensionales, el Modelo de Datos Dimensional (DFM) es uno de los que más que otros en los últimos años ha logrado cruzar los límites de la universidad y para ser conocido y utilizado en diferentes empresas industriales y la administración pública.
Personalmente estoy cerca de seis años (desde que conseguí la implementación de un caso específico para el diseño de modelos multidimensionales) que adoptó el modelo de Realidad Dimensional (DFM) como un formalismo para la representación de las necesidades del usuario en los proyectos hasta la fecha Warehousing / Business Intelligence. En este período a menudo (especialmente durante la puesta en marcha de un nuevo proyecto) tengo que resumir "píldoras" los elementos básicos del formalismo y cómo su adopción facilitará la definición de un análisis de los requisitos de forma inequívoca interpretable en el curso de durante todo el ciclo de vida del proyecto, así que me alegro de dedicar algunos posts sobre estos temas.
NOTICIAS: Con el fin de facilitar la adopción de DFM hice un software para el diseño de Realidad Dimensional Modelo descargado de nuestro BLOG.
Antes de la introducción de las construcciones básicas de la DFM es útil resumir brevemente lo que son los principales elementos de modelado multidimensional representado por el formalismo.
Modelo de datos multidimensional
Un modelo de datos multidimensional consiste en un conjunto de magnitudes numéricas (llamado genéricamente medidas) el valor de los cuales varía en función de algunos parámetros, definidos en dominios discretos (o categóricas). Tales dominios (llamado dimensiones de análisis) son el espacio multidimensional en el que se llevó a cabo el análisis de los eventos (o sucesos de interés) se describen cuantitativamente por las medidas.
Este modelo es a menudo ejemplificado como un cubo cuyos bordes representar las dimensiones de análisis; el cubo se subdivide en muchos "cubos", cada uno de los cuales se identifica por un triple coordenadas; cada cubo contiene idealmente los valores asumidos por las medidas para esa fecha tríada. El elemento atómico (en relación con el espacio tridimensional) se conoce comúnmente como "hecho", ya que representa la ocurrencia de un evento de interés para el dominio de negocio.
El ejemplo más clásico de este modelo dimensional es el "cubo de ventas", que es el espacio de análisis para la venta de una cadena de tiendas, por lo general el tamaño de análisis son:
- el día en que se realizó la venta
- la tienda donde el coche fue vendido
- el producto vendido
mientras que las medidas que describen cuantitativamente el hecho de "venta" son:
- la cantidad de producto vendido
- el precio de venta
- el precio de compra del producto vendido

Modelos tridimensionales más complejas pueden proporcionar un mayor número de dimensiones de análisis en estos casos, se habla a menudo de hipercubo.
Los elementos de una dimensión se pueden agrupar jerárquicamente en diferentes niveles para componer un árbol: Cada nivel representa una agrupación de los elementos de tamaño uniforme con respecto a una de sus características: la raíz del árbol representa todo el tamaño, mientras que las hojas representan la sus elementos individuales. Los grupos que conforman un nivel de agregación (es decir, los elementos de la escala) están relacionados con los elementos de la capa inferior por relaciones de uno a muchos: cada grupo de un nivel (menos las hojas del árbol), incluye uno o más bandas en el nivel inferior.

Este informe es una dependencia funcional entre el nivel de agregación y la parte superior (que es dependiente de la primera), la relación funcional se deriva de la correspondencia existente entre cada grupo de artículos en un nivel de agregación y el grupo (identificación única) de Nivel más de lo que incluye. La dimensión de análisis es el único nivel de agregación independiente de una jerarquía.
El carácter de la uniformidad de los grupos de elementos que constituyen un nivel jerárquico de la agregación le da su propia identidad al mismo nivel. El mismo criterio de homogeneidad representado por él puede volver a aplicarse incluso a los elementos de otras dimensiones de análisis; viceversa los elementos de un mismo tamaño pueden ser agrupados de acuerdo a diferentes criterios con el fin de generar alternativas alberature.
Para tomar el ejemplo de las ventas del cubo, las tiendas de la tienda de tamaño pueden ser agrupados jerárquicamente según su ubicación en el país: el primer nivel de agregación es la provincia en la que reside el almacén, el próximo uno de la región y al final el estado nacional que representa la raíz del árbol. Los elementos del nivel de provincia son Roma, Milán y Brescia, que representan, respectivamente, los tres grupos de tiendas de Roma Shop = {1, 2} Shop, Shop 3} = {Milán y Brescia Shop = {4}.
Las medidas asociadas a los elementos de la dimensión pueden ser agregados (por ejemplo, sumadas) a diferentes niveles de la estructura jerárquica: la raíz del árbol representa el nivel máximo de agregación, mientras que las hojas se asocia con el valor elemental de la medida (en comparación con que el tamaño dado análisis).
El uso de diferentes jerarquías transversales de análisis permite, por ejemplo, para calcular la cantidad vendida de un producto en particular (o conjunto de productos de un proveedor en particular) en un día particular del año (o en una semana, un mes, etc.) de una tienda determinada (o de todos en la provincia de Roma y Lazio).
El DFM es un lenguaje de modelado para representar patrones multidimensionales de forma concisa y fácil de leer (gracias a su representación gráfica coincidieron), ya que cada una tiene sus propias construcciones del lenguaje formal y normas que garantizan la exclusividad de la interpretación.
El elemento principal del formalismo es el diagrama de Hecho que reúne en un único diagrama, las medidas que describen cuantitativamente un hecho, las dimensiones que constituyen el espacio de análisis multi-dimensional y jerarquías de agregación definido para cada dimensión.
La siguiente figura muestra el esquema de los hechos (comentado) en relación con el cubo de las ventas descritas anteriormente.

El hecho es representado por un área rectangular dividida en dos partes: en la parte superior el nombre del hecho (que da nombre al plan en su conjunto) y por debajo de la cotización de sus medidas.
Están directamente relacionadas con el hecho de las dimensiones de análisis representados por un círculo, flanqueada por el nombre de la dimensión. En el ejemplo se trata de la tienda, de día y de producto.
Los niveles de agregación que constituyen la jerarquía de cada dimensión se denominan atributos dimensionales de la jerarquía; su representación es similar a la de una dimensión (que es a todos los efectos un atributo dimensional de la jerarquía). El Territorio jerarquía incluye los atributos dimensionales: Tienda (el tamaño), provincia, región y estado.
Las relaciones que se unen atributos dimensionales están representados por un segmento que conecta los dos círculos; la dirección de la relación de dependencia se deduce de la posición de la dimensión en la jerarquía, cuando esto no es posible, o con el fin de aumentar la legibilidad del esquema es hacia el explicado con una flecha. El conjunto de dependencias es un grafo acíclico dirigido cuya fuente es el tamaño de análisis. En la solicitud de plan de hecho, sólo las dependencias no redundantes.
El Tiempo jerarquía tiene forma de diamante clásico en el que los días del año se pueden agrupar ya sea en los meses de semana. Dado un día del año, el mes es el día en que la semana que pertenece se identifica de forma exclusiva, y en cuestión de semanas y meses hay una dependencia funcional similar a varias semanas del año se pueden encontrar en más de dos meses. Por esta razón hay dos vías independientes de agregación del atributo día que pasa por el mes y la semana, la semana de un año o un mes, el año al que pertenecen es únicamente identificado (e independiente) y por lo tanto los dos caminos independiente reunirse con el atributo Year. Para facilitar la lectura de los esquemas, cuando un atributo depende de dos atributos diferentes es para indicar la dirección de la dependencia explícita.
Atributos dimensionales también se pueden conectar atributos de detalle (llamado adimensional) que no representan un nivel adicional de la agregación, pero sólo de la información que acompaña relacionada con el atributo de los que están conectados. Su representación se da simplemente por el nombre del atributo acompañado por un carácter de subrayado como en el caso de que la dirección de una tienda se representa en el esquema ejemplo.
4 comentarios »
RSS feed para los comentarios de esta entrada. TrackBack URL














![[Valid RSS]](/images/pages/rss2-lable.png)



No soy un experto navegante, pero esta breve descripción de DFM pareció útil, sencilla y eficaz. Aprecio y agradezco.
Gracias, interesante, bien escrita y útil
Muy interesante, he intentado leer un artículo en una posición para refrescar mi universidad el conocimiento un poco distante e inactivo. Artículo clara y concisa.
Muchas gracias.
Gran software para el modelado en DFM!
Muchas gracias.
PS No puedo dibujar el esquema lógico (tal vez la función 'no se proporciona en esta versión).