Del 30 de octubre al 2 de noviembre se celebrará en Londres el habitual Gestión e Información Conferencia de Calidad de Datos . El recién llegado del año es una pista dedicada a los temas de Data Warehousing y Business Intelligence. Navegación a través de las presentaciones de la intervención de gran importancia en relación con la gestión de los metadatos me di cuenta de que el foco está todo centrado en cómo construir, consolidar y mantener un repositorio centralizado de metadatos que son metadatos integrados producidos durante el ciclo de desarrollo sistema. Tal integración se lleva a cabo típicamente "a posteriori", es decir, en el mejor de los casos, al final de cada etapa de diseño de iteración.
Este es el mismo método que he seguido en el diseño de la metodología en que se basa el sistema de gestión de metadatos se dio cuenta en el almacén de datos de EGR . Este sistema consiste en productos comerciales y componentes de software escritos ad-hoc con el fin de reconstruir una "visión integrada, homogénea y estructurada" sistema de almacenamiento de datos en su totalidad. Esta experiencia se resume en un documento (versión PROYECTO) hice aguas abajo del proceso de certificación del sistema de almacenamiento de datos dirigida por Bill Inmon siguiendo también el interés y el reconocimiento de que la gestión de metadatos de componente ha despertado en este la sede.
El mercado para los productos comerciales en el almacén de datos está casi alineado a seguir este enfoque general, que implica la generación de metadatos para los diversos componentes de una manera casi independiente y sin relación. En particular, las diferentes herramientas (modelado de caso de los datos, ETL, front-end, etc.) Utilizados para la producción de los diferentes componentes del sistema (base de datos, los procesos de alimentación, reposrtistica, etc.) Tienen su propio repositorio de metadatos que describen el componente producido, un sistema de gestión de encuestas cada repositorio de metadatos (a través de la API, a través de su representación en XML, etc.) para extraer una versión de los metadatos de integrar en su repositorio.
Un repositorio integrado de metadatos ofrece una serie de servicios considerados esenciales, tanto para mejorar la calidad del servicio prestado a los usuarios del sistema, tanto para suportare la gestión del sistema:
- proporcionar al usuario información sobre el significado de la información numérica proporcionada por entornos reposrtistica o análisis multidimensional (OLAP);
- ayudan a los usuarios a encontrar la información que necesitan los sistemas de investigación impulsada;
- actividades de mantenimiento suportare través de las funciones de impacto cruzado-análisis;
- monitorear los resultados de las botas y el crecimiento del sistema;
- etc.
A menudo, sin embargo, la calidad general del sistema apenas se ve afectada por una gestión de metadatos "a posteriori", mientras que la integración de "a posteriori" metadatos puede limitar las inconsistencias resalte entre el diseño de los diversos componentes, incluyendo el análisis y diseño de ellos mismos o entre el diseño y el desarrollo, pero no intervenir activamente en el proceso de producción no mejora la calidad del producto.

Innovando el proceso de producción de la innovación no significa mucho metodologías como herramientas de trabajo. Desde el punto de vista metodológico el proceso de producción debe basarse en la reutilización continua de metadatos: Cualquier actividad debe enriquecer los metadatos del sistema mediante la integración de lo que se ha logrado con la nueva información. Por ejemplo, el modelo lógico de un Data Mart debe partir de la definición de su modelo tridimensional enriqueciéndola con "detalles" útiles para su aplicación en la tecnología ROLAP y MOLAP. Del mismo modo, los metadatos del mismo modelo dimensional y su aplicación actividad lógica / física se debe utilizar en la definición de la capa semántica, a través del cual los usuarios se cruzarán y llevar su propio análisis OLAP.
Esta integración de metadatos "a priori" durante el proceso de producción garantiza una mayor coherencia entre los componentes de software implementadas. Además, debido a que el proceso de producción se inicia desde la recolección y formalización de requisitos y análisis de los activos de información y el producto de la integración de los metadatos de los aspectos del diseño y la construcción del sistema, las posibilidades de que las necesidades de los usuarios son aumento sodisfatti. También reduce el retraso en la detección de problemas de incompatibilidad entre el análisis y el diseño, el diseño y la implementación o satisfactibilidad de requisitos.
Desde el punto de vista del software stumenti para la creación de un almacén de datos, hasta el momento no soy consciente de que no existe una herramienta capaz de seguir todo el proceso de análisis, diseño e implementación de un sistema de almacenamiento de datos de una manera integrada. Además no hay muchas herramientas para front-end y back-end cuya repositorio de metadatos también están abiertos "por escrito", como es el caso de los catálogos de la DBMS que se manipulan con el lenguaje normalizado ( DDL - Data Definition Language ) . Sin embargo, el proceso de integración de las diferentes suites herramientas tecnológicas puede ser un impulso hacia la implementación de un proceso de este tipo, a condición de que la integración no se queda meramente commericale y hay una verdadera atención para cubrir todo el ciclo de producción (aunque a menudo las etapas importante como el análisis y la formalización de los requisitos están infravaloradas).