Skip to main content

¿Cuáles son los diferentes tipos de diseño de almacén de datos?

Los almacenes de datos almacenan grandes cantidades de datos para su uso en muchos campos diferentes. Hay dos tipos principales de diseño de almacén de datos: de arriba hacia abajo y de abajo hacia arriba. Los dos diseños tienen sus propias ventajas y desventajas. De abajo hacia arriba es más fácil y económico de implementar, pero es menos completo y las correlaciones de datos son más esporádicas. En un diseño de arriba hacia abajo, las conexiones entre los datos son obvias y están bien establecidas, pero los datos pueden estar desactualizados y el sistema es costoso de implementar.

Los data marts son la figura central en el diseño del almacén de datos. Un data mart es una colección de datos basada en un solo concepto. Cada data mart es un subconjunto de datos único y completo. Cada una de estas colecciones está completamente correlacionada internamente y, a menudo, tiene conexiones con marts de datos externos.

La forma en que se manejan los data marts es la principal diferencia entre los dos estilos de diseño de data warehouse. En el diseño de arriba hacia abajo, los marts de datos ocurren naturalmente a medida que los datos se introducen en el sistema. En el diseño ascendente, los marts de datos se realizan directamente y se conectan entre sí para formar el almacén. Si bien esto puede parecer una diferencia menor, crea un diseño muy diferente.

El método de arriba hacia abajo fue el diseño original del almacén de datos. Con este método, toda la información que la organización posee se coloca en el sistema. Cada tema amplio tendrá su propia área general dentro de las bases de datos. A medida que se utilizan los datos, aparecerán conexiones entre puntos de datos correlativos y aparecerán marts de datos. Además, cualquier información en el sistema permanece allí para siempre, incluso si la información posterior reemplaza o trivializa los datos, permanecerá en el sistema como un registro de eventos pasados.

El método ascendente del diseño del almacén de datos funciona desde la dirección opuesta. Una empresa ingresa información como un data mart independiente. A medida que pasa el tiempo, se agregan otros conjuntos de datos al sistema, ya sea como su propio mercado de datos o como parte de uno que ya existe. Cuando dos marts de datos se consideran lo suficientemente conectados, se fusionan en una sola unidad.

Los dos diseños de almacén de datos tienen sus propios puntos fuertes y débiles. El método de arriba hacia abajo es un gran proyecto para conjuntos de datos aún más pequeños. Dado que los grandes proyectos también son más costosos, es el más caro en términos de dinero y mano de obra. Si el almacén de datos está terminado y mantenido, es una vasta colección que contiene todo lo que la empresa sabe.

El proceso de abajo hacia arriba es mucho más rápido y económico, pero dado que los datos se ingresan según sea necesario, la base de datos nunca estará completa. Además, las correlaciones entre los data marts son tan fuertes como su uso las hace. Si existe una fuerte correlación, pero ningún usuario la ve, queda desconectada.