{"id":38998,"date":"2023-10-03T12:39:50","date_gmt":"2023-10-03T12:39:50","guid":{"rendered":"https:\/\/www.conectasoftware.com\/magazine\/?p=38998"},"modified":"2023-09-23T18:04:38","modified_gmt":"2023-09-23T18:04:38","slug":"la-funcion-de-un-data-warehouse-o-almacen-de-datos","status":"publish","type":"post","link":"https:\/\/www.conectasoftware.com\/magazine\/la-funcion-de-un-data-warehouse-o-almacen-de-datos\/","title":{"rendered":"La funci\u00f3n de un Data Warehouse o Almac\u00e9n de datos"},"content":{"rendered":"\n<p>La misi\u00f3n de un almac\u00e9n de datos es publicar los activos de datos de la organizaci\u00f3n para apoyar de la manera m\u00e1s efectiva la toma de decisiones. La palabra clave en esta declaraci\u00f3n de misi\u00f3n es publicar. As\u00ed como el \u00e9xito de una publicaci\u00f3n convencional, como una revista, comienza y termina con sus lectores, el \u00e9xito de un almac\u00e9n de datos comienza y termina con sus usuarios finales. Dado que el almac\u00e9n de datos es un sistema de soporte de decisiones, nuestro principal criterio de \u00e9xito es si contribuye efectivamente a los procesos de toma de decisiones m\u00e1s importantes en la organizaci\u00f3n. Aunque los costos de hardware, software, mano de obra, servicios de consultor\u00eda y mantenimiento deben gestionarse cuidadosamente, los costos ocultos de no apoyar las decisiones importantes de una organizaci\u00f3n son potencialmente mucho mayores. Los costos tangibles de un almac\u00e9n de datos, gestionados por TI, son t\u00e1cticos, pero los costos y beneficios m\u00e1s importantes del soporte de decisiones son estrat\u00e9gicos.<\/p>\n\n\n\n<p>Las aplicaciones de bases de datos de transacciones han estado penetrando en el mundo corporativo durante m\u00e1s de 30 a\u00f1os. Aunque hemos ingresado datos en aplicaciones de transacciones dedicadas durante d\u00e9cadas, se ha vuelto evidente que extraer los datos de estos sistemas para fines anal\u00edticos es demasiado dif\u00edcil. Se han gastado miles de millones de d\u00f3lares en aplicaciones de bases de datos, y sus datos permanecen prisioneros dentro de ellas. Se invierte una cantidad incalculable de tiempo intentando obtener datos de sistemas de transacciones, pero, como navegar a trav\u00e9s de un laberinto, la mayor parte de ese tiempo se gasta en llegar a callejones sin salida. El sistema ETL debe desempe\u00f1ar un papel importante en entregar los datos a las aplicaciones finales del usuario en una forma utilizable.<\/p>\n\n\n\n<p>Construir un almac\u00e9n de datos integral y fiable es una tarea significativa que gira en torno a un conjunto de componentes est\u00e1ndar. <\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Qu\u00e9 es un Almac\u00e9n de Datos o Data Warehouse<\/h3>\n\n\n\n<p>El almacenamiento de datos es el proceso de tomar datos de sistemas de bases de datos de transacciones y legados y transformarlos en informaci\u00f3n organizada en un formato amigable para el usuario, con el fin de fomentar el an\u00e1lisis de datos y respaldar la toma de decisiones empresariales basada en hechos. El proceso que implica transformar los datos desde su formato original a un almac\u00e9n de datos dimensional representa al menos el 70 por ciento del tiempo, esfuerzo y gasto de la mayor\u00eda de los proyectos de almacenes de datos.<\/p>\n\n\n\n<p>Despu\u00e9s de implementar muchos almacenes de datos, hemos determinado que un almac\u00e9n de datos deber\u00eda tener la siguiente definici\u00f3n:<\/p>\n\n\n\n<p>Un almac\u00e9n de datos es un sistema que extrae, limpia, conforma y entrega datos de origen en un almac\u00e9n de datos dimensional y luego respalda e implementa consultas y an\u00e1lisis con el prop\u00f3sito de tomar decisiones.<\/p>\n\n\n\n<p>Hemos llegado a esta definici\u00f3n para aliviar la confusi\u00f3n acerca de los costos de implementaci\u00f3n de almacenes de datos. Hist\u00f3ricamente, la parte m\u00e1s visible de un proyecto de almac\u00e9n de datos es la porci\u00f3n de acceso a datos, generalmente en forma de productos, y se presta cierta atenci\u00f3n al modelo dimensional. Pero al destacar solo esas partes, se deja un gran vac\u00edo en el ciclo de vida del almac\u00e9n de datos. Cuando llega el momento de hacer realidad el almac\u00e9n de datos, la herramienta de acceso a datos puede estar en su lugar y se puede crear el modelo dimensional, pero desde ese punto, pasan muchos meses hasta que el almac\u00e9n de datos es realmente utilizable porque a\u00fan se necesita completar el proceso ETL.<\/p>\n\n\n\n<p>Al prestar atenci\u00f3n a la construcci\u00f3n del componente de gesti\u00f3n de datos de la sala de atr\u00e1s, los patrocinadores de almacenes de datos est\u00e1n mejor posicionados para visualizar el valor real del almac\u00e9n de datos, para respaldar la toma de decisiones por parte de los usuarios finales, y asignar presupuestos realistas para la construcci\u00f3n de almacenes de datos.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Qu\u00e9 no es un Almac\u00e9n de datos o Data Warehouse<\/h3>\n\n\n\n<p>Lo que constituye un almac\u00e9n de datos a menudo es malinterpretado. Hasta el d\u00eda de hoy, puedes preguntar a diez expertos para definir un almac\u00e9n de datos, y es probable que obtengas diez respuestas diferentes. La mayor disparidad suele estar en describir exactamente qu\u00e9 componentes se consideran parte del proyecto de almac\u00e9n de datos. Para aclarar cualquier malentendido, cualquiera que vaya a ser parte de un equipo de almac\u00e9n de datos, especialmente en el equipo ETL, debe conocer sus l\u00edmites.<\/p>\n\n\n\n<p>El entorno de un almac\u00e9n de datos incluye varios componentes, cada uno con su propia suite de dise\u00f1os, t\u00e9cnicas, herramientas y productos. Lo m\u00e1s importante a recordar es que ninguna de estas cosas por s\u00ed sola constituye un almac\u00e9n de datos. El sistema ETL es un componente principal del almac\u00e9n de datos, pero se requieren muchos otros componentes para una implementaci\u00f3n completa. A lo largo de nuestras experiencias implementando almacenes de datos, hemos visto a miembros del equipo luchando una y otra vez con los mismos malentendidos. Las cinco principales cosas con las que se confunde el almac\u00e9n de datos son las siguientes:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li><strong>Un producto.<\/strong> Contrariamente a muchas afirmaciones de los proveedores, no puedes comprar un almac\u00e9n de datos. Un almac\u00e9n de datos incluye an\u00e1lisis de sistemas, manipulaci\u00f3n y limpieza de datos, movimiento de datos y, finalmente, modelado dimensional y acceso a datos. Ning\u00fan producto \u00fanico puede lograr todas las tareas involucradas en la construcci\u00f3n de un almac\u00e9n de datos.<\/li>\n\n\n\n<li><strong>Un lenguaje.<\/strong> No se puede aprender a codificar un almac\u00e9n de datos de la manera en que se aprende a implementar XML, SQL, VB o cualquier otro lenguaje de programaci\u00f3n. El almac\u00e9n de datos est\u00e1 compuesto por varios componentes, cada uno probablemente requiere uno o m\u00e1s lenguajes de programaci\u00f3n o especificaci\u00f3n de datos.<\/li>\n\n\n\n<li><strong>Un proyecto.<\/strong> Un almac\u00e9n de datos correctamente implementado consta de muchos proyectos (y fases de proyectos). Cualquier intento de implementar un almac\u00e9n de datos como un \u00fanico proyecto casi con certeza fracasar\u00e1. Los almacenes de datos exitosos planifican a nivel empresarial pero implementan data marts dimensionales manejables. Cada data mart se considera t\u00edpicamente un proyecto separado con su propio cronograma y presupuesto. Un factor crucial es que cada data mart contiene dimensiones conformadas y hechos estandarizados de modo que cada uno se integra en una \u00fanica unidad cohesiva: el almac\u00e9n de datos empresarial. El almac\u00e9n de datos empresarial evoluciona y crece a medida que se completa cada proyecto de data mart. Una mejor manera de pensar en un almac\u00e9n de datos es como un proceso, no como un proyecto.<\/li>\n\n\n\n<li><strong>Un modelo de datos.<\/strong> Un modelo de datos por s\u00ed solo no hace un almac\u00e9n de datos. Recuerda que el almac\u00e9n de datos es un proceso integral que, por definici\u00f3n, debe incluir el proceso ETL. Despu\u00e9s de todo, sin datos, incluso el modelo de datos mejor dise\u00f1ado es in\u00fatil.<\/li>\n\n\n\n<li><strong>Una copia de tu sistema de transacciones.<\/strong> Un error com\u00fan es creer que copiar tu sistema operativo en un sistema de informes separado crea un almac\u00e9n de datos. As\u00ed como el modelo de datos por s\u00ed solo no crea un almac\u00e9n de datos, tampoco lo hace ejecutar el proceso de movimiento de datos sin reestructurar el almac\u00e9n de datos.<\/li>\n<\/ol>\n","protected":false},"excerpt":{"rendered":"<p>La misi\u00f3n de un almac\u00e9n de datos es publicar los activos de datos de la organizaci\u00f3n para apoyar de la manera m\u00e1s efectiva la toma de decisiones. La palabra clave en esta declaraci\u00f3n de misi\u00f3n es publicar. As\u00ed como el \u00e9xito de una publicaci\u00f3n convencional, como una revista, comienza y termina con sus lectores, el [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":39006,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"content-type":"","footnotes":""},"categories":[430],"tags":[],"class_list":{"0":"post-38998","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-automatizacion"},"_links":{"self":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts\/38998","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/comments?post=38998"}],"version-history":[{"count":1,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts\/38998\/revisions"}],"predecessor-version":[{"id":38999,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts\/38998\/revisions\/38999"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/media\/39006"}],"wp:attachment":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/media?parent=38998"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/categories?post=38998"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/tags?post=38998"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}