{"id":38145,"date":"2023-08-23T19:45:29","date_gmt":"2023-08-23T19:45:29","guid":{"rendered":"https:\/\/www.conectasoftware.com\/magazine\/?p=38145"},"modified":"2024-01-29T15:12:14","modified_gmt":"2024-01-29T15:12:14","slug":"change-data-capture-cdc-captura-la-informacion-de-valor","status":"publish","type":"post","link":"https:\/\/www.conectasoftware.com\/magazine\/change-data-capture-cdc-captura-la-informacion-de-valor\/","title":{"rendered":"Change Data Capture (CDC): captura la informaci\u00f3n de valor"},"content":{"rendered":"\n<p><\/p>\n\n\n\n<p>El <em>Change Data Capture<\/em> (CDC) es un m\u00e9todo de ETL que se refiere al proceso de rastrear y capturar cada cambio realizado en los datos de una base de datos. Este proceso permite identificar y extraer los datos modificados y luego mover esos cambios a un proceso descendente.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>\u00bfQu\u00e9 es Change Data Capture?<\/strong><\/h2>\n\n\n\n<p>El <em>Change Data Capture<\/em> (CDC) es un conjunto de patrones de dise\u00f1o de software utilizados para detectar cualquier cambio de datos en la base de datos. Desencadena el evento asociado con los datos para que se tome una acci\u00f3n particular para cualquier <em>Change Data Capture<\/em>. Las empresas necesitan acceso a flujos de datos en tiempo real para an\u00e1lisis de datos. Excluye el proceso de carga masiva de datos implementando la carga incremental de datos en tiempo casi real. Permite que el almac\u00e9n de datos o las bases de datos permanezcan activos para realizar alguna acci\u00f3n tan pronto como ocurra cualquier <em>Change Data Capture<\/em>.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" loading=\"lazy\" decoding=\"async\" width=\"588\" height=\"772\" src=\"https:\/\/www.conectasoftware.com\/magazine\/wp-content\/uploads\/2023\/08\/Conecta-HUB-Captura-de-eventos.png\" alt=\"Conecta HUB Captura de eventos\" class=\"wp-image-38342\"\/><figcaption class=\"wp-element-caption\">Conecta HUB Captura de eventos<\/figcaption><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>\u00bfPor qu\u00e9 usar Change Data Capture?<\/strong><\/h2>\n\n\n\n<p>El CDC es un enfoque de integraci\u00f3n de datos que permite que los datos de alta velocidad logren una replicaci\u00f3n de datos confiable, de baja latencia y escalable utilizando menos recursos de c\u00e1lculo. Con la ayuda del CDC, las empresas entregan nuevos cambios de datos a las herramientas de BI (Business Intelligence) y a los miembros del equipo en tiempo real, manteni\u00e9ndolos actualizados.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>\u00bfC\u00f3mo funciona Change Data Capture?<\/strong><\/h2>\n\n\n\n<p>Puedes aprovechar el CDC para transmitir datos desde tu base de datos principal a tu almac\u00e9n de datos para resolver los siguientes problemas:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Dado que los datos se env\u00edan continuamente en CDC y en lotes mucho m\u00e1s peque\u00f1os, no tienes que aprovisionar tanto la red para que funcione, adem\u00e1s, puedes ahorrar dinero en costos de red.<\/li>\n\n\n\n<li>El CDC no necesita que realices consultas de alta carga de forma peri\u00f3dica. Por lo tanto, no tienes que preocuparte por comportamientos punzantes en la carga. <\/li>\n\n\n\n<li>Dado que est\u00e1s transmitiendo datos continuamente desde tu base de datos a tu almac\u00e9n de datos, los datos en tu casa deben estar actualizados, lo que te permite generar informaci\u00f3n en tiempo real, d\u00e1ndote una ventaja considerable sobre tus competidores ya que est\u00e1s tomando decisiones empresariales basadas en datos m\u00e1s frescos.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\"><strong>Pasos para realizar Change Data Capture<\/strong><\/h3>\n\n\n\n<p>El <em>Change Data Capture<\/em> (CDC) se puede implementar utilizando los siguientes 3 pasos:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li>Extraer los datos<\/li>\n\n\n\n<li>Transformar los datos<\/li>\n\n\n\n<li>Cargar los datos<\/li>\n<\/ol>\n\n\n\n<p>Los datos brutos se extraen de una serie de fuentes y a veces se colocan en un lago de datos. Esta data podr\u00eda estar formateada en:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>JSON \u2013 Redes sociales (Facebook, etc.)<\/li>\n\n\n\n<li>XML \u2013 Fuentes de terceros<\/li>\n\n\n\n<li>RDBMS \u2013 CRM<\/li>\n<\/ul>\n\n\n\n<p>La etapa de transformaci\u00f3n es donde aplicas cualquier regla y regulaci\u00f3n empresarial para lograr:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Estandarizaci\u00f3n<\/li>\n\n\n\n<li>Deduplicaci\u00f3n<\/li>\n\n\n\n<li>Verificaci\u00f3n<\/li>\n\n\n\n<li>Ordenaci\u00f3n<\/li>\n<\/ul>\n\n\n\n<p>Luego, carga estos datos extra\u00eddos transformados en un nuevo hogar ejecutando una tarea (trabajo) desde una interfaz CLI o GUI.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Change Data Capture vs Change Tracking<\/strong><\/h2>\n\n\n\n<p>El seguimiento de cambios es el contraparte menos conocido del <em>Change Data Capture<\/em>. Es una caracter\u00edstica que permite que los cambios netos realizados en los datos se devuelvan f\u00e1cilmente desde una consulta. El seguimiento de cambios te permitir\u00e1 saber que una fila determinada ha cambiado desde tu \u00faltima consulta. Pero, no tiene idea de:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Los diferentes cambios de valor que se han realizado en la fila, o<\/li>\n\n\n\n<li>La cantidad de veces que fue cambiada.<\/li>\n<\/ul>\n\n\n\n<p>El <em>Change Data Capture<\/em>, como su nombre indica, rastrea cu\u00e1ndo ha cambiado el conjunto completo de datos. Puedes capturar una tabla completa o un subconjunto de columnas a trav\u00e9s del <em>Change Data Capture<\/em>.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><strong>Change Data Capture en ETL<\/strong><\/h3>\n\n\n\n<p>En la era de Big Data, los datos se han vuelto m\u00e1s importantes para la inteligencia empresarial y la anal\u00edtica de datos empresariales. Los datos juegan un papel importante en casi todas las operaciones comerciales. Para que tus datos sean valiosos, necesitas una forma de recopilar datos de un n\u00famero ilimitado de fuentes, organizarlos juntos y centralizarlos en un solo repositorio. Esto significa que necesitas procesos ETL o integraci\u00f3n de datos.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Recomendaciones<\/strong><\/h2>\n\n\n\n<p>El <em>Change Data Capture<\/em> es esencial en el mundo actual donde los datos se generan a una velocidad vertiginosa. Proporciona una soluci\u00f3n eficiente para rastrear y gestionar los cambios en los datos, asegurando que las empresas puedan actuar en tiempo real y tomar decisiones basadas en datos frescos y actualizados. Al integrar el CDC en los procesos de ETL, las empresas pueden garantizar una integraci\u00f3n de datos m\u00e1s r\u00e1pida y eficiente, lo que resulta en una mejor toma de decisiones y una ventaja competitiva en el mercado.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>El Change Data Capture (CDC) es un m\u00e9todo de ETL que se refiere al proceso de rastrear y capturar cada cambio realizado en los datos de una base de datos. Este proceso permite identificar y extraer los datos modificados y luego mover esos cambios a un proceso descendente. \u00bfQu\u00e9 es Change Data Capture? El Change [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":38343,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"content-type":"","footnotes":""},"categories":[430],"tags":[],"class_list":{"0":"post-38145","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-automatizacion"},"_links":{"self":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts\/38145","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/comments?post=38145"}],"version-history":[{"count":4,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts\/38145\/revisions"}],"predecessor-version":[{"id":39281,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts\/38145\/revisions\/39281"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/media\/38343"}],"wp:attachment":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/media?parent=38145"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/categories?post=38145"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/tags?post=38145"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}