{"id":17483,"date":"2020-05-14T17:47:37","date_gmt":"2020-05-14T17:47:37","guid":{"rendered":"https:\/\/www.conectasoftware.com\/?p=17483"},"modified":"2024-02-02T11:54:27","modified_gmt":"2024-02-02T11:54:27","slug":"data-mining","status":"publish","type":"post","link":"https:\/\/www.conectasoftware.com\/magazine\/data-mining\/","title":{"rendered":"\u00bfQu\u00e9 es el data mining?"},"content":{"rendered":"\n<p><span style=\"font-weight: 400;\">El data mining o tambi\u00e9n conocido como miner\u00eda de datos es un concepto que hace referencia al proceso de extracci\u00f3n de conocimiento \u00fatil y comprensible de grandes cantidades de datos que se encuentran guardados en diferentes formatos con el fin de encontrar patrones de comportamiento. La miner\u00eda de datos se apoya en modelos matem\u00e1ticos para la deducci\u00f3n de dichos patrones y tendencias, los cu\u00e1les, no se detectan a trav\u00e9s de la exploraci\u00f3n tradicional de los datos ya que las relaciones son demasiado complejas o la cantidad de datos es demasiado elevada.<\/span><\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p><span style=\"font-weight: 400;\">Estar rodeado de informaci\u00f3n no significa que estemos usando la informaci\u00f3n adecuada. Bill Gates<\/span><\/p>\n<\/blockquote>\n\n\n\n<h2 class=\"wp-block-heading\"><b>Etapas del data mining<\/b><\/h2>\n\n\n\n<p><span style=\"font-weight: 400;\">Los procesos de miner\u00eda de datos se llevan a cabo a trav\u00e9s de cuatro etapas definidas a continuaci\u00f3n:<\/span><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><b>Saber cu\u00e1l es el objetivo y recolectar datos<\/b><span style=\"font-weight: 400;\">. En primer lugar, se debe definir claramente cu\u00e1l es el tipo de informaci\u00f3n que se quiere obtener. Una vez definido, se debe plantear de d\u00f3nde se van a recopilar los datos con los que se va a trabajar.<\/span><\/li>\n\n\n\n<li><b>Procesamiento y gesti\u00f3n de los datos<\/b><span style=\"font-weight: 400;\">. Para trabajar, se necesita tener una muestra representativa de datos para llevar a cabo el an\u00e1lisis y una vez seleccionada, se debe escoger qu\u00e9 tipo de variables o modelo se va a utilizar sobre la muestra.<\/span><\/li>\n\n\n\n<li><b>Elecci\u00f3n del modelo<\/b><span style=\"font-weight: 400;\">. Esta etapa se encuentra muy relacionada con la fase anterior. Trata de generar un <a href=\"https:\/\/es.wikipedia.org\/wiki\/Algoritmo\" target=\"_blank\" rel=\"noopener\">algoritmo<\/a> con el cual, se pueda obtener el mejor resultado posible. Se debe llevar a cabo un an\u00e1lisis en profundidad de las variables que van a ser utilizadas en el modelo. Por ello, se deben realizar distintos ex\u00e1menes del algoritmo como pueden ser las series temporales o la regresi\u00f3n lineal.<\/span><\/li>\n\n\n\n<li><b>Actualizaci\u00f3n del modelo<\/b><span style=\"font-weight: 400;\">. Es la \u00faltima fase. Cada cierto tiempo se deben hacer actualizaciones del modelo para que este no se quede obsoleto.&nbsp;<\/span><\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\"><b>Ventajas de data mining<\/b><\/h2>\n\n\n\n<p><span style=\"font-weight: 400;\">A trav\u00e9s del an\u00e1lisis de los datos, los patrones y tendencias pueden ser aplicados en distintos \u00e1mbitos como los siguientes:<\/span><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><b>Recomendaciones de productos<\/b><span style=\"font-weight: 400;\"> que pueden ser vendidos juntos adem\u00e1s de la generaci\u00f3n de recomendaciones.&nbsp;<\/span><\/li>\n\n\n\n<li><b>Segmentaci\u00f3n de clientes o eventos en grupos<\/b><span style=\"font-weight: 400;\"> a trav\u00e9s de afinidades de los mismos.<\/span><\/li>\n\n\n\n<li><b>Selecci\u00f3n de los mejores clientes <\/b><span style=\"font-weight: 400;\">con la finalidad de ofrecerles un trato m\u00e1s directo ya sea por correo electr\u00f3nico o por tel\u00e9fono.<\/span><\/li>\n\n\n\n<li><b>B\u00fasqueda de secuencias<\/b><span style=\"font-weight: 400;\"> a trav\u00e9s de productos que los clientes hayan introducido en el carrito para predecir futuros comportamientos.<\/span><\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\"><b>Data mining y el KDD<\/b><\/h2>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter\"><img loading=\"lazy\" loading=\"lazy\" decoding=\"async\" width=\"514\" height=\"258\" src=\"https:\/\/www.conectasoftware.com\/magazine\/wp-content\/uploads\/2020\/05\/kdd.png\" alt=\"KDD\" class=\"wp-image-17484\"\/><\/figure><\/div>\n\n\n<p><span style=\"font-weight: 400;\">Las siglas KDD ( Knowledge Discovery in Databases) hacen referencia al concepto de Descubrimiento del Conocimiento en bases de datos el cual, se refiere al proceso de identificar patrones que sean v\u00e1lidos, \u00fatiles, novedosos y comprensibles. La miner\u00eda de datos es uno de los pasos que conforman el KDD, donde los pasos deben ser consecutivos tal y como muestra la siguiente imagen.<\/span><br><br>Art\u00edculos y formaciones relacionadas:<\/p>\n\n\n\n<p>Miner\u00eda de Procesos: \u00bfQu\u00e9 es y c\u00f3mo puede ayudar a tu organizaci\u00f3n?<br>Los \u00e1rboles de decisi\u00f3n<br>Tendencias en Ecommerce para 2020<\/p>\n\n\n\n<p>Data Literacy: Qu\u00e9 es la alfabetizaci\u00f3n de datos Las empresas gestionan una cantidad creciente de datos. Sin embargo, recopilar datos no es lo mismo que entenderlos. Dominar el procesador de textos o las hojas de c\u00e1lculo ya no es suficiente.<br>+\u00a0Google Analytics Para Ecommerce<br>Google Analytics ofrece un amplio conjunto de herramientas anal\u00edticas que permiten conocer en profundidad el n\u00famero y tipo de visitas que estamos recibiendo en nuestra tienda online<\/p>\n","protected":false},"excerpt":{"rendered":"<p>El data mining o tambi\u00e9n conocido como miner\u00eda de datos es un concepto que hace referencia al proceso de extracci\u00f3n de conocimiento \u00fatil y comprensible de grandes cantidades de datos que se encuentran guardados en diferentes formatos con el fin de encontrar patrones de comportamiento. La miner\u00eda de datos se apoya en modelos matem\u00e1ticos para [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":17605,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"gallery","meta":{"content-type":"","footnotes":""},"categories":[25],"tags":[64],"class_list":{"0":"post-17483","1":"post","2":"type-post","3":"status-publish","4":"format-gallery","5":"has-post-thumbnail","7":"category-analytics","8":"tag-data-mining","9":"post_format-post-format-gallery"},"_links":{"self":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts\/17483","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/comments?post=17483"}],"version-history":[{"count":3,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts\/17483\/revisions"}],"predecessor-version":[{"id":39750,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts\/17483\/revisions\/39750"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/media\/17605"}],"wp:attachment":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/media?parent=17483"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/categories?post=17483"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/tags?post=17483"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}