{"id":12764,"date":"2020-03-02T17:05:03","date_gmt":"2020-03-02T17:05:03","guid":{"rendered":"https:\/\/www.conectasoftware.com\/?p=12764"},"modified":"2024-02-02T12:04:35","modified_gmt":"2024-02-02T12:04:35","slug":"tecnicas-de-data-mining-regresion-logistica","status":"publish","type":"post","link":"https:\/\/www.conectasoftware.com\/magazine\/tecnicas-de-data-mining-regresion-logistica\/","title":{"rendered":"T\u00e9cnicas de data mining &#8211; Regresi\u00f3n log\u00edstica"},"content":{"rendered":"<p>Una de las t\u00e9cnicas m\u00e1s utilizadas dentro de la miner\u00eda de datos es la <strong>regresi\u00f3n log\u00edstica<\/strong>.<br \/>\nLa regresi\u00f3n log\u00edstica es un m\u00e9todo que permite<\/p>\n<blockquote><p>encontrar relaciones y probabilidades entre datos que provienen de varios factores, considerada como una t\u00e9cnica de aprendizaje autom\u00e1tico<\/p><\/blockquote>\n<p>Se ha convertido en una herramienta importante en el \u00e1rea del aprendizaje automatizado (machine learning) adem\u00e1s de ser aplicada en software de tipo ETL (Extract, Transform, Load).<br \/>\nLa imagen siguiente muestra un ejemplo de modelo de probabilidad usando la t\u00e9cnica de regresi\u00f3n log\u00edstica:<\/p>\n<h2><img loading=\"lazy\" loading=\"lazy\" decoding=\"async\" class=\"size-medium wp-image-12773 aligncenter\" src=\"https:\/\/www.conectasoftware.com\/magazine\/wp-content\/uploads\/2020\/03\/regresion-logistica-grafico-488x433.png\" alt=\"\" width=\"488\" height=\"433\" \/><\/h2>\n<h2><\/h2>\n<h2>Ventajas de la regresi\u00f3n log\u00edstica<\/h2>\n<p>Algunas de las ventajas que presenta la regresi\u00f3n log\u00edstica son el <strong>bajo consumo de recursos<\/strong> de un ordenador al hacer uso de ciertos tipos de software como <a href=\"https:\/\/www.cs.waikato.ac.nz\/ml\/weka\/\" target=\"_blank\" rel=\"noopener noreferrer\">Weka<\/a>, su f\u00e1cil interpretaci\u00f3n, su eficiencia y su simplicidad.<br \/>\nDesde el punto de vista de las organizaciones, el uso de la regresi\u00f3n log\u00edstica se puede aplicar dentro de campos como el <strong>marketing en ecommerce.<\/strong> Nos puede decir si un cliente le interesa un producto o no a trav\u00e9s de una oferta.<br \/>\n<img loading=\"lazy\" loading=\"lazy\" decoding=\"async\" class=\"size-medium wp-image-8425 aligncenter\" src=\"https:\/\/www.conectasoftware.com\/magazine\/wp-content\/uploads\/2019\/06\/ETL-Herramientas-Transformacion-digital-blog-300x200.jpg\" alt=\"ETL Herramientas Transformacion digital blog\" width=\"300\" height=\"200\" \/><\/p>\n<h2>La clasificaci\u00f3n binaria<\/h2>\n<p>La regresi\u00f3n log\u00edstica se caracteriza por ser un procedimiento cuantitativo donde se intenta predecir respuestas a preguntas tales como<\/p>\n<ul>\n<li>\u00bfse puede predecir que una empresa va a quebrar? o<\/li>\n<li>\u00bfadmitir\u00e1n a un alumno a una universidad en particular?<\/li>\n<\/ul>\n<p>Por lo tanto, es un tipo de algoritmo que <strong>resuelve problemas de clasificaci\u00f3n binaria<\/strong> donde la resoluci\u00f3n de los problemas se clasifica dentro de dos posibles valores.<\/p>\n<h3>Un ejemplo de aplicaci\u00f3n de la regresi\u00f3n log\u00edstica en data mining<\/h3>\n<p>Podemos tomar como ejemplo el caso de<br \/>\n<em><strong>\u00bfqu\u00e9 probabilidad tiene un alumno de aprobar un examen de matem\u00e1ticas?<\/strong> <\/em><\/p>\n<ol>\n<li>\n<h4>Definici\u00f3n de resultados<\/h4>\n<\/li>\n<\/ol>\n<p>Los posibles <strong>resultados<\/strong> son dos:<\/p>\n<ol>\n<li>aprobar<\/li>\n<li>suspender<\/li>\n<\/ol>\n<h4>2. Definici\u00f3n de variables<\/h4>\n<p>Como <strong>variables<\/strong> para el an\u00e1lisis se podr\u00edan utilizar el <strong>n\u00famero de horas de estudio<\/strong> o el <strong>n\u00famero de problemas resueltos con \u00e9xito<\/strong>.<br \/>\nCuantas m\u00e1s horas de estudio y m\u00e1s problemas resueltos con \u00e9xito, el alumno tendr\u00e1 m\u00e1s probabilidades de aprobar, en caso contrario, tendr\u00e1 m\u00e1s probabilidades de suspender.<\/p>\n<h2>La regresi\u00f3n log\u00edstica aplica al marketing: landing pages<\/h2>\n<p>El caso del estudiante de matem\u00e1ticas es un ejemplo sencillo para empezar a entender la regresi\u00f3n log\u00edstica. Ahora lo llevamos al siguiente nivel de complejidad &#8211; la efectividad de una landing page.<br \/>\nLas landing pages o paginas de aterrizaje son las p\u00e1ginas por las que un cliente potencial llega a nuestro sitio web. Tienen que cumplir varias funciones. Para empezar, bien optimizadas para la palabra clave objetivo que hayamos definido para la campa\u00f1a, atraeran visitas desde los resultados de Google. Seguramente, tambi\u00e9n invertiremos algo en publicidad SEM para atraer tr\u00e1fico a la landing page.<br \/>\nUna vez conseguida la visita, depender\u00e1 del dise\u00f1o y contenido de la p\u00e1gina, que la visita no resulte en un abandono del sitio. Y por \u00faltimo, tiene que conseguir una interacci\u00f3n, ya sea un clic a otra p\u00e1gina, el env\u00edo del formulario de contacto o una transacci\u00f3n. Esta es la <strong>conversi\u00f3n<\/strong>.<br \/>\nPor todo ello, invertimos muchos recursos en el dise\u00f1o de una landing page. Y para optimizar el uso de estos recursos y saber la probabilidad de conversi\u00f3n, podemos aplicar la regresi\u00f3n log\u00edstica.<br \/>\nEn este ejemplo simplificado, nuestro objetivo o variable dependiente es la conversi\u00f3n que hayamos definido antes. El predictor (la variable independiente) es la Landing Page.<br \/>\nOtros data points que incluiriamos para unos resultados m\u00e1s exactos, son:<\/p>\n<ul>\n<li>ID del visitante<br \/>\nTipo de visitante<br \/>\nP\u00e1gina de destino<br \/>\nAbandono del sitio<br \/>\nProfundidad de p\u00e1gina<br \/>\nTiempo promedio en el sitio<br \/>\nVistas de p\u00e1gina<br \/>\nVistas de p\u00e1gina \u00fanicas<br \/>\nRecuento de visitas<br \/>\nD\u00edas desde la \u00faltima visita<\/li>\n<\/ul>\n<p>La regresi\u00f3n log\u00edstica es una de las t\u00e9cnicas m\u00e1s importantes ya que, a trav\u00e9s de los modelos predictivos se puede mejorar la <strong>toma de decisiones<\/strong>.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Una de las t\u00e9cnicas m\u00e1s utilizadas dentro de la miner\u00eda de datos es la regresi\u00f3n log\u00edstica. La regresi\u00f3n log\u00edstica es un m\u00e9todo que permite encontrar relaciones y probabilidades entre datos que provienen de varios factores, considerada como una t\u00e9cnica de aprendizaje autom\u00e1tico Se ha convertido en una herramienta importante en el \u00e1rea del aprendizaje automatizado [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":12778,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"content-type":"","footnotes":""},"categories":[25],"tags":[64],"class_list":{"0":"post-12764","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-analytics","8":"tag-data-mining"},"_links":{"self":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts\/12764","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/comments?post=12764"}],"version-history":[{"count":2,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts\/12764\/revisions"}],"predecessor-version":[{"id":39771,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts\/12764\/revisions\/39771"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/media\/12778"}],"wp:attachment":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/media?parent=12764"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/categories?post=12764"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/tags?post=12764"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}