{"id":10927,"date":"2020-01-14T13:17:39","date_gmt":"2020-01-14T13:17:39","guid":{"rendered":"https:\/\/www.conectasoftware.com\/?p=10927"},"modified":"2024-02-02T12:06:06","modified_gmt":"2024-02-02T12:06:06","slug":"arboles-de-decisiones-en-la-mineria-de-datos","status":"publish","type":"post","link":"https:\/\/www.conectasoftware.com\/magazine\/arboles-de-decisiones-en-la-mineria-de-datos\/","title":{"rendered":"Arboles de decisiones en la miner\u00eda de datos"},"content":{"rendered":"<p>Los \u00e1rboles de decisi\u00f3n son un tipo de algoritmo que clasifica la informaci\u00f3n de forma que, como resultado, se genere un modelo en forma de \u00e1rbol. Se trata de un modelo esquematizado de la informaci\u00f3n que representa las diferentes alternativas junto con los posibles resultados para cada alternativa elegida. Los \u00e1rboles de decisi\u00f3n son un tipo de modelo muy utilizado debido a que facilita mucho la comprensi\u00f3n de las diferentes opciones.<\/p>\n<h2>Componentes<\/h2>\n<p>El \u00e1rbol se compone de nodos y ramas. A su vez, existen distintos tipos de nodos y ramas en funci\u00f3n de lo que se quiera representar. Los nodos de decisi\u00f3n representan una decisi\u00f3n que se tomar\u00e1, los nodos de probabilidad representan los posibles resultados inciertos y los nodos terminales son aquellos nodos que representan el resultado definitivo.<br \/>\nPor otro lado, las ramas se diferencian en ramificaciones alternativas, donde cada rama lleva a un tipo de resultado y, las ramas \u201crechazadas\u201d , que representan los resultados que se rechazan. El modelo se caracteriza porque un mismo problema puede ser representado con diferentes \u00e1rboles.<\/p>\n<h2>Usos y aplicaciones de los \u00e1rboles de decisiones<\/h2>\n<p>En miner\u00eda de datos, un \u00e1rbol de decisi\u00f3n sirve para abordar problemas tales como la clasificaci\u00f3n, la predicci\u00f3n y la segmentaci\u00f3n de datos con la finalidad de obtener informaci\u00f3n que pueda ser analizada para tomar decisiones futuras.<br \/>\nSi trasladamos el concepto al \u00e1rea de <strong>Business Analytics<\/strong>, los \u00e1rboles de decisi\u00f3n se utilizan mayoritariamente para predecir las probabilidades de alcanzar un resultado en funci\u00f3n de unas variables de entrada tales como edad, sexo, demograf\u00eda o ingresos que indicar\u00e1n, por ejemplo, <strong>si el cliente es apto o no para recibir un pr\u00e9stamo<\/strong>.<\/p>\n<p>Para dibujar el \u00e1rbol, puedes utilizar una herramienta como <a href=\"https:\/\/www.lucidchart.com\/pages\/es\/que-es-un-diagrama-de-arbol-de-decision\" target=\"_blank\" rel=\"noopener noreferrer\">Lucidchart<\/a>.<\/p>\n<h2>Pasos para dise\u00f1ar el diagrama del \u00e1rbol de decisiones<\/h2>\n<p>A la hora de dise\u00f1ar el \u00e1rbol, se deben seguir una serie de pasos:<\/p>\n<ol>\n<li>Definici\u00f3n del problema<\/li>\n<li>Dibujo del \u00e1rbol<\/li>\n<li>Asignaci\u00f3n de las probabilidades a los eventos<\/li>\n<li>Estimaci\u00f3n de los resultados para las combinaciones de las diferentes alternativas posibles<\/li>\n<li>Elecci\u00f3n de la soluci\u00f3n m\u00e1s \u00f3ptima reflejada en forma de ruta<\/li>\n<\/ol>\n<h2>Un ejemplo de aplicaci\u00f3n en business analytics<\/h2>\n<p>Por ejemplo, se plantea el siguiente problema<\/p>\n<blockquote><p>\u00bfdebemos ofrecer a un cliente determinado un producto concreto?<\/p><\/blockquote>\n<h3>Definici\u00f3n del tipo de cliente<\/h3>\n<p>Primero, se debe definir el tipo de cliente, en este caso, si el cliente es VIP o no y, en funci\u00f3n de la respuesta, habr\u00e1 una serie de posibilidades.<br \/>\n<strong>Caso 1<\/strong><br \/>\nEn el caso de que el cliente sea VIP, se debe tener en cuenta de cu\u00e1nto gasta dicho cliente. En el caso de que el gasto sea mayor de 1000 s\u00ed se debe ofertar el producto, en caso contrario no.<br \/>\n<strong>\u00a0<\/strong><br \/>\n<strong>Caso 2<\/strong><br \/>\nEn el caso de que el cliente no sea VIP, para poder ofrecer el producto habr\u00e1 que considerar m\u00e1s posibilidades como si paga o no a tiempo o si sus ingresos son superiores a una cantidad determinada.<\/p>\n<h3>As\u00ed se construye el \u00e1rbol de decisiones:<\/h3>\n<p><img loading=\"lazy\" loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-10952 size-medium\" src=\"https:\/\/www.conectasoftware.com\/magazine\/wp-content\/uploads\/2020\/01\/arboles-de-decisiones-analytics-650x433.png\" alt=\"arbol de decisiones\" width=\"650\" height=\"433\" \/><\/p>\n<h2>Criterios en la toma de decisiones bajo incertidumbre<\/h2>\n<p>El \u00e1rbol plantea una posible soluci\u00f3n para el problema, sin embargo, no es la \u00fanica posibilidad ya que, en este caso, se han utilizado <strong>variables relacionadas con costos<\/strong>.<br \/>\nEn ciertas ocasiones, no es posible asignar probabilidades a los posibles eventos que tenga el problema ya que los datos o son m\u00ednimos o las fuentes de donde provienen los son fiables. En estas situaciones, se deben tomar <strong>decisiones bajo incertidumbre<\/strong> donde no se conoce la probabilidad que puede haber para cada evento. Por lo tanto, estimar el riesgo se presenta como una tarea complicada.<\/p>\n<p>En estos casos, existen varios tipos de criterios a la hora de la toma de decisiones bajo incertidumbre:<\/p>\n<ul>\n<li><strong>Criterio MAXIMAX<\/strong> o criterio optimista : se opta por la estrategia que maximice el mejor de los resultados posibles.<\/li>\n<li><strong>Criterio MAXIMIN<\/strong> o criterio pesimista : se opta por la estrategia que maximice el peor de los resultados posibles.<\/li>\n<li><strong>Criterio de frustraci\u00f3n m\u00ednima<\/strong> : se opta por ordenar las estrategias y diferenciar entre el resultado obtenido y el mayor posible para cada situaci\u00f3n, eligiendo la estrategia que minimice el resultado.<\/li>\n<\/ul>\n<blockquote><p>Finalmente, debemos considerar que la peor opci\u00f3n que se toma es no tomar una decisi\u00f3n.<\/p><\/blockquote>\n<h3>Otras t\u00e9cnicas de Data Mining:<\/h3>\n<ul>\n<li>Regresi\u00f3n log\u00edstica<\/li>\n<li>Clustering<\/li>\n<li>Series temporales<\/li>\n<li>Redes neuronales<\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<p>\u00bfQu\u00e9 son los \u00e1rboles de decisiones y c\u00f3mo se construyen? Explicamos con un ejemplo como utilizar estos algoritmos en la toma de decisiones empresarial.<\/p>\n","protected":false},"author":1,"featured_media":10973,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"content-type":"","footnotes":""},"categories":[25],"tags":[64],"class_list":{"0":"post-10927","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-analytics","8":"tag-data-mining"},"_links":{"self":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts\/10927","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/comments?post=10927"}],"version-history":[{"count":3,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts\/10927\/revisions"}],"predecessor-version":[{"id":39775,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts\/10927\/revisions\/39775"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/media\/10973"}],"wp:attachment":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/media?parent=10927"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/categories?post=10927"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/tags?post=10927"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}