{"id":16240,"date":"2020-04-14T18:47:23","date_gmt":"2020-04-14T18:47:23","guid":{"rendered":"https:\/\/www.conectasoftware.com\/?p=16240"},"modified":"2024-02-02T11:55:26","modified_gmt":"2024-02-02T11:55:26","slug":"importancia-de-las-fuentes-de-datos","status":"publish","type":"post","link":"https:\/\/www.conectasoftware.com\/magazine\/importancia-de-las-fuentes-de-datos\/","title":{"rendered":"\u00bfPor qu\u00e9 es importante la elecci\u00f3n de las fuentes de datos?"},"content":{"rendered":"<h2><b>Importancia de la elecci\u00f3n de las fuentes de datos<\/b><\/h2>\n<p><span style=\"font-weight: 400;\">Las fuentes de datos en big data son la materia prima para analizar la informaci\u00f3n y obtener resultados de forma que, cualquier decisi\u00f3n que se tome a trav\u00e9s del big data, vendr\u00e1 dada por los datos que han sido elegidos previamente para su an\u00e1lisis. En la miner\u00eda de datos, no se necesita una cantidad espec\u00edfica de datos, pero s\u00ed que \u00e9stos sean relevantes.<\/span><\/p>\n<blockquote><p><span style=\"font-weight: 400;\">En un mundo que est\u00e1 saturado de informaci\u00f3n, es importante diferenciar qu\u00e9 datos pueden ser \u00fatiles de los que simplemente no pueden ser utilizados.<\/span><\/p><\/blockquote>\n<h2><b>Las cinco \u201cV&#8217;s del big data<\/b><\/h2>\n<p><span style=\"font-weight: 400;\">El big data se rige a trav\u00e9s de cinco \u201cV\u201ds que definen c\u00f3mo deben ser los datos y la importancia de la fuente de los mismos:<\/span><\/p>\n<ul>\n<li style=\"font-weight: 400;\"><b>Volumen<\/b><span style=\"font-weight: 400;\">: hace referencia al gran tama\u00f1o de generaci\u00f3n de datos diarios, ya sean generados por parte de usuarios o a trav\u00e9s de una empresa.<\/span><\/li>\n<li style=\"font-weight: 400;\"><b>Velocidad<\/b><span style=\"font-weight: 400;\">: hace referencia a la rapidez en la que fluyen los datos a la par que el tiempo de procesamiento en tiempo real.<\/span><\/li>\n<li style=\"font-weight: 400;\"><b>Variedad<\/b><span style=\"font-weight: 400;\">: dado que los datos provienen de distintas fuentes (datos estructurados, datos semiestructurados y datos no estructurados), en <\/span><b>funci\u00f3n del tipo de fuente, los datos son m\u00e1s complejos para almacenarse a la vez que el an\u00e1lisis de los mismos<\/b><span style=\"font-weight: 400;\">.\u00a0<\/span><\/li>\n<li style=\"font-weight: 400;\"><b>Veracidad<\/b><span style=\"font-weight: 400;\">: dada la cantidad de datos que se generan, \u00e9stos deben ser analizados para garantizar la autenticidad y fiabilidad para la posterior toma de decisiones. <\/span><\/li>\n<li style=\"font-weight: 400;\"><b>Valor<\/b>: Hace referencia a la selecci\u00f3n de aquellos datos que sean \u00fatiles para poder rentabilizarlos y generar ventajas competitivas.<\/li>\n<\/ul>\n<h2><b>\u00bfPodr\u00eda usarse el dark data como fuente de datos?<\/b><\/h2>\n<p><span style=\"font-weight: 400;\">Seg\u00fan una encuesta llevada a cabo por <a href=\"https:\/\/es.wikipedia.org\/wiki\/Splunk\" target=\"_blank\" rel=\"noopener\"><em>Splunk<\/em><\/a>, el 60% de los datos que genera una empresa son del tipo dark (datos oscuros) es decir, informaci\u00f3n que no saben que existen o que no saben c\u00f3mo utilizar. Hay que saber diferenciar qu\u00e9 datos del dark data pueden ser utilizados y cu\u00e1les no, sobretodo si son datos confidenciales o relacionados con otras cuestiones legales. Sin embargo, datos como la forma de comunicaci\u00f3n entre empleados dentro de una misma empresa pueden ser utilizados para identificar referentes de conocimiento o relaciones dentro de la empresa.<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Importancia de la elecci\u00f3n de las fuentes de datos Las fuentes de datos en big data son la materia prima para analizar la informaci\u00f3n y obtener resultados de forma que, cualquier decisi\u00f3n que se tome a trav\u00e9s del big data, vendr\u00e1 dada por los datos que han sido elegidos previamente para su an\u00e1lisis. En la [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":16241,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"gallery","meta":{"content-type":"","footnotes":""},"categories":[25],"tags":[],"class_list":{"0":"post-16240","1":"post","2":"type-post","3":"status-publish","4":"format-gallery","5":"has-post-thumbnail","7":"category-analytics","8":"post_format-post-format-gallery"},"_links":{"self":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts\/16240","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/comments?post=16240"}],"version-history":[{"count":2,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts\/16240\/revisions"}],"predecessor-version":[{"id":39753,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts\/16240\/revisions\/39753"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/media\/16241"}],"wp:attachment":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/media?parent=16240"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/categories?post=16240"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/tags?post=16240"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}