{"id":28996,"date":"2021-08-14T13:25:30","date_gmt":"2021-08-14T13:25:30","guid":{"rendered":"https:\/\/www.conectasoftware.com\/glossary\/big-data\/"},"modified":"2023-07-02T22:31:23","modified_gmt":"2023-07-02T22:31:23","slug":"big-data","status":"publish","type":"glossary","link":"https:\/\/www.conectasoftware.com\/magazine\/glosario\/big-data\/","title":{"rendered":"Big Data<span class=\"dashicons \" data-icon=\"\" style=\"color:#000;display:inline;vertical-align:baseline;\"><\/span>"},"content":{"rendered":"<p>Big Data hace referencia a conjuntos de datos tan grandes y complejos como para que hagan falta aplicaciones inform\u00e1ticas no tradicionales de procesamiento de datos para tratarlos adecuadamente.<\/p>\n<p>Tambi\u00e9n se conoce como <strong>macrodatos<\/strong> y datos masivos.<\/p>\n<h2>Big Data estructurados y no estructurados<\/h2>\n<p>Los datos que se analizan se pueden dividir en dos grandes categor\u00edas:<\/p>\n<p><strong>Datos estructurados:<\/strong> Aquellos que tienen longitud y formato (fechas) y que pueden ser almacenados en tablas.<\/p>\n<p><strong>Datos no estructurados: <\/strong>Son los que no tienen formato determinado y no pueden ser almacenados en tablas,( los que generan los usuarios en foros, redes sociales, archivos de audio, video).<\/p>\n<blockquote><p>El objetivo principal del Big Data es convertir datos en informaci\u00f3n para que facilite la toma decisiones incluso en tiempo real.<\/p><\/blockquote>\n<h2>\u00bfDe donde vienen los datos?<\/h2>\n<p>Su origen se remonta a los a\u00f1os 60 y 70, cuando se establecieron los primeros centros de datos y el desarrollo de bases de datos relacionales.<\/p>\n<p>El 90% de los datos se gener\u00f3 en los \u00faltimos a\u00f1os. El grueso de los grandes datos generados proviene de tres fuentes principales:<\/p>\n<ol>\n<li style=\"list-style-type: none;\">\n<ol>\n<li>datos sociales<\/li>\n<\/ol>\n<\/li>\n<\/ol>\n<ol>\n<li style=\"list-style-type: none;\">\n<ol>\n<li>datos de m\u00e1quinas<\/li>\n<\/ol>\n<\/li>\n<\/ol>\n<ol>\n<li style=\"list-style-type: none;\">\n<ol>\n<li>y datos transaccionales<\/li>\n<\/ol>\n<\/li>\n<\/ol>\n<p>Otra distinci\u00f3n es si los datos se generan internamente o si vienen de fuera de la empresa.<\/p>\n<h3>Los datos sociales<\/h3>\n<p>El inter\u00e9s por el Big Data aument\u00f3 con el uso exponencial de las redes sociales Facebook y YouTube. Hoy en d\u00eda, todos somos productores de datos, dando Me gusta, Tweets y Retweets, Comentarios o subiendo videos e imagenes que publicamos y compartimos a trav\u00e9s de las plataformas de redes sociales.<\/p>\n<p>Este tipo de datos proporciona informaci\u00f3n muy valiosa sobre el comportamiento y el sentimiento del consumidor. Por ello, son muy relevantes en el an\u00e1lisis de marketing.<\/p>\n<p>La web p\u00fablica es otra buena fuente de datos sociales, y herramientas como Google Trends pueden usarse con buenos resultados para aumentar el volumen de big data.<\/p>\n<h3>Los datos de la m\u00e1quina<\/h3>\n<p>El Internet de las cosas es otro impulso de para el uso de Big Data. En estos caso, hablamos de informaci\u00f3n generada por equipos industriales, sensores instalados en maquinaria e incluso registros web que rastrean el comportamiento del usuario.<\/p>\n<p>Se espera que este tipo de datos crezca exponencialmente a medida que el IoT se esta implementando en las Smart Cities y en las empresas. Los sensores tales como dispositivos m\u00e9dicos, medidores inteligentes, c\u00e1maras de carretera, sat\u00e9lites, juegos y el Internet de las Cosas son una de las fuentes clave del Big Data y su importancia seguir\u00e1 creciendo.<\/p>\n<h3>La fuente de los datos transaccionales<\/h3>\n<p>Este tipo de datos se genera a partir de las transacciones diarias que tienen lugar tanto online como en f\u00edsico. Las facturas, las \u00f3rdenes de pago, los registros de almacenamiento, los recibos de entrega,se caracterizan como datos transaccionales. Estos datos por s\u00ed solos casi no tienen sentido, y la mayor\u00eda de las organizaciones se enfrentan al reto de dar sentido a los datos que est\u00e1n generando y c\u00f3mo sacarles provecho.<\/p>\n<h2>Big Data y las 3 V: Volumen, Velocidad y Variedad<\/h2>\n<blockquote><p>Big data son datos que contienen una mayor variedad y que se presentan en vol\u00famenes crecientes y a una velocidad superior. Esto se conoce como \u00ablas tres V\u00bb<\/p>\n<p>Gartner<\/p><\/blockquote>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li>Volumen<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li>Velocidad<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li>Variedad<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<h2>Las nuevas V: Valor y veracidad<\/h2>\n<p>Mientras que las 3 V definidas por Gartner siguen siendo relevantes, en los \u00faltimos a\u00f1os se han sumado otras dos caracter\u00edsticas. Estos son el valor y la veracidad de los datos.<\/p>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li>Valor<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li>Veracidad<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<h2>Casos de uso<\/h2>\n<p>El Big Data se utiliza en la mejora de la operativa empresarial, incluyendo la innovaci\u00f3n y detecci\u00f3n de amenazas y oportunidades. Perminte determinar las causas de origen de fallos, problemas y defectos casi en tiempo real. Estos son casos de uso de Big Data<\/p>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li>Fraude<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li>Aprendizaje automatizado (Machine Learning)<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li>Experiencia de cliente<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li>Desarrollo de producto<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<ul>\n<li style=\"list-style-type: none;\">\n<ul>\n<li><a href=\"https:\/\/www.conectasoftware.com\/magazine\/digitalizacion\/innovacion-y-eficiencia-proyectos-agiles\/\">Innovaci\u00f3n y eficiencia<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<h2>Frameworks de software para Big Data<\/h2>\n<h3>Hadoop<\/h3>\n<p><a href=\"https:\/\/hadoop.apache.org\/\" target=\"_blank\" rel=\"noopener noreferrer\"><img loading=\"lazy\" loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-13027\" src=\"https:\/\/www.conectasoftware.com\/magazine\/wp-content\/uploads\/2020\/03\/hadoop-logo.png\" alt=\"\" width=\"323\" height=\"156\" \/><\/a><\/p>\n<p>Hadoop es un framework open source de Apache Foundation, que se desarroll\u00f3 para resolver los nuevos retos asociados al surgimiento de la disciplina Data Science. En concreto, se utiliza para almacenar, procesar y analizar grandes vol\u00famenes de datos. Adem\u00e1s, permite ejecutar aplicaciones en clusters de hardware b\u00e1sicos.<\/p>\n<h3>Spark<\/h3>\n<p><a href=\"https:\/\/spark.apache.org\/\" target=\"_blank\" rel=\"noopener noreferrer\"><img loading=\"lazy\" loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-13029\" src=\"https:\/\/www.conectasoftware.com\/magazine\/wp-content\/uploads\/2020\/03\/spark-logo.jpg\" alt=\"\" width=\"580\" height=\"237\" \/><\/a><\/p>\n<p>Apache Spark se define como\u00a0un motor de an\u00e1lisis unificado para el procesamiento de datos a gran escala.<\/p>\n<p>Spark se ejecuta en Hadoop, Apache Mesos, Kubernetes, en forma independiente o en la nube. Puede acceder a diversas fuentes de datos.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Big Data hace referencia a conjuntos de datos tan grandes y complejos como para que hagan falta aplicaciones inform\u00e1ticas no tradicionales de procesamiento de datos para tratarlos adecuadamente. Tambi\u00e9n se conoce como macrodatos y datos masivos. Big Data estructurados y no estructurados Los datos que se analizan se pueden dividir en dos grandes categor\u00edas: Datos [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":13430,"menu_order":0,"template":"","meta":{"content-type":"","footnotes":""},"glossary-categories":[95],"glossary-tags":[],"glossary-languages":[],"class_list":{"0":"post-28996","1":"glossary","2":"type-glossary","3":"status-publish","4":"has-post-thumbnail","6":"glossary-categories-diccionario-de-business-intelligence"},"_links":{"self":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/glossary\/28996","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/glossary"}],"about":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/types\/glossary"}],"author":[{"embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/users\/1"}],"version-history":[{"count":1,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/glossary\/28996\/revisions"}],"predecessor-version":[{"id":37627,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/glossary\/28996\/revisions\/37627"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/media\/13430"}],"wp:attachment":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/media?parent=28996"}],"wp:term":[{"taxonomy":"glossary-categories","embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/glossary-categories?post=28996"},{"taxonomy":"glossary-tags","embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/glossary-tags?post=28996"},{"taxonomy":"glossary-languages","embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/glossary-languages?post=28996"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}