{"id":14330,"date":"2020-11-11T23:09:51","date_gmt":"2020-11-11T23:09:51","guid":{"rendered":"https:\/\/www.conectasoftware.com\/?p=14330"},"modified":"2024-02-04T22:58:19","modified_gmt":"2024-02-04T22:58:19","slug":"como-dominar-la-oleada-del-big-data","status":"publish","type":"post","link":"https:\/\/www.conectasoftware.com\/magazine\/como-dominar-la-oleada-del-big-data\/","title":{"rendered":"C\u00f3mo dominar la oleada del Big Data"},"content":{"rendered":"<div class=\"clearfix\">\n<div class=\"col-sm-8 \">\n<div class=\"recommendation\"><span style=\"color: #ffffff;\">C\u00f3mo dominar la oleada del Big Data<\/span><\/div>\n<\/div>\n<\/div>\n<div class=\"col-sm-8 col-sm-push-3 \">\n<h2>Conceptos clave<\/h2>\n<ul class=\"takeaways\">\n<li>El \u201ctorrente de datos\u201d, la oleada de nuevas y poderosas fuentes de informaci\u00f3n, se est\u00e1 abatiendo sobre la econom\u00eda y sobre la mayor\u00eda de las empresas.<\/li>\n<li>El torrente de datos representa oportunidades y requiere herramientas especiales.<\/li>\n<li>Los datos de la Web \u2013 la forma m\u00e1s com\u00fan del torrente de datos \u2013 incluyen textos, identificaci\u00f3n de radiofrecuencias (DIRF), \u201ctelem\u00e1tica\u201d, informaci\u00f3n de los medios sociales y datos de redes inteligentes.<\/li>\n<li>La escalabilidad, las herramientas, los m\u00e9todos y los procesos del an\u00e1lisis evolucionan de forma muy r\u00e1pida.<\/li>\n<li>Un informe le transmite datos en formas esperadas; un an\u00e1lisis plantea preguntas bien elaboradas en formas originales para proporcionar conocimiento nuevo.<\/li>\n<li>Ciertas herramientas facilitan el an\u00e1lisis, como el \u201can\u00e1lisis restringido\u201d o an\u00e1lisis de caj\u00f3n de arena: un conjunto cerrado de recursos que un analista puede remodelar a voluntad.<\/li>\n<li>Un buen an\u00e1lisis es \u201corientado, pertinente, comprensible, aplicable y oportuno\u201d.<\/li>\n<li>Un analista excelente necesita creatividad, intuici\u00f3n y formaci\u00f3n estad\u00edstica.<\/li>\n<li>Los analistas trabajan bien en una estructura matriz con una jerarqu\u00eda m\u00ednima.<\/li>\n<li>Organice el an\u00e1lisis para que permita la \u201cinnovaci\u00f3n anal\u00edtica\u201d: hacer an\u00e1lisis de maneras nuevas, plantear preguntas nuevas y usar nuevas herramientas y m\u00e9todos.<\/li>\n<\/ul>\n<\/div>\n<div class=\"col-sm-8 col-sm-push-3\">\n<h2>Resumen<\/h2>\n<h3>La evoluci\u00f3n del \u201ctorrente de datos\u201d<\/h3>\n<p>Nada modelar\u00e1 tanto el \u201can\u00e1lisis avanzado\u201d en el futuro \u201ccomo la actual explosi\u00f3n de nuevas y poderosas fuentes de datos\u201d o torrente de datos. Las nuevas fuentes de datos poseen caracter\u00edsticas que las diferencian de las \u201cfuentes de datos tradicionales\u201d. El torrente de datos es m\u00e1s veloz, complejo y variado que los datos tradicionales. Las m\u00e1quinas producen un torrente de datos, el cual se basa en la tecnolog\u00eda de la informaci\u00f3n, la capacidad de procesamiento y la memoria artificial. Para aprovechar ese torrente, debe separar la informaci\u00f3n \u00fatil de la paja. El torrente de datos s\u00f3lo es \u00fatil en combinaci\u00f3n con los datos tradicionales y el an\u00e1lisis aplicado.<\/p>\n<blockquote><p>\u201cQuiz\u00e1 nada tendr\u00e1 un impacto tan fuerte en el an\u00e1lisis avanzado en los a\u00f1os venideros como la actual explosi\u00f3n de nuevas y poderosas fuentes de datos\u201d.<\/p><\/blockquote>\n<p>Lo datos tradicionales estaban estructurados, pero la mayor\u00eda de los datos del torrente no lo est\u00e1n o lo est\u00e1n a medias. Debe aprender la l\u00f3gica de los datos estructurados a medias y estructurar los datos no estructurados. A medida que las m\u00e1quinas captan m\u00e1s datos, las empresas deben poner a salvo su repertorio de datos y actuar con \u00e9tica cuando re\u00fanen y usan la informaci\u00f3n. Su empresa debe practicar la autorregulaci\u00f3n: si captura demasiados datos con demasiada rapidez, los costos pueden superar los beneficios y no sabr\u00e1 qu\u00e9 hacer con los datos reunidos. Desarrolle una estrategia para \u201cobtener beneficios peque\u00f1os y r\u00e1pidos\u201d al usar el torrente de datos.<\/p>\n<h3>Las fuentes del torrente de datos<\/h3>\n<p>La mayor fuente del torrente de datos es la Web. La mayor\u00eda de los an\u00e1lisis empresariales s\u00f3lo rastrean el tr\u00e1fico y el n\u00famero de transacciones y visitas en l\u00ednea, pero los datos de la Web tienen m\u00e1s contenido y potencial; por ejemplo: de las personas que buscan un producto y llegan a su p\u00e1gina web, al menos el 5%, digamos, podr\u00eda poner algo en su canasta de compras; quiz\u00e1 la mitad llegue a la caja e incluso menos comprar\u00e1 algo. \u00bfQu\u00e9 pasa en cada paso? \u00bfQu\u00e9 evita que los clientes hagan su compra?<\/p>\n<blockquote><p>\u201cEl torrente de datos surge de todas partes y su uso apropiado dar\u00e1 impulso a las ventajas competitivas\u201d.<\/p><\/blockquote>\n<p>Los datos de la Web le permiten rastrear qu\u00e9 clientes dejaron su p\u00e1gina despu\u00e9s de leer las especificaciones, cu\u00e1les vieron sus videos o leyeron sus rese\u00f1as, etc\u00e9tera, y rastrear los pasos que siguieron para llegar a su sitio. La b\u00fasqueda de esa informaci\u00f3n plantea cuestiones de privacidad, pero puede reunir esa informaci\u00f3n sin personalizarla y rastrear clientes promedio, no espec\u00edficos. Los datos de la Web le permiten seguir a los clientes en su proceso de decisi\u00f3n, rastrear su conducta y prever sus necesidades y deseos.<br \/>\nHaga el \u201cmodelado de disminuci\u00f3n\u201d: un estudio de la conducta de los clientes que podr\u00edan cancelar o cambiar servicios; o el \u201cmodelado de respuesta\u201d: un an\u00e1lisis de los actos de los clientes para predecir sus probables compras futuras; con m\u00e1s informaci\u00f3n, puede favorecer ciertos segmentos de clientes. El rastreo de los datos de la Web o los foros de retroalimentaci\u00f3n en l\u00ednea pueden reemplazar las encuestas. La revisi\u00f3n de otras fuentes podr\u00eda suscitar sus ideas anal\u00edticas:<\/p>\n<h4><b>\u201cDatos telem\u00e1ticos\u201d<\/b><\/h4>\n<p>Las aseguradoras de autom\u00f3viles emplean los datos telem\u00e1ticos para centrar sus ofertas: en lugar de cobrar a una categor\u00eda la misma tarifa, usan el an\u00e1lisis telem\u00e1tico para reducir las primas a los conductores seguros y rastrear c\u00f3mo la gente usa su veh\u00edculo. Esos datos proporcionan una medici\u00f3n precisa del riesgo del conductor.<\/p>\n<h4><b>\u201cDatos de los textos\u201d<\/b><\/h4>\n<p>Los medios de comunicaci\u00f3n en l\u00ednea son una fuente de un torrente de datos poco analizados. Los textos no est\u00e1n estructurados, dependen del contexto y requieren un an\u00e1lisis considerable. Puede rastrear lo que se rumora sobre un tema o hacer un \u201can\u00e1lisis de sentimientos\u201d para saber c\u00f3mo reacciona la gente a un tema o a una cuesti\u00f3n.<\/p>\n<h4><b>\u201cDatos de tiempo y lugar\u201d<\/b><\/h4>\n<p>Ahora que hay m\u00e1s dispositivos con GPS, puede rastrear con m\u00e1s precisi\u00f3n d\u00f3nde est\u00e1n sus clientes en momentos espec\u00edficos, lo cual le permite publicar anuncios centrados en ellos, como la oferta de un cup\u00f3n para un restaurante; tambi\u00e9n puede situar grupos de gente, por ejemplo, para que las ambulancias eviten los embotellamientos.<\/p>\n<h4><b>\u201cDatos de identificaci\u00f3n de radiofrecuencias (DIRF)\u201d<\/b><\/h4>\n<p>Las chapas de DIRF han remodelado varios aspectos de la gesti\u00f3n, seguridad y ventas de la cadena de existencias y suministro. Las chapas identifican el lugar preciso y la condici\u00f3n de los objetos que las llevan. Unas son m\u00f3viles, otras estacionarias, algunas muestran mejor las ventas, etc\u00e9tera.<\/p>\n<h4><b>\u201cDatos de redes inteligentes\u201d<\/b><\/h4>\n<p>Las nuevas \u201credes inteligentes\u201d usan \u201csensores aplicados\u201d para observar el uso. Las empresas de electricidad saben c\u00f3mo asignar el uso para un beneficio m\u00e1ximo. En la maquinaria industrial, pueden captar los motores en tensi\u00f3n y asegurarse de que todas sus partes funcionen bien; y, cuando los gerentes de productividad los usan para vigilar los diferentes aspectos de la manufactura, pueden mejorar el rendimiento.<\/p>\n<h4><b>\u201cDatos de rastreo de las fichas de casinos\u201d y \u201cdatos de telemetr\u00eda\u201d<\/b><\/h4>\n<p>Los casinos requieren una seguridad m\u00e1s estricta que otras empresas. Si pudieran aumentar la informaci\u00f3n de sus sistemas de video mediante el uso de fichas de juego con chapas que pudieran transmitirla, podr\u00edan rastrearse los patrones de apuesta, saber qu\u00e9 mesas tienen m\u00e1s actividad y determinar si alguien roba fichas. Los videojuegos usan la telemetr\u00eda para captar la conducta de los jugadores, transformar los movimientos en datos y desplazar la acci\u00f3n. Los fabricantes podr\u00edan usar ese tipo de lecturas con otros prop\u00f3sitos, como establecer servicios de suscripci\u00f3n para videojuegos y reunir datos sobre la manera de jugar para mejorarlos.<\/p>\n<h4><b>\u201cDatos de los medios sociales\u201d<\/b><\/h4>\n<p>Los medios sociales implican establecer redes y los analistas puede explotar los datos de esos medios para obtener informaci\u00f3n sobre los individuos y retroalimentaci\u00f3n de las redes, y rastrear la influencia de uno o m\u00e1s individuos, saber qui\u00e9n est\u00e1 conectado con qui\u00e9n y conocer qu\u00e9 tipo de conexiones emplean la gente y las sociedades.<\/p>\n<h3>Escalabilidad, procesos, herramientas y m\u00e9todos<\/h3>\n<p>Los analistas han ampliado la escala del procesamiento de datos durante a\u00f1os. El producto es el torrente de datos. El almacenamiento de datos est\u00e1 disponible a precios cada vez menores. El an\u00e1lisis y el almacenamiento cada vez se mezclan m\u00e1s. El almacenamiento centralizado da acceso a m\u00e1s clases de datos a la vez y permite analizar con m\u00e1s detalle las relaciones entre las clases de datos.<\/p>\n<blockquote><p>\u201cQuiz\u00e1 ninguna otra fuente del torrente de datos se use tan ampliamente hoy como la Web\u201d.<\/p><\/blockquote>\n<p>La estructura de los sistemas de datos est\u00e1 cambiando. Aunque el procesamiento paralelo (la capacidad de un ordenador para hacer varias tareas al mismo tiempo) est\u00e1 bien establecido, las bases de datos de \u201cprocesamiento masivamente paralelo\u201d (PMP) son un avance reciente. El PMP distribuye los datos a muchas unidades centrales de procesamiento, las que los procesan con mayor velocidad, \u201cporque procesan simult\u00e1neamente muchas b\u00fasquedas independientes, en lugar de una sola gran b\u00fasqueda\u201d.<br \/>\nOtro avance reciente es el c\u00f3mputo en la nube, que ofrece flexibilidad mediante el uso compartido de servidores de gran capacidad: usted s\u00f3lo paga el procesamiento, en lugar de comprar equipo para todo un sistema. El \u201cMapReduce\u201d es un modelo de programaci\u00f3n que permite \u201cdistribuir a muchas m\u00e1quinas la carga de procesar una gran cantidad de datos\u201d y funciona bien con el c\u00f3mputo en la nube y las bases de datos relacionales para dominar el el torrente de datos.<\/p>\n<blockquote><p>\u201cLos datos sobre tiempo y lugar son uno de los tipos del torrente de datos m\u00e1s sensibles para la privacidad\u201d.<\/p><\/blockquote>\n<h4>Anal\u00edtica<\/h4>\n<p>Cada herramienta posee cualidades y defectos anal\u00edticos. Los m\u00e9todos anal\u00edticos y las herramientas conceptuales tambi\u00e9n est\u00e1n evolucionando. Con la elaboraci\u00f3n de \u201cmodelos m\u00faltiples\u201d para el an\u00e1lisis y la combinaci\u00f3n de sus resultados se pueden aprovechar las cualidades de las diversas herramientas y reducir al m\u00ednimo sus defectos.<\/p>\n<blockquote><p>\u201cLos textos son una de las fuentes m\u00e1s numerosas y comunes del torrente de datos\u201d.<\/p><\/blockquote>\n<p>La avalancha de datos de texto contin\u00faa multiplic\u00e1ndose y las empresas prestan m\u00e1s atenci\u00f3n a su an\u00e1lisis. Ahora, las \u201csoluciones puntuales\u201d \u2013 software predise\u00f1ado con herramientas para \u201csolucionar un conjunto de problemas muy espec\u00edfico y limitado \u2013 son cada vez m\u00e1s variadas y obtenibles. La \u201cvisualizaci\u00f3n de datos\u201d representa gr\u00e1ficamente la informaci\u00f3n. Tambi\u00e9n hay ya software de c\u00f3digo abierto disponible para el an\u00e1lisis, como para todas las dem\u00e1s operaciones inform\u00e1ticas: \u201cR\u201d es el software de c\u00f3digo abierto m\u00e1s popular para el an\u00e1lisis.<\/p>\n<blockquote><p>\u201cLos datos de la Web son \u00fanicos, porque le permiten obtener informaci\u00f3n sobre lo que sus clientes piensan comprar y sobre c\u00f3mo funcionan sus procesos de decisi\u00f3n\u201d.<\/p><\/blockquote>\n<p>No importa c\u00f3mo escale el procesamiento y almacenamiento de datos, su inversi\u00f3n no rendir\u00e1 frutos a menos que mejore su an\u00e1lisis. Las desventajas son que el an\u00e1lisis podr\u00eda consumir tiempo y recursos, interferir con otros procesos y generar fricciones con el departamento de tecnolog\u00eda de la informaci\u00f3n. Evite esos problemas y mejore su an\u00e1lisis dise\u00f1ando un \u201can\u00e1lisis restringido\u201d, un conjunto de recursos independiente que un analista puede remodelar a voluntad para un proyecto espec\u00edfico.<\/p>\n<h3>La calidad y el torrente de datos<\/h3>\n<p>Distinga entre informe y an\u00e1lisis; ambos son esenciales y puede entretejerlos, pero no los confunda. Los informes presentan los datos que necesita en una \u201cforma predefinida y normalizada\u201d; el an\u00e1lisis ofrece respuestas a preguntas sobre los datos. Haga su an\u00e1lisis a la medida \u201cde las cuestiones espec\u00edficas que busca solucionar\u201d. Las listas mnemot\u00e9cnicas incluyen las pautas para evaluar que el an\u00e1lisis sea:<\/p>\n<ul>\n<li><b>\u201cGuiado\u201d<\/b>\u00a0\u2013 Haga que las necesidades de su empresa gu\u00eden su an\u00e1lisis para que sea centrado y determinado.<\/li>\n<li><b>\u201cPertinente\u201d<\/b>\u00a0\u2013 El an\u00e1lisis debe poder aplicarse inmediatamente a los requerimientos y circunstancias de la empresa.<\/li>\n<li><b>\u201cComprensible\u201d<\/b>\u00a0\u2013 El an\u00e1lisis debe tener sentido para quienes lo usen.<\/li>\n<li><b>\u201cAplicable\u201d<\/b>\u00a0\u2013 Un buen an\u00e1lisis est\u00e1 listo para que la empresa lo use y es pertinente para su trabajo: no sugiera opciones que te\u00f3ricamente ser\u00edan posibles, pero que nunca se presentar\u00edan.<\/li>\n<li><b>\u201cOportuno\u201d<\/b>\u00a0\u2013 El an\u00e1lisis proporciona la informaci\u00f3n que se necesita para aplicarlo.<\/li>\n<\/ul>\n<blockquote><p>\u201cEs crucial entender la diferencia entre la importancia estad\u00edstica y la importancia empresarial\u201d.<\/p><\/blockquote>\n<p>En un an\u00e1lisis avanzado, sus analistas deben plantear las preguntas adecuadas y estructurarlas para obtener el mayor beneficio. Para derivar las preguntas, examine sus supuestos sobre la situaci\u00f3n con sus analistas: \u00bfbusca usted m\u00e1s clientes o m\u00e1s ganancias de su base de clientes actual? Cada opci\u00f3n puede requerir preguntas diferentes; lo importante es la aplicabilidad o \u201cimportancia empresarial\u201d de los datos. Un buen an\u00e1lisis est\u00e1 completo y no omite ning\u00fan aspecto crucial. Un an\u00e1lisis excelente elimina la paja del torrente de datos para encontrar el mensaje significativo.<\/p>\n<h3>La organizaci\u00f3n adecuada para el torrente de datos<\/h3>\n<p>Para hacer buenos an\u00e1lisis, debe contratar buenos analistas. Los analistas excelentes reconocen los datos que son claros y adecuados para usarlos como base de una decisi\u00f3n; siguen la l\u00f3gica de los datos hasta donde los lleve, aunque vaya contra sus supuestos previos. Los buenos analistas son intuitivos; necesitan un conocimiento profundo de las matem\u00e1ticas o las estad\u00edsticas, as\u00ed como cualidades innatas, como la creatividad y el compromiso; y deben agudizar su experiencia en la industria, su astucia empresarial y sus habilidades para hacer presentaciones.<\/p>\n<blockquote><p>\u201cUn an\u00e1lisis excelente combina la solidez de la ciencia con una fuerte dosis de arte\u201d.<\/p><\/blockquote>\n<p>Una vez que tenga a la gente apropiada, organice su trabajo apropiadamente: una estructura descentralizada o funcional integra a los analistas en un departamento de la empresa donde sean inmediatamente \u00fatiles. Los departamentos tambi\u00e9n poseen un conocimiento profundo de los proyectos que analizan; sin embargo, una estructura compartimentada puede limitar la carrera de los analistas, porque los departamentos manejan a unos cuantos empleados. Las estructuras centralizadas tienen beneficios diferentes, pero directos: si un departamento tiene poca actividad, puede redistribuir el talento a otros. Una estructura h\u00edbrida puede tener un \u201ccentro de excelencia\u201d \u2013 un grupo de analistas excelentes que dan continuidad a toda la empresa \u2013 y especialistas dedicados a departamentos espec\u00edficos. Los equipos de analistas trabajan bien con una estructura matriz, un l\u00edder de equipo y una jerarqu\u00eda m\u00ednima. Forme equipos que mezclen grados de pericia.<\/p>\n<blockquote><p>\u201cLos analistas han estado llevando la escalabilidad al m\u00e1ximo durante decenios. El torrente de datos es s\u00f3lo la siguiente intimidante generaci\u00f3n de datos por dominar\u201d.<\/p><\/blockquote>\n<h4>An\u00e1lisis<\/h4>\n<p>Use los an\u00e1lisis para impulsar la innovaci\u00f3n mediante la creaci\u00f3n de un \u201ccentro de innovaci\u00f3n anal\u00edtica\u201d dedicado a explorar ideas. Esos centros requieren una \u201cplataforma de tecnolog\u00eda\u201d que soporte herramientas anal\u00edticas, productos y servicios exteriores para aumentar el talento interno, respaldo ejecutivo, un buen equipo de analistas y un \u201cconsejo de innovaci\u00f3n\u201d para revisar las ideas y seleccionar las que merezcan el patrocinio del centro de innovaci\u00f3n.<\/p>\n<\/div>\n<h2>Sobre el autor<\/h2>\n<p class=\" stretchedText\"><a href=\"https:\/\/www.amazon.es\/Bill-Franks\/e\/B006JG2KDY\" target=\"_blank\" rel=\"noopener\"><b>Bill\u00a0Franks<\/b><\/a>\u00a0es director de an\u00e1lisis de Teradata y supervisor del Business Analytics Innovation Center que esa compa\u00f1\u00eda patrocina.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>C\u00f3mo dominar la oleada del Big Data Conceptos clave El \u201ctorrente de datos\u201d, la oleada de nuevas y poderosas fuentes de informaci\u00f3n, se est\u00e1 abatiendo sobre la econom\u00eda y sobre la mayor\u00eda de las empresas. El torrente de datos representa oportunidades y requiere herramientas especiales. Los datos de la Web \u2013 la forma m\u00e1s com\u00fan [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":22671,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"content-type":"","footnotes":""},"categories":[27],"tags":[],"class_list":{"0":"post-14330","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-tecnologia"},"_links":{"self":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts\/14330","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/comments?post=14330"}],"version-history":[{"count":1,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts\/14330\/revisions"}],"predecessor-version":[{"id":40624,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/posts\/14330\/revisions\/40624"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/media\/22671"}],"wp:attachment":[{"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/media?parent=14330"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/categories?post=14330"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.conectasoftware.com\/magazine\/wp-json\/wp\/v2\/tags?post=14330"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}