Por: Redacción Visión Industrial
Cada vez se oye hablar más del término Big Data y de cómo se está volviendo en una de las principales “megatendencias” de las Tecnologías de la Información (TI) del futuro cercano, con un papel muy importante en la llamada Industria 4.0 y todo lo que conlleva (Internet de las cosas, Nube, movilidad, hiperconectividad, etc.), aunque hay quienes confunden los términos y no dan su verdadero significado. El presente artículo tiene como propósito introducir al lector en el concepto de Big Data y describir algunas características de los componentes principales que constituyen una solución de este tipo.
Hablamos de información y su aprovechamiento. Con el gran avance que existe día con día en las tecnologías de información, las organizaciones se han tenido que enfrentar a nuevos desafíos que les permitan analizar, descubrir y entender más allá de lo que sus herramientas tradicionales reportan sobre su información, al mismo tiempo que durante los últimos años el gran crecimiento de las aplicaciones disponibles en internet han sido parte importante en las decisiones de negocio de las empresas.
¿QUÉ ES EL BIG DATA?
Oracle dice que Big Data describe una estrategia holística de gestión de la información que incluye e integra muchos nuevos tipos de datos y de gestión de datos junto con datos tradicionales. Por su parte IBM nos dice que en términos generales podríamos referirnos como a la tendencia en el avance de la tecnología que ha abierto las puertas hacia un nuevo enfoque de entendimiento y toma de decisiones, la cual es utilizada para describir enormes cantidades de datos (estructurados, no estructurados y semi estructurados) que tomaría demasiado tiempo y sería muy costoso cargarlos a un base de datos tradicional para su análisis. De tal manera que, el concepto de Big Data aplica para toda aquella información que no puede ser procesada o analizada utilizando procesos o herramientas tradicionales
En su artículo “¿Qué es eso del Big Data?”, Eva Van Denberg comenta que en los años noventa, el informático teórico estadounidense John Mashey publicó un artículo titulado Big Data and the Next Wave of Infrastress (Big Data y la próxima ola de Infrastress), popularizando el término que hoy nos ocupa. En él, Mashey hacía referencia al estrés que iban a sufrir las infraestructuras físicas y humanas de la informática debido al imparable tsunami de datos que ya se asomaba en el horizonte, inmanejable con los instrumentos de gestión en uso. Desde luego no se equivocaba, hoy, en el siglo XXI, se generan, según la Unión Europea, 1,700 nuevos billones de bytes por minuto, otras cifras nos dicen que cada día se realizan, por ejemplo, más de un billón de consultas en Google, más de 250 millones de tuits en Twitter, 800 millones de actualizaciones en Facebook, 60 horas de vídeos subidos por minuto en YouTube, 10.000 transacciones mediante tarjetas de crédito por segundo, o bien que se estima que Google almacenaba unos 15 exabytes en 2016.
Tal cantidad de información que producimos entre todos procede de un sinfín de dispositivos que forman parte de nuestra vida cotidiana. Con ellos emitimos una serie de datos que van conformando nuestros historiales digitales. Cada vez que clicamos en Amazon, ese gesto queda consignado; cuando pagamos con la tarjeta la compra del supermercado, dejamos rastro de qué hemos comprado y a qué precio; cuando opinamos en la Red, colgamos imágenes, realizamos compras online o utilizamos una app, el Big Data sabe un poco más de nuestros gustos. Lo mismo sucede cuando subimos a un avión, mandamos un paquete por mensajería, accionamos el GPS del coche o el sistema domótico de casa. O cuando llamamos a una empresa y nos dicen que, por seguridad, la llamada quedará grabada. O cuando nos recetan medicinas, nos ingresan la nómina o pagamos la hipoteca. No cabe duda que se podría hacer un retrato perfecto de cada uno de nosotros optimizando el análisis de todos esos datos? De eso trata el Big Data. Es el término que afronta la labor de almacenar, clasificar, analizar y compartir ese cúmulo masivo de información, de lidiar con las denominadas “cuatro u-ves” del Big Data: gestionar un volumen de datos descomunal a la mayor velocidad posible, considerando su extraordinaria variedad, y obteniendo un valor intrínseco.
Y si usted cree que en Internet hay aplicaciones, servicios y juegos totalmente gratuitos, está en lo cierto, y podemos afirmar que muchos son realmente buenos y útiles. Y si se pregunta qué tiene que ver esto con el Big Data, le podemos decir que para eso se inventaron las Cookies. Los proveedores y fabricantes lo saben y, a falta del pago de una cuota, se contentan con los datos de navegación y hábitos de consumo y otros más privados. Si no, para qué paga Facebook, una aplicación que nació en el PC donde la gente comparte mucho de su información personal, 18.000 millones de euros por WhatsApp, una aplicación que tiene los números de teléfonos de millones de usuarios organizados por listas. Para qué Microsoft, empresa que nació mucho antes que Internet, paga 23.000 millones de euros por Linkedin, una red social donde muy poca gente miente.
IBM nos dice que de acuerdo con un estudio realizado por Cisco, entre el 2011 y el 2016 la cantidad de tráfico de datos móviles crecerá a una tasa anual de 78%, así como el número de dispositivos móviles conectados a Internet excederá el número de habitantes en el planeta. Las Naciones Unidas proyectan que la población mundial alcanzará los 7.5 billones para el 2016 de tal modo que habrá cerca de 18.9 billones de dispositivos conectados a la red a escala mundial, esto conllevaría a que el tráfico global de datos móviles alcance 10.8 Exabytes mensuales o 130 Exabytes anuales.
¿QUÉ TIPOS DE DATOS DEBO EXPLORAR?
Muchas organizaciones se enfrentan a la pregunta sobre ¿qué información es la que se debe analizar?, sin embargo, el cuestionamiento debería estar enfocado hacia ¿qué problema es el que se está tratando de resolver?
IBM menciona que si bien sabemos que existe una amplia variedad de tipos de datos a analizar, una buena clasificación nos ayudaría a entender mejor su representación, aunque es muy probable que estas categorías puedan extenderse con el avance tecnológico.
1.- Web and Social Media: Incluye contenido web e información que es obtenida de las redes sociales como Facebook, Twitter, LinkedIn, blogs, etc.
2.- Machine-to-Machine (M2M): Se refiere a las tecnologías que permiten conectarse a otros dispositivos. M2M utiliza dispositivos como sensores o medidores que capturan algún evento en particular (velocidad, temperatura, presión, variables meteorológicas, variables químicas, etc.) los cuales transmiten a través de redes alámbricas, inalámbricas o híbridas a otras aplicaciones que traducen estos eventos en información significativa.
3.- Big Transaction Data: Incluye registros de envío, de facturación, en telecomunicaciones registros detallados de las llamadas, etc., transacciones que realizamos millones de gentes día con día y que están disponibles en formatos tanto semiestructurados como no estructurados.
4.- Biometrics: Información biométrica en la que se incluye huellas digitales, escaneo de la retina, reconocimiento facial, genética, etc. En el área de seguridad e inteligencia, los datos biométricos han sido información importante para las agencias de investigación.
5.- Human Generated: Las personas generamos diversas cantidades de datos como la información que guarda un Call center al establecer una llamada telefónica, notas de voz, correos electrónicos, documentos electrónicos, estudios médicos, etc.
BIG DATA Y LAS EMPRESAS
Como mencionamos arriba, al igual que las personas, las empresas hoy en día tienen acceso a una cantidad de datos tan grande que incluso hace complicado su procesamiento, presentando dificultades para su captura, almacenamiento, búsqueda, comparación, etc., en definitiva, muchas dificultades para el análisis de una cantidad tan grande de datos con el equipo convencional de una empresa.
Sin embargo, Big Data ya no es una tecnología difusa, sino que responde a múltiples proyectos muy concretos que llevan ya funcionando en muchas empresas aportando un valor real al negocio, y de la que habría que ocuparse en serio, porque Big Data permite realizar operaciones que antes eran muy costosas y que en la inteligencia del negocio ni siquiera se planteaban porque se requería de una gran inversión tanto en equipo como en tiempo y el retorno no compensaba dichos esfuerzos. Sin embargo, la aparición de nuevas tecnologías y desarrollos, como la Hadoop, han permitido acelerar el acceso y procesamiento de muy grandes cantidades de información.
Este es un problema que afecta generalmente a la gran empresa, que tiene la capacidad de recoger esta gran cantidad de datos estructurados y no estructurados, que crecen de forma exponencial y que con el debido trato suponen una fuente valiosa para el análisis del negocio, puesto que proporcionan patrones entre sus clientes que servirán para fijar estrategias a seguir.
Las empresas que sepan explotar toda esta cantidad de datos que se están generando, incluso se anticiparán a las necesidades de sus propios clientes, de manera que podrán ofrecer lo que necesitan incluso antes de que el propio cliente lo demande. Esto lleva a muchas empresas a interesarse por políticas de adopción de Big Data que permitan el tratamiento y aprovechamiento del mundo de datos.
Aproximadamente la mitad de las empresas con más de 500 empleados han demostrado, de acuerdo con encuestas y estudios realizados, que tienen interés en adoptar sistemas que permitan el tratamiento de dichos datos, buscando con ello poder gestionar el crecimiento constante de los mismos y mejorar la disponibilidad y uso de la información. En un momento donde la disponibilidad de datos supera casi la capacidad de tratamiento, la empresa que pueda y sepa aprovecharlos podrá tomar la delantera sobre sus competidores, de aquí el interés en las tecnologías de tratamiento de datos, para lo cual la mayoría de las empresas opta por soluciones externas.
La idea más común al hablar de Big data es que “Big” sea por las grandes cantidades de datos, con lo cual estaríamos preguntando si las pymes quedarían entonces fuera del Big Data. Con estas cantidades debemos pensar que lo de “Big” realmente no se refiere tanto a un volumen de datos, sino a la importancia de los mismos. Se trata principalmente de saber encontrar el valor que puedan aportar al negocio, independientemente de su tamaño, ya que todos los negocios funcionan con datos y con clientes.
Los datos son el combustible del siglo XXI, la tecnología ahora lo posibilita, la Nube, las plataformas de configuración automática y escalado flexible y de pago por uso, ahora las puede contratar cualquier tipo de empresa, grande, pyme o startup. Resulta más difícil poder aplicar las ideas comerciales, los análisis de patrones, el diseño de algoritmos, la predicción de comportamientos.
¿Por qué hay que apostar por el Big Data? Estadísticamente está demostrado que Big Data genera beneficios, da valor y cumple con los KPI’s de una empresa. En un estudio que publicó McKinsey hace algunos años para empresas estadounidenses en el que comparaba por distintos sectores e industrias las que habían introducido tecnología de análisis Big Data respecto a las que no lo utilizaban, resultó que los ingresos aumentaron notablemente en las empresas que sí estaban utilizando Big Data frente a las que no, llamando la atención cómo mejoró el margen y el EBITDA, en los primeros casos el EBITDA aumentó un 22% y en las otras disminuyó un 15%, una diferencia de 37 puntos.
En este punto podemos cuestionarnos, ¿cuán crítico puede ser el Big Data para cada tipo de negocio?, ¿qué aspectos hay que tener en cuenta?, ¿cuándo tengo que entrar en esta liga? Se dice que en esta era donde la innovación es el punto de diferenciación entre competidores y el Internet de las Cosas y la Industria 4.0 son el futuro cercano, si todas las empresas industriales deben mirar hacia el aprovechamiento de datos dejando en el aire el qué tan pronto deben hacerlo, es evidente que para sectores como Banca, Seguros, Comunicaciones y medios es crítico estar ya dentro del Big Data, pues tienen un alto volumen y una gran variedad de datos; otros como la industria del consumo y comercios en general principalmente con ventas en línea pueden definir dónde viven sus clientes, sus preferencias, y con ello saber cuánto producto realmente necesitan producir, donde distribuir, mejoras o cambios a los mismos, lanzar ofertas, etc. Sin embargo, ya industrias como la automotriz, textil, electrónica o servicios como el turismo (hoteles, líneas aéreas, de autobuses y otros) llevan ya tiempo en el aprovechamiento de información para sus desarrollos y creciendo día con día, la hiperconectividad está obligando a cualquier compañía a adaptarse sin importar si fabrica autos, ropa, calzado, electrónicos,… lo que nos lleva a que la respuesta a la pregunta inicial es que depende mucho del tipo de negocio, depende mucho de la industria en la que se esté moviendo, pero su uso es inminente, sólo hay que considerar que antes de intentar utilizar el Big Data en nuestra empresa, debemos tener claro para qué lo necesitamos.
El Big Data ha llegado para quedarse definitivamente en las empresas, da igual el tamaño y actividad, y aunque a fin de cuentas cuando hablamos de Big Data hablamos de tecnología, hay que recordar que principalmente hablamos de sacarle valor a los datos. Muchas de las decisiones que estamos tomando ahora por intuición, porque suponemos que debe ser así, se podrán tomar sabiendo a través de los datos que es información verídica, y que son datos los que nos están hablando y dando la razón.
REFERENCIAS
https://www.ibm.com/developerworks/ssa/local/im/que-es-big-data/
http://elpais.com/elpais/2015/03/26/buenavida/1427382655_646798.html
https://www.oracle.com/es/big-data/index.html
http://www.bbvacontuempresa.es/a/el-big-data-ha-llegado-a-las-empresas-para-quedarse
http://www.bbvacontuempresa.es/a/puede-tu-comercio-sacarle-partido-al-big-data