Volver

¿De qué hablamos cuando hablamos de Big Data?

Publicado el 24/03/21

Big Data se puede definir como la toma de decisiones o la prestación de servicios basada en el flujo de datos digitales y la capacidad de procesarlos en tiempo real. El objetivo es generar negocios a partir de la correcta gestión de los datos. No es sólo capturar los datos, sino hacerlos hablar para que nos permitan encontrar nuevas oportunidades.

Todos tenemos en el bolsillo un dispositivo que incrementó exponencialmente el flujo de datos disponible para las empresas que son nuestras proveedoras. El estado de conectividad permanente hace que el flujo de información sea continuo: una búsqueda de nuestra marca en Google, un comentario en redes sociales, una reproducción más de nuestro video en Youtube.

La diferencia entre los datos que se generan ahora y los datos que obteníamos desde las transacciones registradas en los sistemas empresariales o en encuestas, cualquiera sea el soporte utilizado es que estos datos son anárquicos y espontáneos; no se generaron con el propósito de generarse sino como consecuencia de otra acción. La masividad de los datos es sólo una característica de big data. Hace falta algo más para completar el concepto.

El desafío es transformar ese flujo de datos en oportunidades de negocios y para eso se tienen que combinar el poder de cómputo de las nuevas computadoras (y la posibilidad de usarlo sin invertir millones de dólares en infraestructura de IT) con los modelos estadísticos tradicionales.

Las 5 Vs.

Cuando hablamos de Big Data se habla de 5 atributos que tienen que cumplirse para que sean proyectos válidos.

1-  Volumen: los datos que se producen en el mundo en dos días equivalen a todos los datos producidos por la humanidad hasta el 2003. Y la mayoría de los datos se producen sin intervención de las personas involucradas, a partir de dispositivos interconectados y sin el propósito de generar datos, sino como huella de lo que hacemos. Capitalizar todo ese volumen de datos para que confluyan en una oportunidad de negocios, es un reto técnico para cualquier organización.

2-  Velocidad: el flujo de datos es masivo y constante. El reto es almacenar grandes cantidades de datos que puedan procesarse en tiempo real, porque quedan desactualizados en forma inmediata.

3-  Variedad: las fuentes de datos son completamente heterogéneas, proviniendo de diferentes plataformas, dispositivos, sensores. Pueden estar estructurados en bases de datos relacionales o no estructurados (la mayoría, los más jugosos, en forma de interacciones en redes sociales, intercambios de correos electrónicos, logs de dispositivos). El desafío es combinar todos los tipos de datos, para que respondan a preguntas relacionadas con una problemática del negocio.

4-  Veracidad: el mayor reto en proyectos de Big Data. El volumen de los datos puede generar que algunos de los registros lleguen incompletos o sean incorrectos, por diferencias en los formatos. Se requiere que los datos sean analizados y depurados, antes de ser utilizados, lo que implica una actividad permanente, ya que continuamente se generan nuevos datos, que requieren el mismo proceso de depuración. Las empresas deben asegurarse que los datos que estén recopilando tengan validez para el proyecto que están encarando.

5-  Valor: apuntamos a tratar de medir el valor que generan los datos, una vez convertidos en información para obtener una ventaja competitiva a partir de ellos.

El desafío en los proyectos de este tipo es combinar la información interna estructurada, de las bases de datos o planillas que soportan los datos relacionados con la operatoria de la empresa con información no estructurada del tipo audios, videos, imágenes, comentarios, textos, para capitalizarlos en una oportunidad de negocios.

¿Para qué puede usarse Big Data en el mundo real? (1)

-  Segmentación de clientes: vincular los datos de los CRMs con datos de navegación de clientes, intercambio de correos electrónicos, comentarios en redes sociales, datos de sensores, para predecir comportamientos de compra futuro, formas de conducir (para las aseguradoras) o campañas electorales. 

-  Optimización de procesos de negocios: gestionar stock a partir de predicciones combinadas de historial de búsquedas de clientes y predicciones meteorológicas; optimización de  cadena de suministro, utilizando historial de GPS para hojas de ruta, integrando datos de tráfico en tiempo real; gestión de recursos humanos. 

-  Optimización de rendimiento personal: Smart watches para detectar patrones de sueño, consumos de calorías. 

-  Mejoramiento de salud pública: ensayos clínicos, monitoreo de bebés en neo para predecir posibilidad de aparición de infecciones, detección de brotes de gripe (https://blog.google/technology/health/using-symptoms-search-trends-inform-covid-19-research), reconocimiento del habla ("Háblalo" de la empresa de Mateo Salvatto). 

-  Mejoramiento del rendimiento deportivo: registrar patrones y estilos de jugadores. Por ejemplo Slam Trackers para el tenis, sensores en pelotas, raquetas y palos sirven para hacer el seguimiento de deportistas de alto rendimiento. 

-  Mejoramiento de la ciencia y la investigación: el concepto de computación distribuida por debajo del procesamiento que está atrás del Big Data ayuda a la capacidad de procesamiento que requieren los proyectos de investigación científica.

-  Optimización el rendimiento de máquinas y dispositivos: autos equipados con asistencia de manejo, sensores, GPS, en camino de ser autos autónomos. Lo mismo para redes de energía, tratando de predecir la demanda. 

-  Mejoramiento en la aplicación de políticas de seguridad y de la ley: prevención de ataques terroristas a través del análisis de conversaciones de los usuarios. También de prevención de ciberataques, detecciones de operaciones fraudulentas con tarjetas de créditos. 

-  Optimización de ciudades: permiten organizar los flujos de tráfico, en tiempo real, integrando datos de infraestructura de transporte, para minimizar embotellamientos (uso de sensores, semáforos inteligentes). 

-  Operaciones en el mercado financiero: para evaluar tendencias en el mercado de capitales, integrando histórico de operaciones registradas en los sistemas de los agentes de bolsa, con declaraciones de funcionarios públicos, mensajes en redes sociales y publicaciones en foros especializados.

¿Qué involucra llevar adelante un proyecto de big data?

Siempre vamos a tener que construirlo como una mesa de tres patas, donde si falla una, se tambalea el resto del proyecto. 

1-  LEGAL. El tema legal es crítico, sobre todo si se usan fuentes de datos de terceros. Y el tema Big Data es un tema sensible, se debe garantizar el anonimato y la protección de los datos de los clientes punta a punta y por eso lo mejor es sumar asesoramiento legal desde el principio, antes de construir una plataforma que no se pueda utilizar. 

2-  NEGOCIO: ¿qué dolor viene a curar? ¿qué problema resuelve? ¿qué indicador tiene que mejorar? Fijar el objetivo y la forma de medirlo. Plantear la pregunta para la que estamos buscando la respuesta a través de los datos, según la estrategia de crecimiento definida por la empresa. 

3-  GESTIÓN: equipo de proyecto encargado de llevarlo adelante, para gestionar los datos y obtener respuestas en término de soluciones de negocio, donde necesariamente deben tener lugar para hablar los responsables de negocios, los especialistas en datos y los especialistas en tecnología. 

¿Por dónde empezar? 

En su libro "The Digital Transformation Playbook", el profesor David Rogers (2) plantea una herramienta para empezar a tratar los datos como activos estratégicos y explotarlos para aprovechar oportunidades de negocios a la que denomina "Generador de valor de datos". Esa herramienta consta de los siguientes pasos:

1-  Definir el área en la que se va a actuar para lograr impacto: una unidad de negocios, una línea, un producto, una sucursal. ¿Qué pretendemos, desde la estrategia de la empresa? Más likes, mejor alcance, engagement, reproducciones. Y determinar cuáles son los objetivos y cómo se van a medir. ¿Qué indicadores usar, para a partir de esos objetivos y esos indicadores determinar si se alcanza o no el resultado? 

2-  ¿Cómo crear valor desde los datos?  ¿Se está buscando personalizar la oferta, lograr visualización de la empresa, segmentar la demanda o darle un contexto y un sentido de pertenencia? ¿Cuál será la estrategia más relevante para esa área de negocio que estamos tratando de optimizar? Pueden ser uno o varios, pero siempre debe estar presente un alcance limitado. 

3-  Idear las formas en que los datos pueden ayudar a agregarle valor al negocio y/o a los consumidores. Tiene que habilitarnos a aplicar en forma concreta la estrategia de datos. Sin limitantes, pensar ideas para poner a trabajar los datos para el negocio.

4-  Auditar los datos y las ideas. Llegó el momento de unir los puntos: ¿qué datos tengo. ¿De qué fuente? ¿Son confiables, son compatibles? ¿Cómo los transformo si no son compatibles. ¿Cómo completo los baches? Siempre tengo que combinar datos internos con fuentes externas. Aprovechar los repositorios de datos abiertos públicos o privados. 

5-  Ejecutar el plan: ¿Dónde vuelco los datos? ¿Cómo pongo los datos a trabajar para la organización? ¿Qué necesito? ¿Tengo que cambiar procesos de negocios para que los datos se actualicen solos? Siempre se debe tener presente que no  puede ser más carga de trabajo. El problema técnico es el último paso. Se debe pensar apuntando a la estrategia que necesita la empresa, siempre sin limitaciones técnicas. ¿Cómo podemos usar los datos para entender las pasiones de nuestros clientes y mejorar la forma de llegar a ellos individualmente? Una vez resuelto este tema, pasamos a la solución técnica, donde tenemos un amplio abanico de soluciones, adaptables a todos los presupuestos, que no implican una inversión en equipamiento, sino el uso del procesamiento de granjas de servidores en empresas de tecnología.

Conclusión

Se debe tener presente la importancia de los datos en una organización de cualquier índole y la capitalización de los mismos en términos de oportunidades de negocios para aprovechar. Continuamente los clientes, proveedores y colaboradores con la empresa están dejando pistas sobre sus relaciones con la misma y esas pistas, en forma de datos están al alcance para ser aprovechados. 

La tecnología y las formas de acceder a la misma también evolucionaron para que este tipo de proyectos dejen de ser una utopía al alcance de unas pocas grandes empresas. Pero este tipo de proyectos no son sólo tecnología. 

Teniendo la estrategia como norte, se puede usar al procesamiento masivo de datos como aliado para llegar a los clientes con una oferta diferenciada. 

Como siempre, seguimos charlando en estudio@abrach.com.ar o en las redes.

Referencias:

(1) https://www.baoss.es/10-ejemplos-usos-reales-big-data/

(2) https://www.amazon.com/-/es/David-L-Rogers-ebook/dp/B01C3I2ESM/ref=sr_1_5?__mk_es_US