45 BIG DATA capaces de adecuarnos a una demanda fluctuante. Nuestro equipo tiene la labor de hacer picking y validar la calidad de los lotes recibidos. Debido al volumen, no podemos analizar todos los lotes, por lo que tenemos ante nosotros dos retos. El primero es el de ser capaces de predecir la demanda. El segundo es identificar que lotes debemos de analizar y puede enfocarse de forma similar al problema de clasificación ya que es un incumbe el muestreo. Los problemas de predicción de demanda suelen enfocarse mediante algoritmos que la descomponen en cuatro señales: nivel, estacionalidad, tendencia y ruido. Cada uno de estos, a excepción del ruido, se puedemodelar mediante regresores. La estacionalidad puede verse afectada por ciclos semanales y mensuales. La tendencia tiene que ver con factores macroeconómicos como el PIB o el Paro y el ruido recoge aquellos factores que no podemos modelar. Para resolver este problema en concreto se utilizó una serie histórica de los últimos 5 años. Adicionalmente se detectó incremento de actividad relacionadas con campañas publicitarias cuyo efecto semodeló también junto al Paro como proxy de actividad económica. Optimización: Supongamos que trabajamos en el departamento de ventas de una empresa que comercializa un producto del tipo commodity (caracterizado por una poca diferenciación respecto a la competencia). Tenemos ante nosotros el reto de definir a qué precio queremos vender nuestro producto. Sabemos cuales son nuestros costes y el precio al que opera la competencia. Para resolver este tipo de problemas, lo más sencillo es aplicar modelos de elasticidad de la demanda al precio. En este caso, al tratarse de una commodity, nuestros clientes no responden directamente al precio sino al diferencial de este respecto al de la competencia. El primer paso es lanzar la curva de elasticidad de la demanda al precio. Para ello situamos nuestros precios por encima y por debajo del precio medio demercado y analizamos como aumenta o disminuyen las ventas. Una vez tenemos clara la forma de la curva que relaciona la venta en unidades con el diferencial de precio respecto a la competencia analizamos el margen que tenemos. Esta curva que relaciona el precio y presenta unmáximo de beneficio tiene forma cuadrática (u invertida ∩). Esto es lógico si pensamos que si vendemos por debajo de coste perdemos dinero y si lo hacemos a precio muy alto la venta es 0. Esta estrategia nos permite optimizar nuestra estrategia de precios. HERRAMIENTAS, LENGUAJES Y PLATAFORMAS En la actualidad ya no es necesario la inversión en grandes paquetes de software. Si hablamos de lenguajes de programación, el rey indiscutible es Python. Python está desbancando progresivamente a R (relegado al entorno académico) y aMathlab (coste licencias). Por su parte, SQL es el lenguaje clave para los procesos ETL. Un perfil que conozca esos dos lenguajes puedes cubrir un 95% de todas las necesidades analíticas. Dentro de las herramientas que permiten escalabilidad y ejecución en clúster, Data Bricks para Machine Learning y Snow Flake para Bases de Datos están tomando mucha inercia. Estas complementan a SAS, como herramienta multipropósito, y SQL Server, Oracle y Hana como motores de BBDD. Para la parte de BI (visualización) los grandes actores en este entorno como PowerBI, Qlik, Tableu y Microstrategy. “EMPECEMOS CAPTURANDO VALOR, NO NOS COMPLIQUEMOS HASTA HABERLO HECHO” El Big Data es un vector principal de la Transformación Digital. Implementar la función analítica dentro de una organización es complejo, requiere una gran visión y un análisis ROI honesto. Entre todas las prioridades, la primera debe ser asegurar que los datos clave están correctamente inventariados y documentados. En resumen: • Calidad y orden en los datos son factores de éxito en un proyecto analítico. • El mejor modelo es aquel que se usa y aporta un diferencial, aunque pequeño, de valor. • No todos los perfiles sirven para todo, un equipo analítico tiene que contar con perfiles especializados en negocio, ciencia de datos, arquitectura y desarrollo. • Sobre análisis de datos hay mucho escrito, a no ser que seas un líder o referente en la industria, es mejor centrar los esfuerzos en aplicar técnicas robustas y ampliamente probadas. n
RkJQdWJsaXNoZXIy Njg1MjYx