En el momento de introducción del dato es donde el poder está en las personas, condicionadas por sus intereses, necesidades y sentimientos y que puede ser impredecible.
La Teoría del Big–'Anti' Data
Llevamos escuchando ya varios años la importancia de la digitalización y el proceso de trasformación digital como si fuese la solución a todos nuestros problemas personales y profesionales y como si esto no se hubiese hecho muchos años antes, asumiendo que todo los entornos y lo establecido hasta hoy, fuese a funcionar con un 100% de fiabilidad, este planteamiento aunque posible, no deja de ser una 'presunción de inocencia' sobre la base de que todo lo que se construye está determinado por la imprevisibilidad intrínseca del ser humano.
Big-Data y transformación digital
Con el término Big Data nos referimos a la gestión de un gran volumen de datos obtenidos de distintas fuentes y dispositivos para su posterior tratamiento y análisis con la finalidad de provocar un estímulo o acción sobre una máquina o una persona.
Todos los que hemos trabajado en empresas tecnológicas e industriales sabemos la importancia de los automatismos y los sistemas de control por motivos de seguridad y de optimización de rendimientos de los distintos equipos y sistemas, para conseguir efectividad en los procesos que serán traducidos en menos consumos y ahorros económicos. Estos menores consumos también implican una menor contaminación, según el mix energético de cada país.
Actualmente se pueden diferenciar tres tipos de datos. Los datos estructurados suelen ser datos definidos (edad, nombre, año, país, etc.) almacenados en una estructura de campos o celdas con una cabecera conocida que permite su ordenación y filtrado. Este tipo de datos suponen aproximadamente un 10% de la información relevante. Por otro lado, los datos no estructurados son aquellos que no tienen una estructura definida y se presentan en formato de texto como, por ejemplo, el contenido de un correo electrónico, un documento pdf o en otros formatos como un audio o un video. Este tipo de datos supondría el 90% de la información relevante para una empresa o negocio aunque requieren de un tratamiento más exhaustivo para organizar y categorizar el contenido y poder obtener información. Por último, están los datos sensores cuya finalidad es la regulación y control de equipos y máquinas y como su nombre indica, son facilitados por sensores conectados a un sistema de comunicación que permite actuar sobre componentes o equipos, por ejemplo, de una instalación de climatización, donde se regulan parámetros como temperatura, humedad, ocupación, etc. y accionan válvulas y bombas de circulación para adaptar la producción de calor o frio a las necesidades del usuario.
La transformación digital depende de varios factores, por un lado es necesario que todo esté conectado a través de internet, no solo las máquinas, sino también las 'cosas' y por último las personas. De ahí que surjan constantemente nuevos términos y siglas como “IoT” (internet of things) para referirnos a la conexión de los aparatos cotidianos que interactúan diariamente con las personas. Por tanto, la interacción es otro factor que tiene que ocurrir para que toda esta trasformación digital sea una realidad. La información o elemento de comunicación entre todo lo conectado debe ser relevante y transparente.
En todo desarrollo de soluciones y aplicaciones existe una curva que se denomina primer exponencial donde se define el modelo, por ejemplo, en un coche autodirigido (sin conductor) ante una señal de obstáculo, el volante gira. El siguiente paso o segunda exponencial es 'afinar' este modelo para tener la capacidad de regulación y establecer acciones proporcionadas y encadenadas según un estímulo. En nuestro ejemplo del coche audodirigido sería poder circular por una carretera sin chocarse y respetando las normas de circulación.
Es precisamente en esta segunda exponencial donde se dan todos los beneficios de la transformación digital y donde se pueden correr los mayores riesgos. Nos centramos en la conectividad, la interacción y la información pero ¿que ocurre con el sistema que mantiene todo? o ¿qué ocurre con el dato, que es la unidad más pequeña de información y sobre la que desarrollan los distintos modelos de actuación y control?
El sistema
En todas las teorías de crecimiento y futuro tecnológico damos por sentado que el sistema que mantiene todo es estable y fiable. Este sistema esta soportado por energía y la energía no solo no es estable ya que la producción es discontinua, ya sea por la necesidades de aporte de suministro, por el propio recurso que es discontinuo, o por la capacidad de almacenamiento de energía que, a día de hoy, es limitada, sino que además la energía está gestionada por países y más concretamente por personas. Parece poco probable que el suministro de energía desaparezca pero si vemos los países que tiene capacidad de exportación no son precisamente países con una estabilidad político-económica y que además históricamente han estado sumergidos constantemente en guerras e intereses que han dado lugar a decisiones de conflicto como son Argelia, Libia, Nigeria, Arabia Saudita, Irak, Irán, Kazajstán, Rusia, Corea del Norte, Venezuela, Bolivia…
Por otro lado existen otros países como España con una dependencia energética del 75% (la media europea está en el 54%) que cualquier decisión que implique cortar el suministro energético supondría un caos tremendo, no solo en lo que respecta a temas de comunicación sino incluso a temas de seguridad y salud ya que se podrían originar muertes, por ejemplo, si se están varios días sin electricidad en aeropuertos, hospitales, etc.
Es, por tanto, muy importante no olvidar esta situación de reparto y control energético en la transformación digital ya que afectaría al sistema de comunicación e interconexión de datos.
El poder del dato
Como hemos explicado en los párrafos anteriores, existe un tremendo interés por conocer y clasificar los datos, sobre todo de las personas, para inicialmente conseguir un beneficio comercial que aunque a priori parece algo liviano, puede tener un alcance tremendo, justo hasta el punto que entre la imprevisibilidad del ser humano.
Por ejemplo, los 'Smart watches' que son capaces de registrar pulsaciones del corazón, el deporte que practicas o incluso los trayectos que hacemos durante el día pueden ser utilizados para establecer la prima de un seguro médico o de vida. Las 'Smart cities' basadas teóricamente en un desarrollo urbano sostenible para responder de forma eficiente a través de la energía y la comunicación, a las necesidades de las personas en distintos aspectos como los edificios, la movilidad, etc. dará también a conocer comportamientos y pautas de actuar de las personas para otros fines.
Por otro lado, hemos visto como el poder sobre el control del dato puede influir por ejemplo en una elecciones generales cambiado el rumbo de un país de ahí que la custodia y gestión de este dato sea muy valiosa.
En definitiva, el hecho de estar conectados constantemente e interactuando con todos los sistemas nos hace ser predecibles y controlables lo que a su vez nos hace perder cierta capacidad de creatividad y de ser únicos, ya que al final estamos controlados por la estandarización que aunque es importante en proceso industriales o empresariales, la estandarización de las personas supone un riesgo en si mismo para la humanidad.
El apelativo 'Smart' en cualquier aparato, lejos de ser sinónimo de 'comodidad' puede ser sinónimo de 'Silly'(tonto) cuando nos referimos a la interacción con personas.
Las personas nos movemos principalmente por sentimientos, tanto para bien como para mal y los sentimientos no son tan fáciles de analizar o catalogar.
Últimamente observamos cómo se manipula la información en distintos medios para provocar una acción en las personas, no solo a través de los medios de comunicación habituales (TV, radio, periódicos) sino también a través de las redes sociales, mailings y distintas webs informativas.
Vemos como cada vez más, existe un interés muy alto no solo para las empresas, sino para partidos políticos u otros focos de interés. Esta manipulación del dato puede estar influenciada en la cadena de comunicación justo antes de su entrega a la sociedad pero, ¿por qué fallan tantas veces los pronósticos de intención de voto?.
Por un lado es evidente que la muestra de análisis considerada no es lo suficientemente grande ni dispersa como para predecir el futuro, aparte de poder estar intencionadamente manipulada para provocar una reacción en un determinado sentido, pero por otro lado falla también porque a la hora de votar, el ser humano está condicionado por otro factores, entre los que se encuentran los sentimientos que hacen que en ese mismo momento se decante por otra decisión.
El control de la imprevisibilidad humana sería justo la segunda exponencial para predecir y provocar una actuación totalmente regulada.
Big Anti-Data
Es importante analizar la entrada de datos en el sistema, por ejemplo, al darnos de alta en alguna aplicación o servicio. Esta claro que se dispone de una estructura de datos para obtener la información lo más objetiva y veraz posible pero ¿qué ocurre si los datos que introducimos no son verdad? En este caso estaríamos contaminado el sistema y por lo tanto afectando a que los resultados después del análisis no sean coherentes ni válidos. Entendiendo la mentira como una afirmación consciente de algo que no es verdad, lleva implícito el deseo de conseguir algo para si mismo y provocar una acción en otra persona. Imaginemos que nos estamos dando de alta en una web de un seguro médico donde la cuota mensual esté muy condicionada por el valor numérico que pongamos en la casilla de edad. Si introducimos un valor no real o “anti-data” estamos, por un lado falsificando a las estadísticas del sistema ya que se sacarían conclusiones de franjas de edades que no son reales y en caso de que se pudiese justificar con algún documento identificativo falso podríamos conseguir una menor cuota, con lo que afectaría a su modelo de negocio.
Justo en este momento de introducción del dato es donde el poder está en las personas, condicionadas por sus intereses, necesidades y sentimientos y que puede ser impredecible. La contaminación del dato, al por mayor, puede llevar a la quiebra a muchas empresas que pueden desarrollar soluciones pensando que van a ser compradas y luego no tiene ninguna repercusión en las ventas y su cuenta de resultados reflejaría unas perdidas tan importantes como para hacer quebrar la empresa. Sabiendo esta repercusión se pueden desarrollar incoativas conspiratorias que pueden cambiar la trayectoria de una empresa, de un país o incluso del mundo.
En definitiva, en toda esta transformación digital no nos podemos olvidar de dos aspectos muy importantes como son, el sistema en el que está soportado las nuevas tecnologías que necesitan energía y la calidad del dato en la trasformación digital que influye en la contaminación del sistema, siendo ambos, parámetros muy influenciados por la propia naturaleza de imprevisibilidad del ser humano.
"La información o elemento de comunicación entre todo lo conectado debe ser relevante y transparente"
"El control de la imprevisibilidad humana sería la segunda exponencial para predecir y provocar una actuación totalmente regulada"
"En esta transformación digital no podemos olvidar dos aspectos muy importantes: el sistema en el que está soportado las nuevas tecnologías que necesitan energía y la calidad del dato en la trasformación digital, que influye en la contaminación del sistema"