TECNOLOGÍA DIGITAL 42 superior serán considerados como anomalías. Por último, el estado de una variable se representará como un porcentaje de la capacidad a la que trabaja una variable en relación con el límite superior conocido. Pruebas y resultados Se ha realizado una disección de tiempos. Para facilitar las operaciones de cálculo de los tiempos, el flujo de datos se ha separado en 2 bloques: • Bloque 1: Datos capturados a través de OPC y NiFi y ponerlos en una cola de Kafka. • Bloque 2: Procesamiento de datos con Spark, almacenamiento en InfluxDB y visualización en Grafana. En la figura 7 se muestran los tiempos de ejecución de las etapas de cada bloque. Estos tiempos de ejecución se han calculado obteniendo un lote de las variables descritas en la sección 2 y son el resultado medio de varias iteraciones. Los resultados muestran que ambos bloques del flujo de datos tardan una cantidad de tiempo similar de tiempo, 3,3 segundos para el bloque 1 y 2,8 para el bloque 2. Como prueba complementaria, se ha calculado el tiempo que tarda el IQR en calcular los límites mediante el uso de conjuntos de datos de diferentes tamaños. Para ello, se han creado versiones recortadas del conjunto de datos descrito en la sección 4. Cabe destacar que este proceso solo hay que hacerlo al arrancar el procesamiento. Los resultados de esta segunda prueba se muestran en la figura 8. Se puede observar que, aunque tarda 100 ms en obtener 1 variable, este tiempo se incrementa exponencialmente con el número de variables por lote. En concreto, con un número de 20 variables o superior, se tarda entre 3 y 5 segundos en obtener un lote. De esta prueba, se concluye que el cuello de botella del bloque 1 es la obtención de datos de la máquina. Además, se ha calculado que PySpark Streaming tarda alrededor de 2,74 segundos en procesar un lote de 22 variables y almacenarlo en InfluxDB. Por su parte, Grafana tarda en torno a 100 ms en hacer una consulta a InfluxDB. En consecuencia, el cuello de botella del bloque 2 es el procesamiento de PySpark. Finalmente, el último experimento que se ha realizado es analizar cuanta memoria RAM consume cada elemento de la arquitectura. Figura 7. Disección de tiempos. Figura 8. Tiempo transcurrido en calcular IQR y límites. El gemelo digital (digital twin) ofrece soluciones para monitorizar máquinas industriales y detectar posibles fallos de fabricación en tiempo real
RkJQdWJsaXNoZXIy Njg1MjYx