Calidad de imagen = calidad de datos: aplicaciones de análisis de vídeo e IA con garantía de futuro
Análisis de imágenes de vídeo: muchas posibilidades por delante
En principio, las cámaras sirven perfectamente como ‘sensores ópticos’ para la captación de datos de análisis: no existe mejor manera de extraer distintos tipos de datos de contextos complejos con relativamente poco esfuerzo que una imagen de vídeo.
Las posibilidades que ofrece el análisis de vídeo son múltiples: ‘análisis de multitudes’, para el conteo de personas u objetos; ‘búsqueda de apariencia’, para encontrar personas basándose en determinadas características; diversos sistemas de ‘detección de intrusión’, para la protección de ‘áreas estériles’, por ejemplo, en el ámbito de estadios, en el perímetro de infraestructuras críticas o en muchos otros. La mayoría de los sistemas trabajan en la actualidad con una clasificación de objetos basada en redes neuronales, en el lenguaje común frecuentemente equiparadas también con ‘Inteligencia Artificial’.
‘Quality In, Quality Out’: la calidad de imagen definible es decisiva
Pero con todo el entusiasmo, muy a menudo, se subestima una cosa: la importancia de la calidad de imagen. En muchos casos, se comete el error de considerar y evaluar únicamente el sistema de análisis y no la solución integral. Y así, están decepcionados muchos usuarios que ‘simplemente han puesto un par de cámaras’ y, después, se limitan a dejar ‘correr’ unos análisis sobre las imágenes obtenidas de esa manera.
Sin embargo, conforme a la vieja regla ‘Quality In, Quality Out’, la calidad de los resultados de análisis puede ser, naturalmente, sólo tan buena como la calidad de imagen y, por tanto, la calidad de los datos de entrada.
La calidad de imagen está definida como ‘píxel por metro (px/m)’ en la norma DIN EN 62676-4 y es el parámetro esencial para cada sistema de vídeo: en función de que se exija, por ejemplo, 62,5 px/m para una detección de objetos o personas basada en IA o 250 px/m si se quiere una admisibilidad casi cien por cien segura ante los tribunales, al garantizar la identificación de los rostros captados.
Una planificación correcta y tecnologías apropiadas
La clave del éxito, por consiguiente, es proporcionar, para una forma de análisis determinada como puede ser la diferenciación de personas y vehículos, el valor mínimo requerido en toda el área a captar, de manera fiable. Esto sólo es posible, si el fabricante dispone de las herramientas y sistemas de planificación adecuados así como el know-how y los expertos para llevar a cabo estas planificaciones.
Adicionalmente, son necesarias tecnologías de cámaras que estén diseñadas para que suministren estas resoluciones mínimas también en superficies grandes. Incluso las cámaras megapíxel de ultra alta resolución llegan, sobre todo en las zonas más alejadas de la imagen, a sus límites rápidamente o, dicho de otra manera, no son rentables en áreas grandes. Las cámaras PTZ, fundamentalmente, no son aptas para el análisis de contextos completos ya que sólo enfocan una parte determinada del área y sirven prioritariamente para la videoobservación activa.
Los sistemas modernos, los así llamados sistemas de sensores multifocales, en los que se combinan varios sensores de diferentes distancias focales en un único sistema, permiten una resolución mínima definible con exactitud en toda la superficie a captar, incluso en grandes contextos espaciales, y, por ello, representan en la mayoría de los casos también el enfoque más económico.