AGRICULTURA DIGITAL 67 aluminio, sobre una cama elevada del invernadero automático del campus de La Yutera (Palencia). La estructura permite el movimiento controlado en toda la cama, lo que permite una mejor captura de las imágenes para el entrenamiento de la CNN. La estructura soporta el sistema de visión y el sistema de iluminación, Figura 1. El sistema de visión se compone de una cámara réflex Canon 850D con filtro polarizador circular PL-C 58mm. El sistema de iluminación se construyó con dos lámparas de luz blanca tipo LED de 6000 K, con filtro polarizador de transmisión: 38 % (1,5 f/stop) para evitar los brillos sobre las hojas de las plantas. Las imágenes se tomaron en espacio de color RGB con resolución de 6000x4000 píxeles por 35 días, distribuidos desde el momento de la emergencia de la planta (día 12) hasta el final de la etapa fenológica del desarrollo vegetativo (día 60) obteniendo un total de 1640 imágenes. Antes de proceder con el etiquetado de las imágenes, se realizó una selección previa de las más adecuadas para el entrenamiento. Se descartaron aquellas imágenes que presentaban desenfoque o en las cuales las plantas eran tan grandes que salían fuera de la escena. Como resultado de este proceso de selección, se eliminaron un total de 240 imágenes, dejando un conjunto final de 1400 imágenes. Para llevar a cabo el etiquetado de las imágenes, se empleó la herramienta de código abierto LabelImg. Se definieron 5 clases de etiquetas, abreviando los nombres de las especies para facilitar su gestión: “maíz“ para las plantas de maíz, ”mh1“ para Lolium perenne, ”mh2“ para Sonchus oleraceus, ”mh3“ para Saolanun nigrum y ”mh4” para Poa annua. En total, se generaron 4200 etiquetas de cuadros delimitadores para el maíz y 10322 etiquetas para las malas hierbas. Para el proceso de entrenamiento, se dividió aleatoriamente el conjunto de 1400 imágenes en tres partes: el 70% (980 imágenes) para el entrenamiento, el 25% (350 imágenes) para la validación y el 5% (110 imágenes) para el conjunto de pruebas. SELECCIÓN Y CONFIGURACIÓN DE LA CNN Se utilizó la arquitectura CNN Yolov5s v7.0 desarrollado por Ultralytics. Es un algoritmo de detección de objetos en imágenes en tiempo real de código abierto, que destaca por su velocidad y eficiencia al realizar la detección y clasificación en una sola pasada a través de la red neuronal. Los hiperparámetros configurados para el entrenamiento de la CNN fueron los siguientes: se utilizaron 300 épocas (epochs) para el entrenamiento, este valor fue seleccionado en base a entrenamientos previos. El tamaño del lote (batch_size) se estableció en 32, siendo un valor que permite reducir el sobreajuste del modelo en las etapas iniciales. En cuanto al tamaño de la imagen, los modelos Yolov5 reducen uniformemente las imágenes de entrada a 640x640 píxeles. La tasa de aprendizaje inicial (lr0) y final (lrf) se establecieron en 0.01, el parámetro weight decay en 0.0005 y el Momentum en 0.937; los demás hiperparámetros utilizados han sido los definidos por el modelo por defecto. ENTRENAMIENTO DE LA CNN YOLOV5S V7.0 Para el entrenamiento y validación del modelo se empleó la configuración de hardware detallada en la tabla 1. EVALUACIÓN DEL RENDIMIENTO DE LA CNN YOLOV5S V7.0 PARA LA DETECCIÓN DE MALAS HIERBAS EN EL CULTIVO DE MAÍZ Como primera métrica de evaluación se analiza la matriz de confusión, Figura 2, la cual muestra el número de predicciones correctas e incorrectas para cada clase en comparación con las etiquetas verdaderas. En la Figura 2 observamos que la CNN Yolov5s v7.0 obtuvo un rendimiento excepcional en la detección y clasificación tanto del maíz como de las malas hierbas, logrando una predicción para el maíz del 97%, para las malas hierbas específicamente se obtuvo un 90% para la mh2 (Sonchus Oleraceus), para la mh1 ( Lolium Perenne) un 86%, la mh3 ( Saolanun Nigrum) un 78% y la mh4 ( Poa Annua) un 74%. Es relevante destacar que la CNN Yolov5s v7.0 presenta confusiones entre las malas hierbas, especialmente entre la mh2 ( Sonchus Oleraceus) y la mh3 ( Saolanun Nigrum), en un 11%, debido a que, en las primeras etapas de desarrollo de las malas hierbas, las hojas de estas especies suelen tener formas similares de hojas anchas; igualmente sucede entre la mh1 ( Lolium Perenne) y la mh4 ( Poa Annua), donde se suele confundir en un 7%, aunque en este caso sus hojas son estrechas. Tabla 1. Configuración utilizada para el entrenamiento del modelo. ELEMENTO DEL SISTEMA DESCRIPCIÓN Procesador Procesador: Core(TM) i7-12650H 12th Gen Intel(R) 2.70 GHz GPU NVIDIA GeForce RTX 3050 4096MiB Memoria RAM 16 GB Sistema Operativo Windows 11 Enterprise Entorno acelerado CUDA 11.7 Jupyter Notebook Versión 6.5.4 Python 3.8.16 Entorno de desarrollo PyTorch 2.0.0 - Torchvision 0.15.0 – Torchaudio 2.0.
RkJQdWJsaXNoZXIy Njg1MjYx