La Inteligencia Artificial al servicio del olivar para la predicción temprana de cosecha
M. Isabel Ramos, Juan José Cubillas y Francisco R. Feito, investigadores de la Universidad de Jaén
30/08/2024Cuando extendemos este concepto a la agricultura, las ventajas se hacen aún más evidentes. PREDIC I, Fig. 1 representa una iniciativa global e interdisciplinar que combina los últimos avances en teledetección e inteligencia artificial para beneficiar a la agricultura, especialmente al cultivo del olivo.
Este trabajo se ha desarrollado sobre las provincias de Jaén, Granada y Córdoba en global, así como en cinco fincas particulares de cada una. La metodología desarrollada emplea algoritmos de Machine Learning junto a un exhaustivo análisis de variables predictoras. Los datos proceden de fuentes de libre acceso, como son las infraestructuras de datos espaciales de organismos estatales y herramientas como Google Earth Engine para acceso y procesado de datos espectrales. El resultado ha sido la predicción en el mes de febrero (una vez se disponían de los datos de cosecha de todos los municipios) de cantidad tanto de cosecha de aceitunas como de aceite de oliva, con un error absoluto promedio entorno al 22%.
Fig 2. La elaboración de las predicciones se basa en el análisis de datos.
La correcta selección de estas variables predictoras y la calidad de las mismas resultan fundamentales. La principal variable predictora es el histórico de cosechas de años anteriores. Cuanto mayor sea ese histórico y más exactos sean los datos proporcionados mejor se podrá ajustar el modelo predictivo. A partir de aquí debemos buscar la correlación entre esos valores de cosecha y las circunstancias externas internas y externas que han podido influir. Para ello, el conocimiento del tipo de cultivo y un exhaustivo análisis de la influencia de las variables consideradas garantizan la obtención de un modelo predictivo de precisión. Por tanto, resulta esencial la disponibilidad de datos temporales de todas las variables consideradas. Sólo de este modo se puede realizar un correcto entrenamiento del modelo predictivo. En este trabajo se ha utilizado diferentes algoritmos de regresión con distintos parámetros analizando en cada caso el mejor ajuste de los modelos.
La correcta selección de estas variables predictoras y la calidad de las mismas resultan fundamentales. La principal variable predictora es el histórico de cosechas de años anteriores.
Técnica de validación cruzada k-fold para medir la eficacia del modelo
Ha sido necesario realizar una revisión exhaustiva y una limpieza de valores atípicos. Esto es fundamental para evitar introducir ruido en la predicción.
Tras seleccionar las variables y asegurarse de que toda la información es accesible y está normalizada, se crea el modelo. Para medir la eficacia de este en la predicción utilizamos la técnica de validación cruzada k-fold. Este método consiste en evaluar la capacidad de predicción del modelo aislando los datos de un año concreto y separándolos de los datos utilizados para el entrenamiento del modelo. En el contexto de esta investigación, se utiliza para validar la precisión de los modelos a la hora de predecir la producción de cosechas de un año concreto.
Este estudio abarca el periodo comprendido entre 2013 y 2024. En concreto, hemos construido un modelo predictivo utilizando datos que abarcan nueve años, seguido de una evaluación de su fiabilidad utilizando datos del décimo año. En el proceso de validación cruzada, se comprueba la predicción para cada año. Por lo tanto, se generan varios modelos, uno para cada año que debe comprobarse. El año que debe predecirse siempre se excluye de los datos de entrenamiento y se compara con los datos reales. y se compara con los datos reales.
Así se han probado diferentes algoritmos para realizar la predicción. Algunos han funcionado mejor que otros, sin embargo, como muestra el ejemplo de la figura, Fig.3 cada uno ajusta mejor según el municipio considerado.
Facilidad para implantar mejoras y compartir información, los grandes beneficios del proyecto
La implementación en la nube también facilita la integración de nuevas funciones y mejoras en el sistema sin necesidad de interrumpir el acceso del usuario. Por ejemplo, se pueden agregar módulos adicionales para análisis más detallados, como la predicción de plagas o enfermedades en los cultivos, basados en datos climáticos y de suelo. Además, la capacidad de almacenar grandes volúmenes de datos históricos y actuales permite realizar análisis más complejos y obtener predicciones más precisas, Fig.4.
Otro beneficio clave de la aplicación en la nube es la capacidad de compartir información y colaborar con otros agricultores, investigadores o instituciones agrícolas. Esto puede fomentar una comunidad de práctica donde se intercambian conocimientos y se adoptan mejores prácticas, contribuyendo al avance general del sector agrícola.
La recopilación de datos a gran escala puede ayudar a identificar tendencias y patrones a nivel regional o incluso nacional, proporcionando información valiosa para la formulación de políticas agrícolas y la planificación de recursos.
Esta aproximación integradora subraya el potencial de la tecnología moderna para transformar prácticas tradicionales y enfrentar desafíos contemporáneos en el sector agrícola.