IA37 - Almazaras

59 DIGITALIZACIÓN Fig. 1. Entrada a la aplicación de Predic. Fig 2. La elaboración de las predicciones se basa en el análisis de datos. Este trabajo se ha desarrollado sobre las provincias de Jaén, Granada y Córdoba en global, así como en cinco fincas particulares de cada una. La metodología desarrollada emplea algoritmos de Machine Learning junto a un exhaustivo análisis de variables predictoras. Los datos proceden de fuentes de libre acceso, como son las infraestructuras de datos espaciales de organismos estatales y herramientas como Google Earth Engine para acceso y procesado de datos espectrales. El resultado ha sido la predicción en el mes de febrero (una vez se disponían de los datos de cosecha de todos los municipios) de cantidad tanto de cosecha de aceitunas como de aceite de oliva, con un error absoluto promedio entorno al 22%. La metodología empleada consta de múltiples etapas, Fig.2, comenzando con la comprensión de los datos, seguida de su preparación, la creación de modelos y culminando con la validación e implementación de estos. El resultado final del modelo es la predicción de la cantidad de cosecha de aceituna, expresada en kilogramos, que se recogerá en cada campaña a nivel municipal. Esta variable es desconocida inicialmente, pero puede deducirse a partir de otras variables conocidas, variables predictoras, que guardan una relación directa o inversa con el objetivo. La correcta selección de estas variables predictoras y la calidad de las mismas resultan fundamentales. La principal variable predictora es el histórico de cosechas de años anteriores. Cuanto mayor sea ese histórico y más exactos sean los datos proporcionados mejor se podrá ajustar el modelo predictivo. A partir de aquí debemos buscar la correlación entre esos valores de cosecha y las circunstancias externas internas y externas que han podido influir. Para ello, el conocimiento del tipo de cultivo y un exhaustivo análisis de la influencia de las variables consideradas garantizan la obtención de un modelo predictivo de precisión. Por tanto, resulta esencial la disponibilidad de datos temporales de todas las variables consideradas. Sólo de este modo se puede realizar un correcto entrenamiento del modelo predictivo. En este trabajo se ha utilizado diferentes algoritmos de regresión con distintos parámetros analizando en cada caso el mejor ajuste de los modelos. Las distintas escalas consideradas, desde escala provincial, municipal hasta llegar a nivel de parcela, han hecho que se utilicen distintas tecnologías de captura de datos ambientales. En concreto, para las variables meteorológicas se han empleado desde los datos disponibles de estaciones de

RkJQdWJsaXNoZXIy Njg1MjYx