60 DIGITALIZACIÓN la Red de Información Ambiental de Andalucía (REDIAM) hasta valores obtenidos a partir de imágenes de satélite y sensores montados sobre dron. Esta integración multisensorial y multiescala ha requerido la participación conjunta de profesionales del ámbito de la Ingeniería Geomática y de la Informática de la Universidad de Jaén (más información en http:// intellfoo.uja.es/) TÉCNICA DE VALIDACIÓN CRUZADA K-FOLD PARA MEDIR LA EFICACIA DEL MODELO Los resultados obtenidos dependen en gran medida de la calidad del conjunto de datos. En este caso, como los datos proceden de distintas fuentes, ha sido necesario realizar una revisión exhaustiva y una limpieza de valores atípicos. Esto es fundamental para evitar introducir ruido en la predicción y poder discernir las variables más influyentes Fig 3. Los algoritmos se prueban para ver cuál funciona mejor a la horaa de hacer la predicción. de las variables que menos influyen en la predicción. También hay que tener en cuenta que un mismo conjunto de datos puede utilizarse para predecir diferentes objetivos y, en este caso, el peso que cada predictor tiene en el modelo es diferente. Tras seleccionar las variables y asegurarse de que toda la información es accesible y está normalizada, se crea el modelo. Para medir la eficacia de este en la predicción utilizamos la técnica de validación cruzada k-fold. Este método consiste en evaluar la capacidad de predicción del modelo aislando los datos de un año concreto y separándolos de los datos utilizados para el entrenamiento del modelo. En el contexto de esta investigación, se utiliza para validar la precisión de los modelos a la hora de predecir la producción de cosechas de un año concreto. Este estudio abarca el periodo comprendido entre 2013 y 2024. En concreto, hemos construido un modelo predictivo utilizando datos que abarcan nueve años, seguido de una evaluación de su fiabilidad utilizando datos del décimo año. En el proceso de validación cruzada, se comprueba la predicción para cada año. Por lo tanto, se generan varios modelos, uno para cada año que debe comprobarse. El año que debe predecirse siempre se excluye de los datos de entrenamiento y se compara con los datos reales. y se compara con los datos reales. Así se han probado diferentes algoritmos para realizar la predicción. Algunos han funcionado mejor que otros, sin embargo, como muestra el ejemplo de la figura, Fig.3 cada uno ajusta mejor según el municipio considerado. La correcta selección de estas variables predictoras y la calidad de las mismas resultan fundamentales. La principal variable predictora es el histórico de cosechas de años anteriores
RkJQdWJsaXNoZXIy Njg1MjYx