Publicación: Modelo de predicción multifuente para irradiancia solar mediante aprendizaje profundo, análisis de imagen y datos satelitales en Colombia
Autores
Resumen en español
Este trabajo desarrolla modelos de pronóstico intradiario de la irradiancia global horizontal (GHI) con un horizonte de 60 minutos (H=6, datos cada 10 minutos) para una estación terrestre en Bogotá. Se implementan dos rutas de modelado: una basada en variables tabulares, que incluye modelos MLP y arquitecturas secuenciales (LSTM, BiLSTM, CNN LSTM y un Transformer compacto), y una ruta satelital que emplea productos GOES ABI L2, específicamente DSRF y MCMIPF, adquiridos de forma automática mediante infraestructura en AWS. A partir de estas modalidades se proponen también modelos de fusión que integran información tabular con imágenes satelitales. Los modelos se evaluaron frente a un esquema de persistencia empleando RMSE, MAE, R2 y skill. La optimización de hiperparámetros se ejecutó con Optuna y almacenamiento JournalStorage, mientras que el rastreo de experimentos se realizó con MLflow para garantizar reproducibilidad. Los resultados muestran que los modelos tabulares ofrecen un desempeño notable y que los modelos satelitales puros presentan capacidades predictivas limitadas en ausencia de información local. La fusión multifuente, en particular la integración de MCMIPF con datos tabulares, logra el mejor desempeño global con reducciones de error superiores al 30 por ciento frente a la persistencia y una mayor estabilidad en condiciones de nubosidad variable.
Resumen en inglés
This thesis develops intraday forecasting models for global horizontal irradiance (GHI) with a 60 minute horizon (H=6, 10 minute resolution) at a ground station in Bogotá. Two modeling tracks are implemented: a tabular track that includes MLPs and sequential architectures (LSTM, BiLSTM, CNN LSTM, and a compact Transformer), and a satellite based track using GOES ABI L2 products, specifically DSRF and MCMIPF, automatically ingested through an AWS data pipeline. Multisource fusion models that integrate tabular predictors with satellite imagery are also proposed. Models are benchmarked against a persistence baseline using RMSE, MAE, R2, and skill. Hyperparameter optimization is performed with Optuna and JournalStorage, and experiment tracking is handled with MLflow to ensure reproducibility. Results show that tabular models achieve strong performance and that satellite only models are limited when local surface information is absent. Multisource fusion, particularly the combination of MCMIPF with tabular inputs, achieves the best overall performance with error reductions above 30 percent relative to persistence and improved stability under variable cloud conditions.
PDF
FLIP