Simulación de procesos hidrológicos utilizando técnicas de machine learning y modelos hidrológicos
- Jimeno Sáez, Patricia
- David Pulido Velázquez Director
- Javier Senent-Aparicio Director
Defence university: Universidad Católica San Antonio de Murcia
Fecha de defensa: 17 July 2018
- Francisco de Asís Cabezas Calvo-Rubio Chair
- Francisco J. Alcalá Secretary
- Francisco Alonso Sarria Committee member
Type: Thesis
Abstract
Son muchas las razones por las que se necesita modelar el proceso lluvia-escorrentía, en concreto la modelación de los caudales. La razón principal son las limitaciones existentes en las técnicas de medición hidrológica, disponiéndose solamente de un rango limitado de mediciones o registros en el espacio y en el tiempo. Por ello, resulta importante disponer de medios que ayuden a extrapolar esas mediciones en el espacio y en el tiempo, particularmente en cuencas no aforadas, donde los datos no están disponibles, y en el futuro, donde las mediciones no son posibles, para evaluar el posible impacto del cambio hidrológico futuro. La estimación y evaluación de los caudales es esencial para la gestión sostenible de los recursos hídricos. Y encontrar modelos que realicen estimaciones de caudales lo más precisas posibles es fundamental a la hora tomar decisiones. Sin embargo, la estimación precisa de los caudales a escala de cuenca es compleja debido a la gran variabilidad espacial y temporal de las características de la cuenca y de los patrones climáticos, así como de una incompleta comprensión de los complejos procesos físicos subyacentes. La complejidad hidrológica de una cuenca queda claramente reflejada en las diferentes fases de la serie temporal de caudales. Siempre ha sido un gran reto para los modelos hidrológicos la representación adecuada de todas las fases del hidrograma de caudales con el mismo conjunto de parámetros del modelo. Otra problemática a tener en cuenta en la modelación de los caudales en zonas de alta montaña, es la correcta modelación de los procesos nivales y la estimación de los errores sistemáticos en la medición de la precipitación sólida. La modelación del fenómeno de acumulación-fusión de la nieve es esencial para desarrollar una explotación óptima de los embalses de cabecera, así como realizar la previsión de posibles avenidas motivadas por una rápida fusión de la nieve. Los modelos físicamente basados tienen la ventaja de considerar los procesos físicos de control, pero al mismo tiempo sus requisitos de datos también son altos. A menudo, incluso en cuencas hidrográficas intensamente monitorizadas, todos los datos requeridos no están disponibles. Por lo tanto, existe la necesidad de buscar métodos alternativos para la predicción de variables hidrológicas utilizando información fácilmente disponible. Los datos de precipitación y temperatura suelen ser más abundantes que los de caudal y su recopilación es más sencilla y tiene un menor coste. En la presente tesis se propuso el uso de SWAT, un modelo físicamente basado, y de las RNAs (Redes neuronales artificiales), una técnica de aprendizaje automático, para simular los valores de caudales diarios. La RNA utilizada solo considera las entradas de precipitación y temperatura para la obtención de los caudales diarios. Debido a que el flujo de agua en una cuenca está intrínsecamente sujeto a episodios extremos de flujos altos y bajos, la eficiencia de los modelos además fue analizada en los diferentes rangos del caudal, desde caudales muy altos a caudales muy bajos, utilizando las curvas de duración de caudales para este propósito. Los resultados indicaron que SWAT tuvo un mejor rendimiento en la estimación de valores de caudal muy bajos, mientras que las RNAs estimaron los valores muy altos de caudal con mayor precisión en los casos estudiados. Además, estos modelos fueron mejores cuando el clima era más húmedo. Por otro lado, con el propósito de mejorar la simulación de caudales en cuencas de alta montaña, donde la componente nival juega un papel importante, se desarrolló un modelo formado por un modelo distribuido de nieve acoplado al modelo agregado de Témez. En este modelo nival se utilizaron datos climáticos obtenidos con diferentes enfoques geoestadísticos para modelar los caudales. Los datos de precipitación fueron corregidos por dos factores correctores, y los resultados mostraron claramente la existencia del fenómeno de under-catch en la precipitación, y la necesidad de corregir los datos de precipitación para mejorar los resultados de las simulaciones. Corregir la precipitación fue la única manera de poder aproximar el caudal simulado al caudal histórico promedio anual y captar el pico del hidrograma debido al proceso de fusión de la nieve. Además de la importancia de conocer los caudales medios diarios, un dato fundamental para el dimensionamiento de infraestructuras en una cuenca hidrográfica es el valor máximo del caudal instantáneo (Qins). Por ello la importancia de estudiar y analizar diferentes técnicas que reduzcan las incertidumbres asociadas a la estimación de los Qins. En la presente tesis, se analiza el rendimiento de diferentes fórmulas empíricas y se comparan los resultados obtenidos en la estimación de los Qins a partir de los caudales medios diarios con los obtenidos con diferentes técnicas de machine learning, como son las RNAs y los sistemas adaptativos de inferencia neuro-difusa (ANFIS). Los métodos de aprendizaje automático fueron superiores a las fórmulas empíricas con los datos utilizados y en las cuencas caso de estudio. También se analizaron otras técnicas de machine learning como las máquinas de vector soporte (SVM) y las redes extreme learning machines (ELM). Y se exploró la posibilidad de acoplar un modelo SWAT con estas técnicas de aprendizaje automático para obtener la magnitud del Qins. Como resultado de esta evaluación, todas las técnicas de aprendizaje automático investigadas en este estudio se pueden usar en la predicción de Qins, aunque la técnica ELM se comportó ligeramente mejor que los otros métodos. Concluyendo que los resultados de este estudio pueden contribuir en las tareas de predicción de los Qins en áreas donde los datos a escalas de tiempo sub-diarias son escasos o no están disponibles, pudiendo así reducir las incertidumbres asociadas a estas estimaciones.