Regresión lineal multivariable versus regresión simbólica a partir de programación genética. Aplicación a la caracterización espectroscópica de aguas residuales urbanas

  1. Carreres-Prieto, Daniel 1
  2. García, Juan T. 1
  3. Castillo, Luis G. 1
  4. Carrillo, José M. 1
  5. Vigueras-Rodriguez, Antonio 1
  1. 1 Universidad Politécnica de Cartagena
    info

    Universidad Politécnica de Cartagena

    Cartagena, España

    ROR https://ror.org/02k5kx966

Revista:
Ingeniería del agua

ISSN: 1134-2196

Año de publicación: 2022

Volumen: 26

Número: 4

Páginas: 261-277

Tipo: Artículo

DOI: 10.4995/IA.2022.18073 DIALNET GOOGLE SCHOLAR lock_openAcceso abierto editor

Otras publicaciones en: Ingeniería del agua

Resumen

Caracterizar en tiempo real las aguas residuales urbanas es clave para poder garantizar una correcta gestión de los recursos hídricos y la protección del medioambiente. A partir de mediciones indirectas, como la espectroscopía molecular que proporciona información sobre las propiedades físico-químicas del agua, es posible determinar la carga contaminante de las aguas residuales empleando modelos matemáticos de correlación. El presente trabajo compara la regresión lineal multivariable y los modelos de regresión simbólica basados en programación genética, para establecer una correlación con la carga contaminante de las aguas residuales. El estudio se ha centrado en la comparativa de modelos para la caracterización de nitrógeno total, fósforo total y nitrógeno en forma de nitrato, considerando 90 muestras de aguas residuales urbanas. Se observa que la regresión simbólica basada en programación genética proporciona una mejora en el ajuste (R2) de entre el 72.76% y 146.39% respecto a la regresión lineal multivariable.

Información de financiación

Financiadores

Referencias bibliográficas

  • APHA–AWWA–WPCF, Standard Methods for the Examination of Water and Wastewater, twentieth edition, Washington, DC, 1998
  • Brunton, S.L., Proctor, J.L., Kutz, J.N. 2016. Discovering governing equations from data by sparse identification of nonlinear dynamical systems. Proceedings of the national academy of sciences, 113(15), 3932-3937. https://doi.org/10.1073/pnas.1517384113
  • Carreres-Prieto, D., García, J.T., Cerdán-Cartagena, F., Suardiaz-Muro, J. 2019. Spectroscopy transmittance by LED calibration. Sensors, 19(13), 2951. https://doi.org/10.3390/s19132951
  • Carreres-Prieto, D., García, J.T., Cerdán-Cartagena, F., Suardiaz-Muro, J. 2020. Wastewater quality estimation through spectrophotometry-based statistical models. Sensors, 20(19), 5631. https://doi.org/10.3390/s20195631
  • Carreres-Prieto, D. 2021. Contribución al campo del IOT mediante el desarrollo de sensores inteligentes basados en espectrofotometría de longitud de onda variable. Aplicación a la monitorización en continuo de la carga contaminante en aguas residuales urbanas. Tesis Doctoral. Universidad Politécnica de Cartagena.
  • Carreres-Prieto, D., García, J.T., Cerdán-Cartagena, F., Suardiaz-Muro, J., Lardín, C. 2022. Implementing Early Warning Systems in WWTP. An investigation with cost-effective LED-VIS spectroscopy-based genetic algorithms. Chemosphere, 293, 133610. https://doi.org/10.1016/j.chemosphere.2022.133610
  • Leardi, R., Boggia, R., Terrile, M. 1992. Genetic algorithms as a strategy for feature selection. Journal of chemometrics, 6(5), 267-281. https://doi.org/10.1002/cem.1180060506
  • Lepot, M., Torres, A., Hofer, T., Caradot, N., Gruber, G., Aubin, J.B., Bertrand-Krajewski, J.L. 2016 Calibration of UV/Vis spectrophotometers: a review and comparison of different methods to estimate TSS and total and dissolved COD concentrations in sewers, WWTPs and rivers. Water Research, 101, 519-534. https://doi.org/10.1016/j.watres.2016.05.070
  • Mesquita, D.P., Quintelas, C., Amaral, A.L., Ferreira, E.C. 2017. Monitoring biological wastewater treatment processes: recent advances in spectroscopy applications. Reviews in Environmental Science and Bio/Technology, 16(3), 395-424. https://doi.org/10.1007/s11157-017-9439-9
  • Niazi, A., Leardi, R. 2012. Genetic algorithms in chemometrics. Journal of Chemometrics, 26(6), 345-351. https://doi.org/10.1002/cem.2426
  • Otto, M. 2016. Chemometrics: statistics and computer application in analytical chemistry. John Wiley & Sons. https://doi.org/10.1002/9783527699377
  • Quade, M., Abel, M., Nathan Kutz, J., Brunton, S.L. 2018. Sparse identification of nonlinear dynamics for rapid model recovery. Chaos: An Interdisciplinary Journal of Nonlinear Science, 28(6), 063116. https://doi.org/10.1063/1.5027470
  • Searson, D.P., Leahy, D.E., Willis, M.J. 2010. GPTIPS: an open source genetic programming toolbox for multigene symbolic regression. Proceedings of the International multiconference of engineers and computer scientists, 1, 77-80. Citeseer.
  • TuringBot, S. 2020. Symbolic Regression Software. URL: https://turingbotsoftware.com.
  • Udrescu, S.M., Tegmark, M. 2020. AI Feynman: A physics-inspired method for symbolic regression. Science Advances, 6(16), eaay2631. https://doi.org/10.1126/sciadv.aay2631
  • Wagner, S., Kronberger, G., Beham, A., Kommenda, M., Scheibenpflug, A., Pitzer, E., Affenzeller, M. 2014. Architecture and design of the HeuristicLab optimization environment. Advanced methods and applications in computational intelligence, 197-261. Springer, Heidelberg. https://doi.org/10.1007/978-3-319-01436-4_10
  • Zelinka, I., Oplatkova, Z., Nolle, L. (2005). Analytic programming–Symbolic regression by means of arbitrary evolutionary algorithms. International Journal of Simulation: Systems, Science and Technology, 6(9), 44-56.