Aplicación de modelo XGB para predicción de calidad de aire, Bogotá -Colombia

Resumen

El monitoreo y el pronóstico de la calidad de aire es una tarea relevante para la adopción de sistemas de alerta de alerta temprana y medidas de control para reducir o evitar la exposición a aire contaminado y sus efectos en la salud. Metodología: se aplicó el modelo Extreme Gradient Boosting - XGB para la predicción de valores de material particulado PM2.5 y PM10 para la ciudad de Bogotá – Colombia. Se utilizó la información de las concentraciones de los contaminantes provenientes de la Red de Monitoreo de Calidad del Aire de Bogotá para 15 estaciones para el periodo comprendido entre el 1 de enero de 2021 y el 14 de junio de 2023; se realizó el análisis preliminar de los datos y descripción del comportamiento de los contaminantes, posteriormente, se aplicó y validó el modelo XGB. Resultados: se identificaron las concentraciones de valor medio diario para la ciudad de 16.5 $\mu g/m^3$ para PM2.5 y 32.9 $\mu g/m^3$ PM10, las mayores concentraciones se registran en el periodo entre 6:00 a.m. y 10:00 a.m.; en el mes de febrero y en el sur occidente de la ciudad. Se realizó el entrenamiento del modelo utilizando el 80$\%$ de los datos y la validación con 20$\%$ restante identificando que el modelo XGB predice de forma acertada y consistente los valores de las concentraciones de los contaminantes al ser comparado con los datos de prueba, se obtuvo un puntaje de entrenamiento de 0.72 y un error de raíz cuadrada media de 11.73 Conclusiones: el modelo XGB permite la predicción acertada y robusta de las concentraciones de PM2.5 y PM10 con lo cual se puede obtener información complementaria al sistema de pronóstico existente en la ciudad y contribuir al fortalecimiento de las acciones para garantizar la calidad de aire. 

PDF

Referencias

W. H. Organization, Air pollution, Online, 2023. dirección: https://www.who.int/health-topics/

air-pollution#tab=tab_1.

U. EPA, Particulate Matter (PM) Basics, Online, 2022. dirección: https://www.epa.gov/pm-pollution/

particulate-matter-pm-basics.

A. C. O’Regan y M. M. Nyhan, «Towards sustainable and net-zero cities: A review of environmental

modelling and monitoring tools for optimizing emissions reduction strategies for improved air quality in urban areas,» Environmental Research, vol. 231, pág. 116 242, ago. de 2023, issn: 0013-9351. doi:

1016/j.envres.2023.116242. dirección: http://dx.doi.org/10.1016/j.envres.2023.116242.

M. Mar´c, M. Tobiszewski, B. Zabiegała, M. d. l. Guardia y J. Namie´snik, «Current air quality analytics

and monitoring: A review,» Analytica Chimica Acta, vol. 853, págs. 116-126, ene. de 2015, issn: 0003-

doi: 10.1016/j.aca.2014.10.018. dirección: http://dx.doi.org/10.1016/j.aca.2014.10.

R. Guo, Q. Zhang, X. Yu, Y. Qi y B. Zhao, «A deep spatio-temporal learning network for continuous

citywide air quality forecast based on dense monitoring data,» Journal of Cleaner Production, vol. 414,

pág. 137 568, ago. de 2023, issn: 0959-6526. doi: 10 . 1016 / j . jclepro . 2023 . 137568. dirección:

http://dx.doi.org/10.1016/j.jclepro.2023.137568.

Y. Hu, X. Chen y H. Xia, «A hybrid prediction model of air quality for sparse station based on

spatio-temporal feature extraction,» Atmospheric Pollution Research, vol. 14, n.o 6, pág. 101 765, jun. de

, issn: 1309-1042. doi: 10.1016/j.apr.2023.101765. dirección: http://dx.doi.org/10.1016/

j.apr.2023.101765.

M. Kalhor y M. Bajoghli, «Comparison of AERMOD, ADMS and ISC3 for incomplete upper air meteorological data (case study: Steel plant),» Atmospheric Pollution Research, vol. 8, n.o 6, págs. 1203-1208,

nov. de 2017, issn: 1309-1042. doi: 10.1016/j.apr.2017.06.001. dirección: http://dx.doi.org/

1016/j.apr.2017.06.001.

X. Yang, Q. Wu, R. Zhao et al., «New method for evaluating winter air quality: PM2.5 assessment

using Community Multi-Scale Air Quality Modeling (CMAQ) in Xi’an,» Atmospheric Environment,

vol. 211, págs. 18-28, ago. de 2019, issn: 1352-2310. doi: 10 . 1016 / j . atmosenv . 2019 . 04 . 019.

dirección: http://dx.doi.org/10.1016/j.atmosenv.2019.04.019.

H.-M. Lee, R. J. Park, D. K. Henze et al., «http://www.w3.org/1998/Math/MathMattribution for Seoul in May from 2009 to 2013 using GEOS-Chem and its adjoint model,» Environmental Pollution, vol. 221, págs. 377-384, feb. de 2017, issn: 0269-7491. doi: 10.1016/j.envpol.2016.

088. dirección: http://dx.doi.org/10.1016/j.envpol.2016.11.088.

S. Liu, S. Hua, K. Wang et al., «Spatial-temporal variation characteristics of air pollution in Henan

of China: Localized emission inventory, WRF/Chem simulations and potential source contribution

analysis,» Science of The Total Environment, vol. 624, págs. 396-406, mayo de 2018, issn: 0048-9697.

doi: 10.1016/j.scitotenv.2017.12.102. dirección: http://dx.doi.org/10.1016/j.scitotenv.

12.102.

L. Johansson, A. Karppinen, M. Kurppa, A. Kousa, J. V. Niemi y J. Kukkonen, «An operational

urban air quality model ENFUSER, based on dispersion modelling and data assimilation,» Environmental Modelling amp; Software, vol. 156, pág. 105 460, oct. de 2022, issn: 1364-8152. doi: 10.1016/j.

envsoft.2022.105460. dirección: http://dx.doi.org/10.1016/j.envsoft.2022.105460.

L. Zhang, J. Lin, R. Qiu et al., «Trend analysis and forecast of PM2.5 in Fuzhou, China using the

ARIMA model,» Ecological Indicators, vol. 95, págs. 702-710, dic. de 2018, issn: 1470-160X. doi: 10.

/j.ecolind.2018.08.032. dirección: http://dx.doi.org/10.1016/j.ecolind.2018.08.032.

L. Zhang, J. Lin, R. Qiu et al., «Trend analysis and forecast of PM2.5 in Fuzhou, China using the

ARIMA model,» Ecological Indicators, vol. 95, págs. 702-710, dic. de 2018, issn: 1470-160X. doi: 10.

/j.ecolind.2018.08.032. dirección: http://dx.doi.org/10.1016/j.ecolind.2018.08.032.

K. Das, N. Das Chatterjee, D. Jana y R. K. Bhattacharya, «Application of land-use regression model

with regularization algorithm to assess PM2.5 and PM10 concentration and health risk in Kolkata

Metropolitan,» Urban Climate, vol. 49, pág. 101 473, mayo de 2023, issn: 2212-0955. doi: 10.1016/j.

uclim.2023.101473. dirección: http://dx.doi.org/10.1016/j.uclim.2023.101473.

B. Bera, S. Bhattacharjee, N. Sengupta y S. Saha, «PM2.5 concentration prediction during COVID19 lockdown over Kolkata metropolitan city, India using MLR and ANN models,» Environmental

Challenges, vol. 4, pág. 100 155, ago. de 2021, issn: 2667-0100. doi: 10.1016/j.envc.2021.100155.

dirección: http://dx.doi.org/10.1016/j.envc.2021.100155.

C.-C. Liu, T.-C. Lin, K.-Y. Yuan y P.-T. Chiueh, «Spatio-temporal prediction and factor identification

of urban air quality using support vector machine,» Urban Climate, vol. 41, pág. 101 055, ene. de 2022,

issn: 2212-0955. doi: 10.1016/j.uclim.2021.101055. dirección: http://dx.doi.org/10.1016/j.

uclim.2021.101055.

S. M. Cabaneros y B. Hughes, «Methods used for handling and quantifying model uncertainty of

artificial neural network models for air pollution forecasting,» Environmental Modelling amp; Software, vol. 158, pág. 105 529, dic. de 2022, issn: 1364-8152. doi: 10 . 1016 / j . envsoft . 2022 . 105529.

dirección: http://dx.doi.org/10.1016/j.envsoft.2022.105529.

B.-Y. Kim, Y.-K. Lim y J. W. Cha, «Short-term prediction of particulate matter (PM10 and PM2.5) in

Seoul, South Korea using tree-based machine learning algorithms,» Atmospheric Pollution Research,

vol. 13, n.o 10, pág. 101 547, oct. de 2022, issn: 1309-1042. doi: 10 . 1016 / j . apr . 2022 . 101547.

dirección: http://dx.doi.org/10.1016/j.apr.2022.101547.

T. Chen y C. Guestrin, «XGBoost: A Scalable Tree Boosting System,» en Proceedings of the 22nd ACM

SIGKDD International Conference on Knowledge Discovery and Data Mining, ép. KDD ’16, ACM, ago. de

doi: 10.1145/2939672.2939785. dirección: http://dx.doi.org/10.1145/2939672.2939785.

K. Gui, H. Che, Z. Zeng et al., «Construction of a virtual PM2.5 observation network in China based

on high-density surface meteorological observations using the Extreme Gradient Boosting model,»

Environment International, vol. 141, pág. 105 801, ago. de 2020, issn: 0160-4120. doi: 10 . 1016 / j .

envint.2020.105801. dirección: http://dx.doi.org/10.1016/j.envint.2020.105801.

T. Thongthammachart, S. Araki, H. Shimadera, T. Matsuo y A. Kondo, «Incorporating Light Gradient

Boosting Machine to land use regression model for estimating NO2 and PM2.5 levels in Kansai

region, Japan,» Environmental Modelling amp; Software, vol. 155, pág. 105 447, sep. de 2022, issn: 1364-

doi: 10.1016/j.envsoft.2022.105447. dirección: http://dx.doi.org/10.1016/j.envsoft.

105447.

P.-Y. Wong, C.-Y. Hsu, J.-Y. Wu et al., «Incorporating land-use regression into machine learning algorithms in estimating the spatial-temporal variation of carbon monoxide in Taiwan,» Environmental

Modelling amp; Software, vol. 139, pág. 104 996, mayo de 2021, issn: 1364-8152. doi: 10 . 1016 / j .

envsoft.2021.104996. dirección: http://dx.doi.org/10.1016/j.envsoft.2021.104996.

L. A. Rodríguez-Camargo, R. J. Sierra-Parada y L. C. Blanco-Becerra, «Análisis espacial de las concentraciones de PM2, 5 en Bogotá según los valores de las guías de la calidad del aire de la Organización Mundial de la Salud para enfermedades cardiopulmonares, 2014-2015,» Biomédica, vol. 40,

n.o 1, págs. 137-152, mar. de 2020, issn: 0120-4157. doi: 10.7705/biomedica.4719. dirección: http:

//dx.doi.org/10.7705/biomedica.4719.

S. D. de Ambiente, Resumen ejecutivo del informe anual de calidad de aire, Online, 2021. dirección: http:

//rmcab.ambientebogota.gov.co/Pagesfiles/2022IE193351%20resumen%20informe%20anual%

pdf.

S. D. de Ambiente, Sobre el Modelo de Pronóstico de Calidad de Aire de Bogotá, Online, 2023. dirección: https : / / sdsgissaludbog . maps . arcgis . com / apps / MapSeries / index . html ? appid =

a6ba64953d04fc592e9292b17c8bbdd.

P. A. García Ávila y N. Y. Rojas, «Análisis del origen de PM10 y PM2.5 en Bogotá gráficos polares,»

Revista Mutis, vol. 6, n.o 2, págs. 47-58, oct. de 2016, issn: 2256-1498. doi: 10.21789/22561498.1150.

dirección: http://dx.doi.org/10.21789/22561498.1150.

K. Das, N. Das Chatterjee, D. Jana y R. K. Bhattacharya, «Application of land-use regression model

with regularization algorithm to assess PM2.5 and PM10 concentration and health risk in Kolkata

Metropolitan,» Urban Climate, vol. 49, pág. 101 473, mayo de 2023, issn: 2212-0955. doi: 10.1016/j.

uclim.2023.101473. dirección: http://dx.doi.org/10.1016/j.uclim.2023.101473.

B. Bera, S. Bhattacharjee, N. Sengupta y S. Saha, «PM2.5 concentration prediction during COVID19 lockdown over Kolkata metropolitan city, India using MLR and ANN models,» Environmental

Challenges, vol. 4, pág. 100 155, ago. de 2021, issn: 2667-0100. doi: 10.1016/j.envc.2021.100155.

dirección: http://dx.doi.org/10.1016/j.envc.2021.100155.

C.-C. Liu, T.-C. Lin, K.-Y. Yuan y P.-T. Chiueh, «Spatio-temporal prediction and factor identification

of urban air quality using support vector machine,» Urban Climate, vol. 41, pág. 101 055, ene. de 2022,

issn: 2212-0955. doi: 10.1016/j.uclim.2021.101055. dirección: http://dx.doi.org/10.1016/j.

uclim.2021.101055.

S. M. Cabaneros y B. Hughes, «Methods used for handling and quantifying model uncertainty of

artificial neural network models for air pollution forecasting,» Environmental Modelling amp; Software, vol. 158, pág. 105 529, dic. de 2022, issn: 1364-8152. doi: 10 . 1016 / j . envsoft . 2022 . 105529.

dirección: http://dx.doi.org/10.1016/j.envsoft.2022.105529.

B.-Y. Kim, Y.-K. Lim y J. W. Cha, «Short-term prediction of particulate matter (PM10 and PM2.5) in

Seoul, South Korea using tree-based machine learning algorithms,» Atmospheric Pollution Research,

vol. 13, n.o 10, pág. 101 547, oct. de 2022, issn: 1309-1042. doi: 10 . 1016 / j . apr . 2022 . 101547.

dirección: http://dx.doi.org/10.1016/j.apr.2022.101547.

T. Chen y C. Guestrin, «XGBoost: A Scalable Tree Boosting System,» en Proceedings of the 22nd ACM

SIGKDD International Conference on Knowledge Discovery and Data Mining, ép. KDD ’16, ACM, ago. de

doi: 10.1145/2939672.2939785. dirección: http://dx.doi.org/10.1145/2939672.2939785.

K. Gui, H. Che, Z. Zeng et al., «Construction of a virtual PM2.5 observation network in China based

on high-density surface meteorological observations using the Extreme Gradient Boosting model,»

Environment International, vol. 141, pág. 105 801, ago. de 2020, issn: 0160-4120. doi: 10 . 1016 / j .

envint.2020.105801. dirección: http://dx.doi.org/10.1016/j.envint.2020.105801.

T. Thongthammachart, S. Araki, H. Shimadera, T. Matsuo y A. Kondo, «Incorporating Light Gradient

Boosting Machine to land use regression model for estimating NO2 and PM2.5 levels in Kansai

region, Japan,» Environmental Modelling amp; Software, vol. 155, pág. 105 447, sep. de 2022, issn: 1364-

doi: 10.1016/j.envsoft.2022.105447. dirección: http://dx.doi.org/10.1016/j.envsoft.

105447.

P.-Y. Wong, C.-Y. Hsu, J.-Y. Wu et al., «Incorporating land-use regression into machine learning algorithms in estimating the spatial-temporal variation of carbon monoxide in Taiwan,» Environmental

Modelling amp; Software, vol. 139, pág. 104 996, mayo de 2021, issn: 1364-8152. doi: 10 . 1016 / j .

envsoft.2021.104996. dirección: http://dx.doi.org/10.1016/j.envsoft.2021.104996.

L. A. Rodríguez-Camargo, R. J. Sierra-Parada y L. C. Blanco-Becerra, «Análisis espacial de las concentraciones de PM2, 5 en Bogotá según los valores de las guías de la calidad del aire de la Organización Mundial de la Salud para enfermedades cardiopulmonares, 2014-2015,» Biomédica, vol. 40,

n.o 1, págs. 137-152, mar. de 2020, issn: 0120-4157. doi: 10.7705/biomedica.4719. dirección: http:

//dx.doi.org/10.7705/biomedica.4719.

S. D. de Ambiente, Resumen ejecutivo del informe anual de calidad de aire, Online, 2021. dirección: http:

//rmcab.ambientebogota.gov.co/Pagesfiles/2022IE193351%20resumen%20informe%20anual%

pdf.

S. D. de Ambiente, Sobre el Modelo de Pronóstico de Calidad de Aire de Bogotá, Online, 2023. dirección: https : / / sdsgissaludbog . maps . arcgis . com / apps / MapSeries / index . html ? appid =

a6ba64953d04fc592e9292b17c8bbdd.

P. A. García Ávila y N. Y. Rojas, «Análisis del origen de PM10 y PM2.5 en Bogotá gráficos polares,»

Revista Mutis, vol. 6, n.o 2, págs. 47-58, oct. de 2016, issn: 2256-1498. doi: 10.21789/22561498.1150.

dirección: http://dx.doi.org/10.21789/22561498.1150.

R. Revelli y A. Porporato, «Ecohydrological model for the quantification of ecosystem services provided by urban street trees,» Urban Ecosystems, vol. 21, n.o 3, págs. 489-504, feb. de 2018, issn:

-1642. doi: 10.1007/s11252-018-0741-2. dirección: http://dx.doi.org/10.1007/s11252-

-0741-2.

R. de Monitoreo de Calidad de Aire de Bogotá - RMCAB, Informe mensual de calidad de aire de Bogotá

- febrero de 2022, Online, 2022. dirección: http : / / rmcab . ambientebogota . gov . co / Pagesfiles /

informe%20mensual%20febrero%202022.pdf.

M. de Ambiente y Desarrollo Sostenible, Resolución 2254 de 2017 Por la cual se adopta la norma de calidad

del aire ambiente y se dictan otras disposiciones, Online, 2017. dirección: https://www.alcaldiabogota.

gov.co/sisjur/normas/Norma1.jsp?i=82634.

C. R. Pastor, Técnicas de aprendizaje automático para el análisis de datos de calidad de aire, Online, 2017.

dirección: https : / / repositorio . uam . es / bitstream / handle / 10486 / 679327 / ruiz _ pastor _

carlos_tfg.pdf?sequence=1.

D. F. R. M. M. C. Castañeda Palencia J. Chavez Gonzalez, Pronóstico de las PM2.5 y PM10 que incluye

el impacto de las políticas de gestión ambiental en Bogotá, Online, 2022. dirección: https://repository.

javeriana.edu.co/bitstream/handle/10554/61509/attachment_1_213024- Casta%C3%B1edaChaves-Ram%C3%ADrez.pdf?sequence=1.