https://repositorio.ufba.br/handle/ri/41672
Tipo: | Tese |
Título: | Predição da ocorrência de fármacos em efluente de ETE por classificadores boosting |
Título(s) alternativo(s): | Prediction of Pharmaceutical Occurrence in WWTP Effluent Using Boosting Classifiers |
Autor(es): | Bijos, Júlia Carolina Braz de Freitas |
Primeiro Orientador: | Oliveira-Esquerre, Karla Patrícia |
Segundo Orientador: | Queiroz, Luciano Matos |
metadata.dc.contributor.referee1: | Oliveira-Esquerre, Karla Patrícia |
metadata.dc.contributor.referee2: | Queiroz, Luciano Matos |
metadata.dc.contributor.referee3: | Carvalho, Ana Isabel |
metadata.dc.contributor.referee4: | Amorim, Ariuska Karla Barbosa |
metadata.dc.contributor.referee5: | Droguett, Enrique Andres López |
Resumo: | Estações de Tratamento de Esgoto compreendem uma das rotas de emissão de concentrações de fármacos em água superficial, o que pode ofertar riscos a espécies aquáticas e a saúde humana. A partir de dados da quantidade de medicamentos comercializada, é possível estimar as concentrações de fármacos que atingem os cursos d’água após o tratamento realizado pelas estações. Nesse sentido, os métodos de aprendizado de máquina apresentam capacidade de aprendizado e, por isso, podem ser uma ferramenta relevante para a proposição de uma nova abordagem de modelos confiáveis e robustos para a predição da ocorrência de fármacos. Esta pesquisa teve por objetivo geral propor um mecanismo de modelagem de classificação capaz de predizer o nível das concentrações de alguns fármacos nos efluentes de estações de tratamento de esgoto. Para tal, foram utilizados dados de comercialização de fármacos para os municípios brasileiros referentes ao período de 2014 a 2020, registros de população e vazão afluente de esgotos municipais e, registros de concentrações de ocorrência de antibióticos, anti-inflamatórios e drogas psiquiátricas em estações de tratamento. O software RStudio foi utilizado para a manipulação dos dados de comercialização de fármaco e obtenção da massa anual comercializada, que foi utilizada posteriormente, para o cálculo da concentração afluente (ng. L-1) de fármacos para tratamento. Três métodos de classificação Boosting foram implementados na linguagem Python, executados para três níveis de rotulação: 100 ng. L-1, 500 ng. L-1 e 1000 ng. L-1, a fim de predizer a classe da concentração de saída dos fármacos para Carbamazepina e para antibióticos selecionados. Em ambas as abordagens, o modelo XGBoost atingiu o maior desempenho em todos os níveis. Para a abordagem de Carbamazepina os modelos XGBoost atingiram F1-score de 63%, 91% e 90%. Para a abordagem com antibióticos o modelo XGBoost obteve F1-score de 99%, 90% e 85% para os limites 1000 ng. L-1, 500 ng. L-1 e 100 ng. L-1, respectivamente. Para ambas as abordagens foi possível obter modelos de desempenho satisfatório. No entanto, o limite de corte de 1000 ng. L-1 demonstrou ser o mais desafiador, dado que gerou amostras de teste com classes altamente desbalanceadas, enquanto os limites de corte de 500 ng. L-1 e 100 ng. L-1 possibilitaram a construção de modelos mais viáveis. Os ajustes construídos revelaram que o uso dos classificadores Boosting apresenta potencial como alternativa de complementação ao monitoramento e controle de fármacos no esgoto sanitário. Ademais, a utilização de dados de acesso livre disponibilizados pela ANVISA pode fornecer uma reflexão dos potenciais e das limitações para futuros estudos, visto que até o momento ainda não houve uma ampla exploração desses dados em pesquisas. Adicionalmente, a base de dados de ocorrência de fármacos em ETE, construída para esta pesquisa, poderá compor as atividades investigativas de outros pesquisadores, a partir da agregação de novos dados, verificação de outras técnicas de modelagem ou realização de outros tipos de análises. |
Abstract: | Wastewater Treatment Plants are a significant pathway for the emission of pharmaceutical concentrations into surface water, which can pose risks to aquatic species and human health. Using data on the quantity of medicines sold, it is possible to estimate the concentrations of pharmaceuticals that reach the surface waters after the treatment carried out in the treatment plants. In this sense, machine learning methods show learning capacity and, therefore, can be a relevant tool for proposing a new approach to reliable and robust models for predicting the occurrence of medicines. The research proposed a classification modeling mechanism capable of predicting the concentration level of some pharmaceuticals in effluents from wastewater treatment plants. To this end, drug sales data were used for Brazilian municipalities from 2014 to 2020, population and influent flow of municipal wastewater treatment plants, and data of occurrence concentrations of antibiotics, anti-inflammatories, and psychiatric drugs in treatment plants. RStudio software was used to manipulate drug sales data and obtain the annual mass sold, which was later used to calculate the influent concentration (ng. L-1) of drugs for treatment. Three Boosting classification methods were implemented in the Python language, running for three levels: 100 ng. L-1, 500 ng. L-1 and 1000 ng. L-1, to predict the pharmaceutical outlet concentration class for Carbamazepine and selected antibiotics. In both approaches, the XGBoost model achieved the highest performance at all levels. For the Carbamazepine approach, the XGBoost models achieved F1 scores of 63%, 91%, and 90%. For the antibiotic approach, the XGBoost model obtained an F1-score of 99%, 90%, and 85% for the 1000 ng limits. L-1, 500 ng. L-1 and 100 ng. L-1, respectively. For both approaches, it was possible to obtain models with satisfactory performance. However, the cutoff limit of 1000 ng. L-1 proved to be challenging, as it generated samples with highly imbalanced classes, while the cutoff limits were 500 ng. L-1 and 100 ng. L-1 enabled the construction of more viable models. The models revealed that Boosting classifiers have potential as an alternative for monitoring and controlling pharmaceuticals in sanitary sewage. The use of open-access data made available by ANVISA reflects the potentials and limitations for future studies since to date there has not been a broad exploration in research. Additionally, the drug occurrence database in WWTPs, built for this research, may be part of the investigative activities of other researchers, by aggregating new data, verifying other modeling techniques, or carrying out other types of analyses. |
Palavras-chave: | Ocorrência de fármacos Aprendizado de Máquina Efluentes Esgoto Sanitário |
CNPq: | CNPQ::ENGENHARIAS CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA |
Idioma: | por |
País: | Brasil |
Editora / Evento / Instituição: | Universidade Federal da Bahia |
Sigla da Instituição: | UFBA |
metadata.dc.publisher.department: | Escola Politécnica |
metadata.dc.publisher.program: | Programa de Pós-Graduação em Engenharia Industrial (PEI) |
Tipo de Acesso: | Acesso Aberto |
metadata.dc.rights.uri: | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
URI: | https://repositorio.ufba.br/handle/ri/41672 |
Data do documento: | 11-Fev-2025 |
Aparece nas coleções: | Tese (PEI) |
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Julia Bijos - TCC - Tese.pdf | Júlia Bijos - Tese em Engenharia Industrial - UFBA | 4,47 MB | Adobe PDF | Visualizar/Abrir |
Este item está licenciada sob uma Licença Creative Commons