Skip navigation
Universidade Federal da Bahia |
Repositório Institucional da UFBA
Use este identificador para citar ou linkar para este item: https://repositorio.ufba.br/handle/ri/41297
Tipo: Tese
Título: Análise de classificação multirrótulo em desfechos da doença falciforme.
Título(s) alternativo(s): Multi-label classification analysis of sickle cell disease outcomes.
Autor(es): Machado, Tiago Fernandes
Primeiro Orientador: Barreto, Marcos Ennes
metadata.dc.contributor.advisor-co1: Barbosa, Cynara Gomes
metadata.dc.contributor.referee1: Barreto, Marcos Ennes
metadata.dc.contributor.referee2: Barbosa, Cynara Gomes
metadata.dc.contributor.referee3: Pita, Robespierre Dantas da Rocha
metadata.dc.contributor.referee4: Adorno, Elisângela Vitória
metadata.dc.contributor.referee5: Ramos, Ricardo Argenton
Resumo: A doença falciforme é uma condição genética que afeta a hemoglobina, resultando em complicações sistêmicas que influenciam a qualidade e sobrevida dos pacientes. A cromatografia líquida de alta performance (HPLC) é apontada como a melhor técnica de escolha para pesquisa de hemoglobinas variantes, já a eletroforese de hemoglobinas constitui a técnica padrão ouro para diagnóstico da doença, sendo de difícil acesso em localidades remotas do Brasil e em vários países em desenvolvimento, tais como do continente africano. A heterogeneidade clínica e a estratificação da gravidade da doença têm sido desafiadoras na prática médica, de modo que a predição de desfechos envolve análises de uma série de marcadores clínicos e laboratoriais. Vários estudos discutiram a aplicação de modelos de inteligência artificial no diagnóstico da doença falciforme e seu monitoramento, tendo os autores se concentrado na classificação tradicional, onde um único desfecho é analisado. Essa condição limita alguns problemas complexos de saúde, onde existe mais de um desfecho por paciente. A proposta deste estudo foi utilizar de algoritmos multirrótulo para observar as relações entre os desfechos da doença falciforme e avaliar a hipótese de que o uso de modelos de inteligência artificial pode permitir uma melhor estratificação de pacientes com a doença, considerando os múltiplos desfechos clínicos. Foi utilizada uma base de dados com 609 pacientes e 63 variáveis. A base foi obtida de estudos experimentais de coorte transversal gerados pelo Laboratório de Pesquisa em Anemias da Faculdade de Farmácia (UFBA) e do Laboratório de Investigação em Genética e Hematologia Translacional (LIGHT - FIOCRUZ-BA). Foram utilizados os algoritmos multirrótulo Binary Relevance (BR), Classifier Chains (CC), Label Powerset (LP) e Random k-labelsets (RAKEL), para predição dos desfechos de vaso-oclusão, crises de dor, hospitalização e infecções. Esses algoritmos são utilizados em problemas de transformação multirrótulo, que transformam o problema multirrótulo em uma série de problemas de classificação binária independentes, multiclasse e ensemble. Os resultados apontaram que quando a ordem dos desfechos é relevante, o modelo RAkELo com Random Forest se destaca, apresentando um Label Ranking Loss de 0,52. Por outro lado, quando a ordenação não é um fator clínico importante, os modelos baseados em SVM e Random Forest, em todas as abordagens (BR, CC, LP, RAkELo), mostraram uma combinação ideal de baixo Hamming Loss (0,20) e alto Micro-averaged f1-score (0,89).
Abstract: Sickle cell disease is a genetic condition that affects hemoglobin, resulting in systemic consequences that influence patients' quality of life and survival. Hemoglobin electrophoresis is gold standard technique for diagnosing the disease and is difficult to access in remote areas of Brazil and several developing countries, such as the African continent. Clinical heterogeneity and disease severity stratification have been tested in medical practice, so predicting results involves analyzing a series of clinical and laboratory markers. Several studies have discussed the application of artificial intelligence models in diagnosing sickle cell disease and its monitoring, with the authors focusing on the traditional classification, where a single stage is developed. This condition limits some health problems where there is more than one stage per patient. The purpose of this study was to use multi-label algorithms to observe the relationships between the outcomes of sickle cell disease and to evaluate the hypothesis that using artificial intelligence models can allow for better stratification of patients with the disease, considering the multiple clinical outcomes. A database with 609 patients and 63 variables was used. The database was obtained from experimental cross-sectional cohort studies generated by the Anemia Research Laboratory of the School of Pharmacy (UFBA) and the Translational Genetics and Hematology Research Laboratory (LIGHT - FIOCRUZ-BA). Multi-label algorithms Binary Relevance (BR), Classifier Chains (CC), Label Powerset (LP), and Random k-label sets (RAKEL) were used to predict the development of vaso-occlusion, pain crises, hospitalization, and infections. These algorithms are used in multi-label transformation problems, which transform the multi-label problem into a series of independent, multi-class, and ensemble binary classification problems. The results showed that when the order of the stages is relevant, the RAkELo model with Random Forest stands out, presenting a Label Ranking Loss of 0.52. On the other hand, when ordering is not an important clinical factor, the SVM and Random Forest-based models, in all approaches (BR, CC, LP, RAkELo), presented an optimal combination of low Hamming Loss (0.20) and high microaverage f1-score (0.89).
Palavras-chave: Computação
Doença Falciforme
Classificação multirrótulo
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Idioma: por
País: Brasil
Editora / Evento / Instituição: Universidade Federal da Bahia
Sigla da Instituição: UFBA
metadata.dc.publisher.department: Instituto de Computação - IC
metadata.dc.publisher.program: Programa de Pós-Graduação em Ciência da Computação (PGCOMP) 
Citação: MACHADO, Tiago Fernandes. Análise de classificação multirrótulo em desfechos da doença falciforme. 2024. 84 f. Tese (Doutorado em Ciência da Computação) - Instituto de Computação, Universidade Federal da Bahia, Salvador (Bahia), 2024.
Tipo de Acesso: Acesso Aberto
URI: https://repositorio.ufba.br/handle/ri/41297
Data do documento: 19-Dez-2024
Aparece nas coleções:Tese (PGCOMP)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
PGCOMP_2024_TIAGOMACHADO.pdfTese3,63 MBAdobe PDFVisualizar/Abrir
Mostrar registro completo do item Visualizar estatísticas


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.