Skip navigation
Universidade Federal da Bahia |
Repositório Institucional da UFBA
Use este identificador para citar ou linkar para este item: https://repositorio.ufba.br/handle/ri/41297
Registro completo de metadados
Campo DCValorIdioma
dc.creatorMachado, Tiago Fernandes-
dc.date.accessioned2025-02-20T11:02:27Z-
dc.date.available2025-02-20T11:02:27Z-
dc.date.issued2024-12-19-
dc.identifier.citationMACHADO, Tiago Fernandes. Análise de classificação multirrótulo em desfechos da doença falciforme. 2024. 84 f. Tese (Doutorado em Ciência da Computação) - Instituto de Computação, Universidade Federal da Bahia, Salvador (Bahia), 2024.pt_BR
dc.identifier.urihttps://repositorio.ufba.br/handle/ri/41297-
dc.description.abstractSickle cell disease is a genetic condition that affects hemoglobin, resulting in systemic consequences that influence patients' quality of life and survival. Hemoglobin electrophoresis is gold standard technique for diagnosing the disease and is difficult to access in remote areas of Brazil and several developing countries, such as the African continent. Clinical heterogeneity and disease severity stratification have been tested in medical practice, so predicting results involves analyzing a series of clinical and laboratory markers. Several studies have discussed the application of artificial intelligence models in diagnosing sickle cell disease and its monitoring, with the authors focusing on the traditional classification, where a single stage is developed. This condition limits some health problems where there is more than one stage per patient. The purpose of this study was to use multi-label algorithms to observe the relationships between the outcomes of sickle cell disease and to evaluate the hypothesis that using artificial intelligence models can allow for better stratification of patients with the disease, considering the multiple clinical outcomes. A database with 609 patients and 63 variables was used. The database was obtained from experimental cross-sectional cohort studies generated by the Anemia Research Laboratory of the School of Pharmacy (UFBA) and the Translational Genetics and Hematology Research Laboratory (LIGHT - FIOCRUZ-BA). Multi-label algorithms Binary Relevance (BR), Classifier Chains (CC), Label Powerset (LP), and Random k-label sets (RAKEL) were used to predict the development of vaso-occlusion, pain crises, hospitalization, and infections. These algorithms are used in multi-label transformation problems, which transform the multi-label problem into a series of independent, multi-class, and ensemble binary classification problems. The results showed that when the order of the stages is relevant, the RAkELo model with Random Forest stands out, presenting a Label Ranking Loss of 0.52. On the other hand, when ordering is not an important clinical factor, the SVM and Random Forest-based models, in all approaches (BR, CC, LP, RAkELo), presented an optimal combination of low Hamming Loss (0.20) and high microaverage f1-score (0.89).pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal da Bahiapt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectComputaçãopt_BR
dc.subjectDoença Falciformept_BR
dc.subjectClassificação multirrótulopt_BR
dc.subject.otherComputingpt_BR
dc.subject.otherSickle Cell Diseasept_BR
dc.subject.otherMulti-label classificationpt_BR
dc.titleAnálise de classificação multirrótulo em desfechos da doença falciforme.pt_BR
dc.title.alternativeMulti-label classification analysis of sickle cell disease outcomes.pt_BR
dc.typeTesept_BR
dc.contributor.refereesGomes, Gecynalda Soares da Silva-
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computação (PGCOMP) pt_BR
dc.publisher.initialsUFBApt_BR
dc.publisher.countryBrasilpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.contributor.advisor1Barreto, Marcos Ennes-
dc.contributor.advisor1IDhttps://orcid.org/0000-0002-7818-1855pt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/2919125967043242pt_BR
dc.contributor.advisor-co1Barbosa, Cynara Gomes-
dc.contributor.advisor-co1IDhttps://orcid.org/0000-0003-2856-3756pt_BR
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/1464729909848094pt_BR
dc.contributor.referee1Barreto, Marcos Ennes-
dc.contributor.referee1IDhttps://orcid.org/0000-0002-7818-1855pt_BR
dc.contributor.referee1Latteshttp://lattes.cnpq.br/2919125967043242pt_BR
dc.contributor.referee2Barbosa, Cynara Gomes-
dc.contributor.referee2IDhttps://orcid.org/0000-0003-2856-3756pt_BR
dc.contributor.referee2Latteshttp://lattes.cnpq.br/1464729909848094pt_BR
dc.contributor.referee3Pita, Robespierre Dantas da Rocha-
dc.contributor.referee3IDhttps://orcid.org/0000-0002-0616-620Xpt_BR
dc.contributor.referee3Latteshttp://lattes.cnpq.br/9031151666715654pt_BR
dc.contributor.referee4Adorno, Elisângela Vitória-
dc.contributor.referee4IDhttps://orcid.org/0000-0001-9455-890Xpt_BR
dc.contributor.referee4Latteshttp://lattes.cnpq.br/9666247822031673pt_BR
dc.contributor.referee5Ramos, Ricardo Argenton-
dc.contributor.referee5IDhttps://orcid.org/0000-0002-9688-719Xpt_BR
dc.contributor.referee5Latteshttp://lattes.cnpq.br/6190953685221120pt_BR
dc.creator.Latteshttp://lattes.cnpq.br/7690224410414714pt_BR
dc.description.resumoA doença falciforme é uma condição genética que afeta a hemoglobina, resultando em complicações sistêmicas que influenciam a qualidade e sobrevida dos pacientes. A cromatografia líquida de alta performance (HPLC) é apontada como a melhor técnica de escolha para pesquisa de hemoglobinas variantes, já a eletroforese de hemoglobinas constitui a técnica padrão ouro para diagnóstico da doença, sendo de difícil acesso em localidades remotas do Brasil e em vários países em desenvolvimento, tais como do continente africano. A heterogeneidade clínica e a estratificação da gravidade da doença têm sido desafiadoras na prática médica, de modo que a predição de desfechos envolve análises de uma série de marcadores clínicos e laboratoriais. Vários estudos discutiram a aplicação de modelos de inteligência artificial no diagnóstico da doença falciforme e seu monitoramento, tendo os autores se concentrado na classificação tradicional, onde um único desfecho é analisado. Essa condição limita alguns problemas complexos de saúde, onde existe mais de um desfecho por paciente. A proposta deste estudo foi utilizar de algoritmos multirrótulo para observar as relações entre os desfechos da doença falciforme e avaliar a hipótese de que o uso de modelos de inteligência artificial pode permitir uma melhor estratificação de pacientes com a doença, considerando os múltiplos desfechos clínicos. Foi utilizada uma base de dados com 609 pacientes e 63 variáveis. A base foi obtida de estudos experimentais de coorte transversal gerados pelo Laboratório de Pesquisa em Anemias da Faculdade de Farmácia (UFBA) e do Laboratório de Investigação em Genética e Hematologia Translacional (LIGHT - FIOCRUZ-BA). Foram utilizados os algoritmos multirrótulo Binary Relevance (BR), Classifier Chains (CC), Label Powerset (LP) e Random k-labelsets (RAKEL), para predição dos desfechos de vaso-oclusão, crises de dor, hospitalização e infecções. Esses algoritmos são utilizados em problemas de transformação multirrótulo, que transformam o problema multirrótulo em uma série de problemas de classificação binária independentes, multiclasse e ensemble. Os resultados apontaram que quando a ordem dos desfechos é relevante, o modelo RAkELo com Random Forest se destaca, apresentando um Label Ranking Loss de 0,52. Por outro lado, quando a ordenação não é um fator clínico importante, os modelos baseados em SVM e Random Forest, em todas as abordagens (BR, CC, LP, RAkELo), mostraram uma combinação ideal de baixo Hamming Loss (0,20) e alto Micro-averaged f1-score (0,89).pt_BR
dc.publisher.departmentInstituto de Computação - ICpt_BR
dc.contributor.refereesLatteshttp://lattes.cnpq.br/3389510216870588pt_BR
dc.contributor.refereesIDshttps://orcid.org/0000-0002-8895-5834pt_BR
dc.type.degreeDoutoradopt_BR
Aparece nas coleções:Tese (PGCOMP)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
PGCOMP_2024_TIAGOMACHADO.pdfTese3,63 MBAdobe PDFVisualizar/Abrir
Mostrar registro simples do item Visualizar estatísticas


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.