Skip navigation
Universidade Federal da Bahia |
Repositório Institucional da UFBA
Use este identificador para citar ou linkar para este item: https://repositorio.ufba.br/handle/ri/40414
Tipo: Dissertação
Título: Método de agrupamento multinível para dados mistos.
Título(s) alternativo(s): Multilevel clustering method for mixed data.
Autor(es): Paz, Hellen Oliveira da
Primeiro Orientador: Souza, Anderson Luiz Ara
metadata.dc.contributor.advisor-co1: Fiaccone, Rosemeire Leovigildo
metadata.dc.contributor.referee1: Souza, Anderson Luiz Ara
metadata.dc.contributor.referee2: da Costa, Lilia Carolina Carneiro
metadata.dc.contributor.referee3: Ferreira, Marcelo Rodrigo Portela
Resumo: A Análise de agrupamento é uma área com vasto desenvolvimento metodológico nas diversas áreas do conhecimento. Esta dissertação propõe um novo método de agrupamento para dados mistos, levando em consideração a estrutura multinível das observações. A identificação de quão similares ou próximas as unidades de análise se encontram pode ser quantificada por meio de medidas de proximidade, que, juntamente com os algoritmos utilizados, são essenciais na metodologia de análise de agrupamento. Dados mistos são caracterizados pela presença conjunta de variáveis quantitativas e qualitativas. O termo “Agrupamento Multinível” é utilizado em diversas áreas do conhecimento, referindo-se a diferentes conceitos. Nossa proposta de agrupamento multinível adapta o algoritmo k-médias para dados multiníveis, incorporando a estrutura hierárquica dos dados no cálculo das distâncias entre as observações através de uma abordagem de ponderação da distância de Hellinger. Os resultados obtidos a partir de estudos de simulação e aplicações práticas são satisfatórios, apresentando melhores agrupamentos quando se tem mais de uma variável quantitativa. No entanto, ainda são necessários mais estudos em diversos cenários para aumentar a robustez da metodologia proposta.
Abstract: Cluster Analysis is an area with vast methodological development in different areas of knowledge. This dissertation proposes a new clustering method for mixed data, taking into account the multilevel structure of observations. The identification of how similar or close the units of analysis are can be quantified through proximity measures, which, together with the algorithms used, are essential in the cluster analysis methodology. Mixed data is characterized by the joint presence of quantitative and qualitative variables. The term “Multilevel Clustering” is used in different areas of knowledge, referring to different concepts. Our multilevel clustering proposal adapts the k-means algorithm to multilevel data, incorporating the hierarchical structure of the data in calculating the distances between observations through a Hellinger distance weighting approach. The results obtained from simulation studies and practical applications are satisfactory, presenting better groupings when there is more than one quantitative variable. However, more studies are still needed in different scenarios to increase the robustness of the proposed methodology.
Palavras-chave: Análise de agrupamento
Agrupamento multinível
K-means
Dados multiníveis
Dados mistos
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
Idioma: por
País: Brasil
Editora / Evento / Instituição: Universidade Federal da Bahia
Sigla da Instituição: UFBA
metadata.dc.publisher.department: Instituto de Matemática
metadata.dc.publisher.program: Pós-Graduação em Matemática (PGMAT) 
Citação: PAZ, Hellen Oliveira da. Método de agrupamento multinível para dados mistos. 2024. 100 f. Dissertação (Mestrado em Matemática) - Instituto de Matemática e Estatística - IME, Universidade Federal da Bahia, Salvador (Bahia), 2024.
Tipo de Acesso: Acesso Aberto
URI: https://repositorio.ufba.br/handle/ri/40414
Data do documento: 26-Jun-2024
Aparece nas coleções:Dissertação (PGMAT)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Dissertacao_HellenPaz_vsfinal.pdfDissertação Hellen Paz1,66 MBAdobe PDFVisualizar/Abrir
Mostrar registro completo do item Visualizar estatísticas


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.