https://repositorio.ufba.br/handle/ri/40414
Tipo: | Dissertação |
Título: | Método de agrupamento multinível para dados mistos. |
Título(s) alternativo(s): | Multilevel clustering method for mixed data. |
Autor(es): | Paz, Hellen Oliveira da |
Primeiro Orientador: | Souza, Anderson Luiz Ara |
metadata.dc.contributor.advisor-co1: | Fiaccone, Rosemeire Leovigildo |
metadata.dc.contributor.referee1: | Souza, Anderson Luiz Ara |
metadata.dc.contributor.referee2: | da Costa, Lilia Carolina Carneiro |
metadata.dc.contributor.referee3: | Ferreira, Marcelo Rodrigo Portela |
Resumo: | A Análise de agrupamento é uma área com vasto desenvolvimento metodológico nas diversas áreas do conhecimento. Esta dissertação propõe um novo método de agrupamento para dados mistos, levando em consideração a estrutura multinível das observações. A identificação de quão similares ou próximas as unidades de análise se encontram pode ser quantificada por meio de medidas de proximidade, que, juntamente com os algoritmos utilizados, são essenciais na metodologia de análise de agrupamento. Dados mistos são caracterizados pela presença conjunta de variáveis quantitativas e qualitativas. O termo “Agrupamento Multinível” é utilizado em diversas áreas do conhecimento, referindo-se a diferentes conceitos. Nossa proposta de agrupamento multinível adapta o algoritmo k-médias para dados multiníveis, incorporando a estrutura hierárquica dos dados no cálculo das distâncias entre as observações através de uma abordagem de ponderação da distância de Hellinger. Os resultados obtidos a partir de estudos de simulação e aplicações práticas são satisfatórios, apresentando melhores agrupamentos quando se tem mais de uma variável quantitativa. No entanto, ainda são necessários mais estudos em diversos cenários para aumentar a robustez da metodologia proposta. |
Abstract: | Cluster Analysis is an area with vast methodological development in different areas of knowledge. This dissertation proposes a new clustering method for mixed data, taking into account the multilevel structure of observations. The identification of how similar or close the units of analysis are can be quantified through proximity measures, which, together with the algorithms used, are essential in the cluster analysis methodology. Mixed data is characterized by the joint presence of quantitative and qualitative variables. The term “Multilevel Clustering” is used in different areas of knowledge, referring to different concepts. Our multilevel clustering proposal adapts the k-means algorithm to multilevel data, incorporating the hierarchical structure of the data in calculating the distances between observations through a Hellinger distance weighting approach. The results obtained from simulation studies and practical applications are satisfactory, presenting better groupings when there is more than one quantitative variable. However, more studies are still needed in different scenarios to increase the robustness of the proposed methodology. |
Palavras-chave: | Análise de agrupamento Agrupamento multinível K-means Dados multiníveis Dados mistos |
CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA |
Idioma: | por |
País: | Brasil |
Editora / Evento / Instituição: | Universidade Federal da Bahia |
Sigla da Instituição: | UFBA |
metadata.dc.publisher.department: | Instituto de Matemática |
metadata.dc.publisher.program: | Pós-Graduação em Matemática (PGMAT) |
Citação: | PAZ, Hellen Oliveira da. Método de agrupamento multinível para dados mistos. 2024. 100 f. Dissertação (Mestrado em Matemática) - Instituto de Matemática e Estatística - IME, Universidade Federal da Bahia, Salvador (Bahia), 2024. |
Tipo de Acesso: | Acesso Aberto |
URI: | https://repositorio.ufba.br/handle/ri/40414 |
Data do documento: | 26-Jun-2024 |
Aparece nas coleções: | Dissertação (PGMAT) |
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Dissertacao_HellenPaz_vsfinal.pdf | Dissertação Hellen Paz | 1,66 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.