Campo DC | Valor | Idioma |
dc.creator | Paz, Hellen Oliveira da | - |
dc.date.accessioned | 2024-10-14T10:39:29Z | - |
dc.date.available | 2024-10-14T10:39:29Z | - |
dc.date.issued | 2024-06-26 | - |
dc.identifier.citation | PAZ, Hellen Oliveira da. Método de agrupamento multinível para dados mistos. 2024. 100 f. Dissertação (Mestrado em Matemática) - Instituto de Matemática e Estatística - IME, Universidade Federal da Bahia, Salvador (Bahia), 2024. | pt_BR |
dc.identifier.uri | https://repositorio.ufba.br/handle/ri/40414 | - |
dc.description.abstract | Cluster Analysis is an area with vast methodological development in different areas of knowledge. This dissertation proposes a new clustering method for mixed data, taking into account the multilevel structure of observations. The identification of how similar or close the units of analysis are can be quantified through proximity measures, which, together with the algorithms used, are essential in the cluster analysis methodology. Mixed data is characterized by the joint presence of quantitative and qualitative variables. The term “Multilevel Clustering” is used in different areas of knowledge, referring to different concepts. Our multilevel clustering proposal adapts the k-means algorithm to multilevel data, incorporating the hierarchical structure of the data in calculating the distances between observations through a Hellinger distance weighting approach. The results obtained from simulation studies and practical applications are satisfactory, presenting better groupings when there is more than one quantitative variable. However, more studies are still needed in different scenarios to increase the robustness of the proposed methodology. | pt_BR |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior, CAPES | pt_BR |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal da Bahia | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject | Análise de agrupamento | pt_BR |
dc.subject | Agrupamento multinível | pt_BR |
dc.subject | K-means | pt_BR |
dc.subject | Dados multiníveis | pt_BR |
dc.subject | Dados mistos | pt_BR |
dc.subject.other | Cluster analysis | pt_BR |
dc.subject.other | Multilevel clustering | pt_BR |
dc.subject.other | K-means | pt_BR |
dc.subject.other | Multilevel data | pt_BR |
dc.subject.other | Mixed data | pt_BR |
dc.title | Método de agrupamento multinível para dados mistos. | pt_BR |
dc.title.alternative | Multilevel clustering method for mixed data. | pt_BR |
dc.type | Dissertação | pt_BR |
dc.publisher.program | Pós-Graduação em Matemática (PGMAT) | pt_BR |
dc.publisher.initials | UFBA | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA | pt_BR |
dc.contributor.advisor1 | Souza, Anderson Luiz Ara | - |
dc.contributor.advisor1ID | https://orcid.org/0000-0002-1041-2768 | pt_BR |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/8916772290938469 | pt_BR |
dc.contributor.advisor-co1 | Fiaccone, Rosemeire Leovigildo | - |
dc.contributor.advisor-co1ID | https://orcid.org/0000-0001-5439-1551 | pt_BR |
dc.contributor.advisor-co1Lattes | http://lattes.cnpq.br/1839882342448396 | pt_BR |
dc.contributor.referee1 | Souza, Anderson Luiz Ara | - |
dc.contributor.referee1ID | https://orcid.org/0000-0002-1041-2768 | pt_BR |
dc.contributor.referee1Lattes | http://lattes.cnpq.br/8916772290938469 | pt_BR |
dc.contributor.referee2 | da Costa, Lilia Carolina Carneiro | - |
dc.contributor.referee2ID | https://orcid.org/0000-0001-5107-2723 | pt_BR |
dc.contributor.referee2Lattes | http://lattes.cnpq.br/7905206547630006 | pt_BR |
dc.contributor.referee3 | Ferreira, Marcelo Rodrigo Portela | - |
dc.contributor.referee3ID | https://orcid.org/0000-0003-0242-0255 | pt_BR |
dc.contributor.referee3Lattes | http://lattes.cnpq.br/2620157217100077 | pt_BR |
dc.creator.Lattes | http://lattes.cnpq.br/6712262587708162 | pt_BR |
dc.description.resumo | A Análise de agrupamento é uma área com vasto desenvolvimento metodológico nas diversas áreas do conhecimento. Esta dissertação propõe um novo método de agrupamento para dados mistos, levando em consideração a estrutura multinível das observações. A identificação de quão similares ou próximas as unidades de análise se encontram pode ser quantificada por meio de medidas de proximidade, que, juntamente com os algoritmos utilizados, são essenciais na metodologia de análise de agrupamento. Dados mistos são caracterizados pela presença conjunta de variáveis quantitativas e qualitativas. O termo “Agrupamento Multinível” é utilizado em diversas áreas do conhecimento, referindo-se a diferentes conceitos. Nossa proposta de agrupamento multinível adapta o algoritmo k-médias para dados multiníveis, incorporando a estrutura hierárquica dos dados no cálculo das distâncias entre as observações através de uma abordagem de ponderação da distância de Hellinger. Os resultados obtidos a partir de estudos de simulação e aplicações práticas são satisfatórios, apresentando melhores agrupamentos quando se tem mais de uma variável quantitativa. No entanto, ainda são necessários mais estudos em diversos cenários para aumentar a robustez da metodologia proposta. | pt_BR |
dc.publisher.department | Instituto de Matemática | pt_BR |
dc.type.degree | Mestrado Acadêmico | pt_BR |
Aparece nas coleções: | Dissertação (PGMAT)
|