Skip navigation
Universidade Federal da Bahia |
Repositório Institucional da UFBA
Use este identificador para citar ou linkar para este item: https://repositorio.ufba.br/handle/ri/40490
Registro completo de metadados
Campo DCValorIdioma
dc.creatorBoechat, Glaucya Carreiro-
dc.date.accessioned2024-10-23T11:51:28Z-
dc.date.available2024-10-23T11:51:28Z-
dc.date.issued2024-03-08-
dc.identifier.citationBOECHAT, Glaucya Carreiro. Uma investigação sobre análise de sentimentos e categorização de Issues reabertas do GitHub. 2024. 196f. Tese (Doutorado em Ciência da Computação) - Instituto de Computação. Universidade Federal da Bahia, Salvador, BA, 2024.pt_BR
dc.identifier.urihttps://repositorio.ufba.br/handle/ri/40490-
dc.description.abstractThe reopening of issues represents a significant challenge in software development and maintenance, increasing the costs and complexity of the efforts involved. This occurrence often indicates unresolved or misunderstood issues in communication between project collaborators and users on platforms like GitHub. This thesis aims to deepen the understanding of issue reopenings in open-source GitHub software repositories, considering historical data, issue categorization, and sentiment analysis of developers involved in the associated discussions. Our methodology involved using the SentiStrength-SE tool, adapted for lexicons in the field of Software Engineering, to calculate polarity and sentiment in the texts of discussions related to issues. Subsequently, we developed an automated issue categorization model, classifying them into specific categories such as configuration, database-related, program anomaly, performance, functional, GUI-related, info, permission/deprecation, network, security, and testing. This approach enables more effective prioritization in resolving reopened issues, directing resources more accurately. Finally, we characterized issue reopenings based on the sentiments of developers expressed in discussions within each issue category. The results revealed that sentiment analysis, when applied in isolation, did not prove to be an effective metric for identifying issue reopenings. However, we identified that certain types of issue categories are more prone to problems related to reopening. This underscores the importance of combining issue categorization with sentiment analysis for a more efficient approach to preventing and addressing issue reopenings in open-source software repositories.pt_BR
dc.description.sponsorshipFundação de Amparo à Pesquisa do Estado da Bahia (FAPESB)pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal da Bahiapt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectReabertura de issuespt_BR
dc.subjectAnálise de sentimentospt_BR
dc.subjectCategorização de issuespt_BR
dc.subjectMineração de repositório de softwarept_BR
dc.subject.otherReopened issuept_BR
dc.subject.otherSentiment analysispt_BR
dc.subject.otherIssue classificationpt_BR
dc.subject.otherMining software repositoriespt_BR
dc.titleUma investigação sobre análise de sentimentos e categorização de Issues reabertas do GitHub.pt_BR
dc.title.alternativeAn investigation into sentiment analysis and categorization of reopened GitHub Issues.pt_BR
dc.typeTesept_BR
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computação (PGCOMP) pt_BR
dc.publisher.initialsUFBApt_BR
dc.publisher.countryBrasilpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWAREpt_BR
dc.contributor.advisor1Mendonça Neto, Manoel Gomes de-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/1608062196337851pt_BR
dc.contributor.advisor-co1Machado, Ivan do Carmo-
dc.contributor.advisor-co1IDhttps://orcid.org/0000-0001-9027-2293pt_BR
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/4430958315746203pt_BR
dc.contributor.referee1Mendonça Neto, Manoel Gomes de-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/1608062196337851pt_BR
dc.contributor.referee2Carneiro, Glauco de Figueiredo-
dc.contributor.referee2IDhttps://orcid.org/0000-0001-6241-1612pt_BR
dc.contributor.referee2Latteshttp://lattes.cnpq.br/4951846457502161pt_BR
dc.contributor.referee3Farias, Mário André de Freitas-
dc.contributor.referee3IDhttps://orcid.org/0000-0002-4111-1298pt_BR
dc.contributor.referee3Latteshttp://lattes.cnpq.br/8650672176979968pt_BR
dc.contributor.referee4Freire, Emmanuel Savio Silva-
dc.contributor.referee4IDhttps://orcid.org/0000-0002-3989-9442pt_BR
dc.contributor.referee4Latteshttp://lattes.cnpq.br/6459838697209307pt_BR
dc.contributor.referee5Souza, Rodrigo Rocha Gomes e-
dc.contributor.referee5IDhttps://orcid.org/0000-0001-8186-0069pt_BR
dc.contributor.referee5Latteshttp://lattes.cnpq.br/7697794806460975pt_BR
dc.creator.Latteshttp://lattes.cnpq.br/7799035625879867pt_BR
dc.description.resumoA reabertura de issues representa um desafio significativo no desenvolvimento e manutenção de software, aumentando os custos e a complexidade dos esforços envolvidos. Essa ocorrência muitas vezes indica problemas não resolvidos ou mal compreendidos na comunicação entre os colaboradores do projeto e os usuários em plataformas como o GitHub. Esta tese tem como objetivo aprofundar a compreensão do conceito de reaberturas de issues em repositórios de software de código aberto do GitHub, considerando dados históricos, categorização de issues e análise de sentimentos dos desenvolvedores presentes nas discussões associadas a essas issues. Nossa metodologia envolveu o uso da ferramenta SentiStrength-SE, que conta com um léxico especializado para a Engenharia de Software, para calcular a polaridade e o sentimento nos textos das discussões relacionadas às issues. Desenvolvemos também um modelo de categorização automática de issues, que as classifica em categorias específicas, como banco de dados, configuração, desempenho, funcional, GUI, info, permissão/obsoleto, redes, segurança e testes. Essa abordagem permite uma priorização mais eficaz na resolução das issues reabertas, direcionando recursos de forma mais precisa. Além disso, caracterizamos a reabertura de issues de acordo com os sentimentos dos desenvolvedores contidos nos textos das discussões em cada categoria. Os resultados revelaram que a análise de sentimentos, quando aplicada isoladamente, não mostrou uma métrica eficaz para identificar reaberturas de issues. No entanto, identificamos que certos tipos de categorias de issues estão mais propensos a problemas relacionados à reabertura. Isso aponta para a importância da categorização de issues em conjunto com a análise de sentimentos para uma abordagem mais eficiente na prevenção e tratamento das reaberturas de issues em repositórios de software de código abertopt_BR
dc.publisher.departmentInstituto de Computação - ICpt_BR
dc.type.degreeDoutoradopt_BR
Aparece nas coleções:Tese (PGCOMP)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
tese_Glaucya.pdfTese de Doutorado de Glaucya Carreiro Boechat3,49 MBAdobe PDFVisualizar/Abrir
Mostrar registro simples do item Visualizar estatísticas


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.