Skip navigation
Universidade Federal da Bahia |
Repositório Institucional da UFBA
Use este identificador para citar ou linkar para este item: https://repositorio.ufba.br/handle/ri/40511
Registro completo de metadados
Campo DCValorIdioma
dc.creatorSantos, Laila Pereira Mota-
dc.date.accessioned2024-10-29T10:37:52Z-
dc.date.available2024-10-29T10:37:52Z-
dc.date.issued2024-08-23-
dc.identifier.citationSANTOS, Laila Pereira Mota. Análise da mudança semântica lexical: identificação e caracterização na língua portuguesa. 2024. 180 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Computação, Universidade Federal da Bahia, Salvador (Bahia), 2024.pt_BR
dc.identifier.urihttps://repositorio.ufba.br/handle/ri/40511-
dc.description.abstractLexical Semantic Change (LSC) in the Portuguese language over time, focusing on the use of contextual language models. LSM, which refers to the change in the meaning of words over time, is a complex and multifaceted phenomenon that reflects the cultural, social and technological changes in society (AITCHISON, 2002). Understanding LSM has applications in several areas, from historical linguistics to Natural Language Processing (NLP). The proposal highlights the challenges of detecting and interpreting LSM, such as polysemy (a word with multiple meanings) and the gradual and subtle nature of semantic change. To address these challenges, the research proposes the use of contextualized semantic spaces, generated by models such as BERT (DEVLIN et al., 2019), which capture the meaning of words in their specific contexts. The central hypothesis is that these contextualized semantic spaces can represent the changes in lexical units of the Portuguese language. However, the temporal aspect of these approaches is limited to the data and is not represented. Thus, this research project proposes the construction of a diachronic corpus of the Portuguese language with the aim of generating contextual embeddings that have temporal characteristics to detect, quantify and interpret lexical semantic change. The validation of the approach will explore different metrics and approaches. It is expected that this research will contribute to the advancement of knowledge in the area of MSL, providing a model for the analysis of lexical semantic change with temporal identification in the Portuguese language.pt_BR
dc.description.sponsorshipConselho Nacional de Desenvolvimento Científico e Tecnológico, CNPqpt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal da Bahiapt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectProcessamento de linguagem naturalpt_BR
dc.subjectModelos de linguagempt_BR
dc.subjectPolissemiapt_BR
dc.subjectComputaçãopt_BR
dc.subject.otherNatural language processingpt_BR
dc.subject.otherLanguage modelspt_BR
dc.subject.otherPolysemypt_BR
dc.subject.otherComputingpt_BR
dc.titleAnálise da mudança semântica lexical: identificação e caracterização na língua portuguesa.pt_BR
dc.title.alternativeAnalysis of lexical semantic change: identification and characterization in the portuguese language.pt_BR
dc.typeDissertaçãopt_BR
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computação (PGCOMP) pt_BR
dc.publisher.initialsUFBApt_BR
dc.publisher.countryBrasilpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.contributor.advisor1Claro, Daniela Barreiro-
dc.contributor.advisor1IDhttps://orcid.org/0000-0001-8586-1042pt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/9217378047217370pt_BR
dc.contributor.advisor-co1Araújo, Rerisson Cavalcante de-
dc.contributor.advisor-co1IDhttps://orcid.org/0000-0002-7255-5422pt_BR
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/9546551094655305pt_BR
dc.contributor.referee1Claro, Daniela Barreiro-
dc.contributor.referee1IDhttps://orcid.org/0000-0001-8586-1042pt_BR
dc.contributor.referee1Latteshttp://lattes.cnpq.br/9217378047217370pt_BR
dc.contributor.referee2Souza, Jackson Wilke da Cruz-
dc.contributor.referee2IDhttps://orcid.org/0000-0003-1881-6780pt_BR
dc.contributor.referee2Latteshttp://lattes.cnpq.br/0019187301069627pt_BR
dc.contributor.referee3Souza, Marlo Vieira dos Santos e-
dc.contributor.referee3IDhttps://orcid.org/0000-0002-5373-7271pt_BR
dc.contributor.referee3Latteshttp://lattes.cnpq.br/8734792579019380pt_BR
dc.creator.IDhttps://orcid.org/0009-0003-1849-0300pt_BR
dc.creator.Latteshttp://lattes.cnpq.br/5248712875633926pt_BR
dc.description.resumoA Mudança Semântica Lexical (MSL) na língua portuguesa ao longo do tempo, com foco no uso de modelos de linguagem contextuais. A MSL, que se refere à alteração do significado das palavras ao longo do tempo, é um fenômeno complexo e multifacetado que reflete as mudanças culturais, sociais e tecnológicas da sociedade (AITCHISON, 2002). A compreensão da MSL tem aplicações em diversas áreas, desde a linguística histórica até o Processamento de Linguagem Natural (PLN). A proposta destaca os desafios da detecção e interpretação da MSL, como a polissemia (uma palavra com múltiplos sentidos) e a natureza gradual e sutil da mudança semântica. Para abordar esses desafios, a pesquisa propõe a utilização de espaços semânticos contextualizados, gerados por modelos como o BERT (DEVLIN et al., 2019), que capturam o significado das palavras em seus contextos específicos. A hipótese central é que esses espaços semânticos contextualizados podem representar as mudanças de unidades lexicais da língua portuguesa. Porém o aspecto temporal destas abordagens fica limitado aos dados e não são representados. Assim, o presente projeto de pesquisa propõe a construção de um corpus diacrônico da língua portuguesa com o objetivo de gerar embeddings contextuais que detenham características temporais para detectar, quantificar e interpretar a mudança semântica lexical. A validação da abordagem explorará diferentes métricas e abordagens. Espera-se que esta pesquisa contribua para o avanço do conhecimento na área de MSL, fornecendo um modelo para a análise da mudança semântica lexical com a identificação temporal na língua portuguesa.pt_BR
dc.publisher.departmentInstituto de Computação - ICpt_BR
dc.type.degreeMestrado Acadêmicopt_BR
Aparece nas coleções:Dissertação (PGCOMP)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Dissertacao_Laila.pdf7,79 MBAdobe PDFVisualizar/Abrir
Mostrar registro simples do item Visualizar estatísticas


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.