https://repositorio.ufba.br/handle/ri/40541
Tipo: | Tese |
Título: | Sistema para reconhecimento de emoção multimodal e multiclasse para interação humano-robô |
Título(s) alternativo(s): | Multimodal and multiclass emotion recognition system for human-robot interaction |
Autor(es): | Ottoni, Lara Toledo Cordeiro |
Primeiro Orientador: | Cerqueira, Jés de Jesus Fiais |
metadata.dc.contributor.referee1: | Doria Neto, Adrião Duarte |
metadata.dc.contributor.referee2: | Netto, Mariana Schiavo |
metadata.dc.contributor.referee3: | Camada, Marcos Yuzuru de Oliveira |
metadata.dc.contributor.referee4: | Fernandes Júnior, Antônio Carlos |
metadata.dc.contributor.referee5: | Cerqueira, Jés de Jesus Fiais |
Resumo: | O desafio da Interação Humano-Robô (IHR) é construir sistemas inteligentes que possam se adaptar às mudanças dos usuários e do ambiente, a fim de melhorar a interação em tempo real. Desta forma, uma abordagem crescente é o uso de emoções na IHR. Neste sentido, existem os sistemas de reconhecimento de emoção multimodal, nos quais, realizam a classificação das emoções em várias modalidades (expressão facial, gestos, fala, e outros). No entanto, embora existam estudos que tratam do reconhecimento multimodal de emoções, eles ainda apresentam limitações na metodologia da classificação das emoções, além de considerar as emoções como binárias e ignorando as várias emoções que podem estar presentes no usuário. Assim, o objetivo deste trabalho foi propor um sistema de reconhecimento de emoções multimodal e multiclasse para a interação humano-robô. É proposto o uso das modalidades de expressão facial e fala, assim como a fusão das emoções. O Módulo de Reconhecimento de Emoção da Fala (MREF) é responsável por inferir a emoção na fala do usuário, no qual é utilizado um modelo de aprendizado profundo para classificar a emoção. Também é proposto o Módulo de Reconhecimento de Emoção da Expressão Facial (MREEF), que classifica a emoção pela face do usuário utilizando rede neural convolucional (CNN). Por fim, propõe-se a fusão das emoções reconhecidas utilizando sistema nebuloso. O sistema proposto utiliza da base de dados MELD, obtendo um resultado de 73% de acurácia usando apenas o MREF, 78,06% utilizando apenas o MREEF, e 78,94% de acurácia usando a fusão dos módulos. |
Abstract: | The challenge of Human-Robot Interaction (HRI) is to build intelligent systems that can adapt to user and environmental changes in order to enhance real-time interaction. In this regard, an emerging approach is the use of emotions in HRI. There are multimodal emotion recognition systems that classify emotions across various modalities (facial expression, gestures, speech, among others). However, despite studies on multimodal emotion recognition, they still have limitations in emotion classification methodology, often considering emotions as binary and overlooking the various emotions that may be present in the user. Therefore, the aim of this work is to propose a multimodal and multiclass emotion recognition system for human-robot interaction. The use of facial expression and speech modalities, as well as emotion fusion, is proposed. The Speech Emotion Recognition Module (MREF) is responsible for inferring the user's emotion from speech, utilizing a deep learning model for emotion classification. Additionally, the Facial Expression Emotion Recognition Module (MREEF) is proposed, which classifies the user's emotion from facial expressions using convolutional neural networks (CNNs). Finally, emotion fusion is proposed using fuzzy systems. When the proposed system was tested using the MELD database, the MREF achieved an accuracy of 73%, the MREEF 78.06%, and the fusion of modules achieved an accuracy of 78.94%. Thus, it can be observed that a multimodal system is more effective. |
Palavras-chave: | Reconhecimento de Emoção Sistema Multimodal Interação Humano-Robô Aprendizado de Máquina |
CNPq: | CNPQ::ENGENHARIAS |
Idioma: | por |
País: | Brasil |
Editora / Evento / Instituição: | Universidade Federal da Bahia |
Sigla da Instituição: | UFBA |
metadata.dc.publisher.department: | Escola Politécnica |
metadata.dc.publisher.program: | Programa de Pós-Graduação em Engenharia Elétrica (PPGEE) |
Tipo de Acesso: | Acesso Aberto |
URI: | https://repositorio.ufba.br/handle/ri/40541 |
Data do documento: | Out- 4 |
Aparece nas coleções: | Tese (PPGEE) |
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Tese_Lara_2024.pdf | Tese Lara Ottoni | 10,45 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.