https://repositorio.ufba.br/handle/ri/36909
Tipo: | Dissertação |
Título: | Estimativa de andamento musical através de escalogramas wavelet e redes neurais convolucionais |
Autor(es): | Viana, Luiz Alberto Guimarães |
Primeiro Orientador: | Fernandes Júnior, Antônio Carlos Lopes |
metadata.dc.contributor.advisor-co1: | Simas Filho, Eduardo Furtado de |
metadata.dc.contributor.referee1: | Fernandes Júnior, Antônio Carlos Lopes |
metadata.dc.contributor.referee2: | Simas Filho, Eduardo Furtado de |
metadata.dc.contributor.referee3: | Montalvão Filho, Jugurta Rosa |
metadata.dc.contributor.referee4: | Prates, Ricardo Menezes |
metadata.dc.contributor.referee5: | Attux, Romis Ribeiro de Fassoil |
Resumo: | A estimativa de andamento é uma das tarefas mais fundamentais da Recuperação da Informação Musical (MIR - Musical Information Retrieval). Neste trabalho foi utilizada uma representação do sinal de áudio como uma imagem bidimensional através do escalograma wavelet. Foram testadas diferentes formas de geração do escalograma wavelet, variando a função wavelet analisadora e os níveis de escala. As imagens foram utilizadas para treinar uma Rede Neural Convolucional (CNN - Convolutional Neural Network) realizando um aprendizado supervisionado, relacionando a imagem com um valor de andamento alvo. O método de validação cruzada k-fold foi utilizado para gerar uma maior confiabilidade estatística do modelo proposto e definir o melhor resultado para as escolhas envolvendo os parâmetros de geração dos escalogramas. Foi implementado o aumento artificial de dados de forma online, modificando os escalogramas durante a rotina de treinamento. Por fim, o modelo foi avaliado em bancos de dados amplamente utilizados na literatura e os resultados foram comparados ao estado da arte. Resultados compatíveis ao estado da arte foram atingidos em um dos bancos de dados de avaliação, o "GiantSteps", atingindo uma acurácia (Tipo 2 - ACC2) de 92,6% com as wavelets analisadoras Morlet e Shannon. |
Abstract: | Audio tempo estimation is one of the most fundamental tasks in Music Information Retrieval (MIR). In this work, a wavelet scalogram is used as a two-dimensional image representation of the audio signal. Different ways of generating the wavelet scalogram were tested by varying the mother wavelet function and scale levels. The images were used to train a Convolutional Neural Network (CNN) through supervised learning, relating the image to a target tempo value. The k-fold cross-validation method was used to produce greater statistical reliability of the proposed model and to define the best result for choices involving the parameters of scalogram generation. Data augmentation was implemented online, modifying the scalograms during training. Finally, the model was evaluated on widely used databases in the literature, and the results were compared to the state-of-the-art. Results compatible with state-of-the-art were achieved on the "GiantSteps" evaluation database achieving an accuracy (Type 2 - ACC2) of 92.6\% with the Morlet and Shannon mother wavelets. |
Palavras-chave: | Andamento musical Wavelet Escalograma Rede neural convolucional Aumento artificial de dados |
CNPq: | CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA |
Idioma: | por |
País: | Brasil |
Editora / Evento / Instituição: | Universidade Federal da Bahia |
Sigla da Instituição: | UFBA |
metadata.dc.publisher.department: | Escola Politécnica |
metadata.dc.publisher.program: | Departamento de Engenharia Elétrica (DEEC) |
Citação: | VIANA, Luiz Alberto Guimarães. Estimativa de Andamento Musical Através de Escalogramas Wavelet e Redes Neurais Convolucionais. 2023. 83f. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Federal da Bahia, Salvador, 2023. |
Tipo de Acesso: | Attribution 3.0 Brazil |
metadata.dc.rights.uri: | http://creativecommons.org/licenses/by/3.0/br/ |
URI: | https://repositorio.ufba.br/handle/ri/36909 |
Data do documento: | 13-Fev-2023 |
Aparece nas coleções: | Dissertação (PPGEE) |
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Dissertação Mestrado - Viana, L.A.G. - Estimativa de Andamento Musical.pdf | Viana, L. A. G. - Estimativa de Andamento Musical | 48,26 MB | Adobe PDF | Visualizar/Abrir |
Este item está licenciada sob uma Licença Creative Commons