Please use this identifier to cite or link to this item:
https://repositorio.ufba.br/handle/ri/38907
metadata.dc.type: | Trabalho de Conclusão de Curso |
Title: | Aplicação de redes neurais convolucionais na classificação de efeitos de guitarra presentes em faixas de áudio |
Other Titles: | Application of convolutional neural networks for the classification of guitar effects in audio recordings |
metadata.dc.creator: | Correia, Pedro Augusto Dultra Neves |
metadata.dc.contributor.advisor1: | Fernandes Junior, Antônio Carlos Lopes |
metadata.dc.contributor.referee1: | Simas Filho, Eduardo Furtado |
metadata.dc.contributor.referee2: | Viana, Luiz Alberto Guimarães |
metadata.dc.description.resumo: | Extrair informações a respeito da aplicação de um efeito de pedal de guitarra a um áudio é uma das tarefas do campo da análise de conteúdo musical. Este trabalho investiga a viabilidade de utilização de duas representações de tempo-frequência de um áudio, a Hybrid Constant Q-Transform (HCQT) e o escalograma wavelet para a construção de um classificador baseado em uma rede neural convolucional capaz de identificar qual efeito está sendo aplicado em faixas de áudio pré-gravadas. São geradas 4 diferentes representações para dois datasets contendo áudios de guitarra com efeitos de pedal sendo aplicados a eles, isolados ou em conjunto com outros instrumentos, para realizar o processo de treinamento da rede neural, dividindo os conjuntos de dados fornecidos para a mesma através do método k-fold para calcular a acurácia de cada modelo. Foi possível obter um bom desempenho para a classificação utilizando a HCQT, com acurácia simples de 95,9% em um dos conjuntos de dados, superando o erro humano teórico para especialistas nesse problema e com um desempenho similar ao obtido por outros trabalhos recentes dessa mesma tarefa. |
Abstract: | Extracting information about a guitar effects pedal being applied to an audio is oneof the tasks available for the field of musical content analysis. This study investigates the viability of the usage of two time-frequency representations of an audio, the HCQT and the wavelet scalogram to build a classifier based on a convolutional neural network that’s able to identify what effect is being applied in a pre-recorded audio. Four different representations are generated for two datasets that contain electric guitar recordings with pedal effects being applied to them, isolated or alongside other instruments, so that the neural network can be trained with the provided datasets being split through the k-fold method to calculate the accuracy of each model. The classifier built using the HCQT managed to perform well and was able to reach accuracy levels of 95.9% in one of the datasets, a value greater than what is achieved by a human expert on this problem, as well as a performance comparable to other recent studies for the same task. |
Keywords: | MIR redes neurais aprendizado de máquina redes neurais convolucionais HCQT wavelet escalograma espectrograma MFCC GFCC pedais de guitarra |
metadata.dc.subject.cnpq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
metadata.dc.language: | por |
metadata.dc.publisher.country: | Brasil |
Publisher: | Universidade Federal da Bahia |
metadata.dc.publisher.initials: | UFBA |
metadata.dc.publisher.department: | Escola Politécnica |
URI: | https://repositorio.ufba.br/handle/ri/38907 |
Issue Date: | 13-Dec-2023 |
Appears in Collections: | Trabalho de Conclusão de Curso (Graduação) - Engenharia da Computação (Escola Politécnica) |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Monografia Versão Definitiva - Pedro Augusto Dultra Neves Correia.pdf | 4,67 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.