Skip navigation
Universidade Federal da Bahia |
Repositório Institucional da UFBA
Use este identificador para citar ou linkar para este item: https://repositorio.ufba.br/handle/ri/38907
Tipo: Trabalho de Conclusão de Curso
Título: Aplicação de redes neurais convolucionais na classificação de efeitos de guitarra presentes em faixas de áudio
Título(s) alternativo(s): Application of convolutional neural networks for the classification of guitar effects in audio recordings
Autor(es): Correia, Pedro Augusto Dultra Neves
Primeiro Orientador: Fernandes Junior, Antônio Carlos Lopes
metadata.dc.contributor.referee1: Simas Filho, Eduardo Furtado
metadata.dc.contributor.referee2: Viana, Luiz Alberto Guimarães
Resumo: Extrair informações a respeito da aplicação de um efeito de pedal de guitarra a um áudio é uma das tarefas do campo da análise de conteúdo musical. Este trabalho investiga a viabilidade de utilização de duas representações de tempo-frequência de um áudio, a Hybrid Constant Q-Transform (HCQT) e o escalograma wavelet para a construção de um classificador baseado em uma rede neural convolucional capaz de identificar qual efeito está sendo aplicado em faixas de áudio pré-gravadas. São geradas 4 diferentes representações para dois datasets contendo áudios de guitarra com efeitos de pedal sendo aplicados a eles, isolados ou em conjunto com outros instrumentos, para realizar o processo de treinamento da rede neural, dividindo os conjuntos de dados fornecidos para a mesma através do método k-fold para calcular a acurácia de cada modelo. Foi possível obter um bom desempenho para a classificação utilizando a HCQT, com acurácia simples de 95,9% em um dos conjuntos de dados, superando o erro humano teórico para especialistas nesse problema e com um desempenho similar ao obtido por outros trabalhos recentes dessa mesma tarefa.
Abstract: Extracting information about a guitar effects pedal being applied to an audio is oneof the tasks available for the field of musical content analysis. This study investigates the viability of the usage of two time-frequency representations of an audio, the HCQT and the wavelet scalogram to build a classifier based on a convolutional neural network that’s able to identify what effect is being applied in a pre-recorded audio. Four different representations are generated for two datasets that contain electric guitar recordings with pedal effects being applied to them, isolated or alongside other instruments, so that the neural network can be trained with the provided datasets being split through the k-fold method to calculate the accuracy of each model. The classifier built using the HCQT managed to perform well and was able to reach accuracy levels of 95.9% in one of the datasets, a value greater than what is achieved by a human expert on this problem, as well as a performance comparable to other recent studies for the same task.
Palavras-chave: MIR
redes neurais
aprendizado de máquina
redes neurais convolucionais
HCQT
wavelet
escalograma
espectrograma
MFCC
GFCC
pedais de guitarra
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
Idioma: por
País: Brasil
Editora / Evento / Instituição: Universidade Federal da Bahia
Sigla da Instituição: UFBA
metadata.dc.publisher.department: Escola Politécnica
URI: https://repositorio.ufba.br/handle/ri/38907
Data do documento: 13-Dez-2023
Aparece nas coleções:Trabalho de Conclusão de Curso (Graduação) - Engenharia da Computação (Escola Politécnica)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Monografia Versão Definitiva - Pedro Augusto Dultra Neves Correia.pdf4,67 MBAdobe PDFVisualizar/Abrir
Mostrar registro completo do item Visualizar estatísticas


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.