Please use this identifier to cite or link to this item: https://repositorio.ufba.br/handle/ri/38907
metadata.dc.type: Trabalho de Conclusão de Curso
Title: Aplicação de redes neurais convolucionais na classificação de efeitos de guitarra presentes em faixas de áudio
Other Titles: Application of convolutional neural networks for the classification of guitar effects in audio recordings
metadata.dc.creator: Correia, Pedro Augusto Dultra Neves
metadata.dc.contributor.advisor1: Fernandes Junior, Antônio Carlos Lopes
metadata.dc.contributor.referee1: Simas Filho, Eduardo Furtado
metadata.dc.contributor.referee2: Viana, Luiz Alberto Guimarães
metadata.dc.description.resumo: Extrair informações a respeito da aplicação de um efeito de pedal de guitarra a um áudio é uma das tarefas do campo da análise de conteúdo musical. Este trabalho investiga a viabilidade de utilização de duas representações de tempo-frequência de um áudio, a Hybrid Constant Q-Transform (HCQT) e o escalograma wavelet para a construção de um classificador baseado em uma rede neural convolucional capaz de identificar qual efeito está sendo aplicado em faixas de áudio pré-gravadas. São geradas 4 diferentes representações para dois datasets contendo áudios de guitarra com efeitos de pedal sendo aplicados a eles, isolados ou em conjunto com outros instrumentos, para realizar o processo de treinamento da rede neural, dividindo os conjuntos de dados fornecidos para a mesma através do método k-fold para calcular a acurácia de cada modelo. Foi possível obter um bom desempenho para a classificação utilizando a HCQT, com acurácia simples de 95,9% em um dos conjuntos de dados, superando o erro humano teórico para especialistas nesse problema e com um desempenho similar ao obtido por outros trabalhos recentes dessa mesma tarefa.
Abstract: Extracting information about a guitar effects pedal being applied to an audio is oneof the tasks available for the field of musical content analysis. This study investigates the viability of the usage of two time-frequency representations of an audio, the HCQT and the wavelet scalogram to build a classifier based on a convolutional neural network that’s able to identify what effect is being applied in a pre-recorded audio. Four different representations are generated for two datasets that contain electric guitar recordings with pedal effects being applied to them, isolated or alongside other instruments, so that the neural network can be trained with the provided datasets being split through the k-fold method to calculate the accuracy of each model. The classifier built using the HCQT managed to perform well and was able to reach accuracy levels of 95.9% in one of the datasets, a value greater than what is achieved by a human expert on this problem, as well as a performance comparable to other recent studies for the same task.
Keywords: MIR
redes neurais
aprendizado de máquina
redes neurais convolucionais
HCQT
wavelet
escalograma
espectrograma
MFCC
GFCC
pedais de guitarra
metadata.dc.subject.cnpq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
metadata.dc.language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal da Bahia
metadata.dc.publisher.initials: UFBA
metadata.dc.publisher.department: Escola Politécnica
URI: https://repositorio.ufba.br/handle/ri/38907
Issue Date: 13-Dec-2023
Appears in Collections:Trabalho de Conclusão de Curso (Graduação) - Engenharia da Computação (Escola Politécnica)

Files in This Item:
File Description SizeFormat 
Monografia Versão Definitiva - Pedro Augusto Dultra Neves Correia.pdf4,67 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.