Summary: | Submitted by Dirceu Melo (dirceumelo@ymail.com) on 2018-04-05T09:57:27Z
No. of bitstreams: 1
TESE_DIRCEU_MELO_ABNT.pdf: 9074956 bytes, checksum: ab3e41a80f3202028098ae8591fc5ba4 (MD5) === Approved for entry into archive by Maria Auxiliadora da Silva Lopes (silopes@ufba.br) on 2018-04-10T13:58:44Z (GMT) No. of bitstreams: 1
TESE_DIRCEU_MELO_ABNT.pdf: 9074956 bytes, checksum: ab3e41a80f3202028098ae8591fc5ba4 (MD5) === Made available in DSpace on 2018-04-10T13:58:44Z (GMT). No. of bitstreams: 1
TESE_DIRCEU_MELO_ABNT.pdf: 9074956 bytes, checksum: ab3e41a80f3202028098ae8591fc5ba4 (MD5) === O advento da tecnologia digital favoreceu um extraordinário aumento da capacidade de armazenamento
e compartilhamento de arquivos de conteúdo musical, o que motivou algumas
corporações a incluírem em suas plataformas, algoritmos computacionais para o gerenciamento
automático de grandes bibliotecas de música digital. A classificação de gêneros musicais tem
chamado a atenção como uma das formas de organização deste tipo de biblioteca, e nas últimas
décadas, tem se tornado objeto de estudo de pesquisadores de um campo multidisciplinar
emergente conhecido como Recuperação de Informações Musicais (MIR). A maioria dos trabalhos
desse campo de pesquisa adota a estratégia de categorização de gêneros musicais usando
a extração de atributos (ritmo, melodia e timbre) como uma de suas etapas essenciais. Dentre
esses atributos, o ritmo desempenha um papel muito importante na definição do estilo musical.
O estudo da rítmica em sinais de áudio inclui a investigação de características de regularidade
de seus transientes. A auto-similaridade dos sinais pode dar informações relevantes sobre essa
regularidade, e desta forma, contribuir para o estudo da complexidade rítmica de uma música.
A maioria dos trabalhos do campo de processamento de sinais têm estudado a auto-similaridade
em música digital utilizando o histograma de batidas. Existe uma carência na diversidade de
descritores rítmicos para sinais de áudio, e o campo de processamento de sinais está restrito à
técnicas baseadas em representações tempo-frequência. Novos tipos de descritores poderiam
colaborar com os algoritmos tradicionais, para a melhorar a extração de características rítmicas,
oferecendo outro ponto de vista para essa tarefa. Esta tese propõe uma metodologia para
identificar padrões de auto-similaridade em sinais de áudio, usando propriedades topológicas de
redes, denominado de Descritor de Visibilidade em Flutuações de Variância (DVFV). Este descritor
é constituído de: Modularidade - Q, Número de Comunidades - Nc, Grau Médio - < k >
e Densidade (Delta). Os resultados experimentais obtidos com o cálculo do DVFV em 1.000 grafos
de visibilidade, correspondentes a 1.000 sinais, categorizados em 10 gêneros musicais, mostraram
que o DVFV é capaz de detectar gráfica e numericamente, padrões de auto-similaridade
em sinais classificados em gêneros musicais, de estabelecer uma relação hierárquica de categorias
usando propriedades de redes, e de contribuir para que um sistema de classificação alcance
precisão comparável ou superior a trabalhos correlatos. === ABSTRAC The advent of digital technology favored an extraordinary increase in the storage capacity and
sharing of music content files, which motivated some corporations to include in their platforms
computational algorithms for the automatic management of large digital music libraries. The
classification of musical genres has attracted attention as one of the forms of organization of
this type of library, and in recent decades, has become the object of study of researchers of
an emerging multidisciplinary field known as Music Information Retrieval (MIR). Most of the
works in this field of research adopt the strategy of categorization of musical genres using the
extraction of attributes (rhythm, melody and timbre) as one of its essential stages. Among these
attributes, rhythm plays a very important role in the definition of musical style. The study of
rhythmic in audio signals includes the investigation of regularity characteristics of their transients.
The self-similarity of the signals can give relevant information about this regularity, and
thus contribute to the study of the rhythmic complexity of a song. Most of the works of the signal
processing field have studied self-similarity in digital music using the beat histogram. There
is a lack in the diversity of rhythm descriptors for audio signals, and the signal processing field
is restricted to techniques based on time-frequency representations. New types of descriptors
could collaborate with traditional algorithms to improve the extraction of rhythmic features,
providing another point of view for this task. This thesis proposes a methodology to identify
self-similarity patterns in audio signals, using topological properties of networks, called Variance
Fluctuation Visibility Descriptor (DVFV). This descriptor consists of: Modularity - Q,
Number of Communities - Nc, Average Degree - < k > and Density (Delta). The experimental
results obtained with the calculation of DVFV in 1.000 graphs of visibility, corresponding to
1.000 signs, categorized in 10 musical genres, showed that the DVFV is able to detect graphically
and numerically, self-similarity patterns in signals classified in musical genres, establish a
hierarchical relationship of categories using properties of networks, and contribute for a classification
system to reach comparable or superior precision to related works.
|