PPGEE

Programa de Pós-graduação
em Engenharia Elétrica

UFRGS

Defesa Pública da Tese de Doutorado do Mestre em Engenharia JOEL AUGUSTO LUFT

Data: 21/08/2019 - quarta-feira
Horário: 14h00min
Local: Salão de Eventos do Instituto Eletrotécnico da UFRGS (Av. Osvaldo Aranha, 103 - 1º andar - Campus Centro)

Banca Examinadora:

Prof. Dr. Claudio Rosito Jung, PPGC-UFRGS (Relator)
Prof. Dr. Márcio Holsbach Costa - PPGEEL-UFSC
Prof. Dr. Gilson Inácio Wirth - PPGEE-UFRGS
Prof. Dr. Valner João Brusamarello - PPGEE-UFRGS
Prof. Dr. Edison Pignaton de Freitas - PPGEE-UFRGS
Orientador: Prof. Dr. Altamiro Amadeu Susin - PPGEE-UFRGS

Título da tese: "SEPARAÇÃO DE SINAIS DE ÁUDIO ATRAVÉS DA DENSIDADE DE POTÊNCIA ESPECTRAL DIRECIONAL"

Resumo:

"A separação de fontes sonoras é uma das principais preocupações para muitas aplicações comerciais em sistemas de comunicação, aparelhos auditivos, ou sistemas de reconhecimento de fala. O número reduzido de microfones também pode ser uma limitação em tais aplicações, o que reforça a importância em casos subdeterminados onde o número de fontes a serem separadas excede o número de microfones. Este trabalho propõe novos métodos para separação de sinais de áudio baseados na estimativa de Densidade Espectral de Potência (PSD - Power Spectral Density) usando a diretividade de beamformers para estimar a PSD de cada fonte sonora. O primeiro método proposto utiliza a combinação do uso de mínimos quadrados com restrição não negativa para obter a densidade de potência espectral na direção de interesse. Abordagens anteriores na literatura abordam o problema apenas para sinais de fontes não correlacionadas. Também é proposto um novo método de separação baseado na PSD direcional que tolera correlação entre as fontes e sua aplicação nos casos em que o número de fontes excede o número de microfones. Os métodos propostos utilizam as Funções de Transferência Acústica (ATFs - Acoustic Transfer Functions) entre fonte sonora e os microfones, Como as ATFs estão frequentemente indisponíveis e são difíceis de obter em casos reais, as Funções de Transferência Relativa (RTFs) é apresentado para os métodos propostos. As RTFs podem ser obtidas diretamente dos sinais dos microfones. Neste trabalho também são propostos métodos para estimar as RTFs quando existem várias fontes. Um dos métodos utiliza detecção de picos em histogramas suavizados integrados com as estimativas de PSD dos métodos de separação. Outro método usa um algoritmo weighted Fuzzy C-Means (wFCM) empregando pesos baseados na distribuição Laplacian para enfatizar pistas confiáveis no processo de agrupamento. Os resultados da simulação mostram que nossos métodos superam outras abordagens e, além disso, suportam a correlação de sinais e podem lidar com configurações subdeterminadas.

Palavras-chave: Separação de sinais, Arranjo de microfones, Densidade de Potência Espectral, Função de Transferência Relativa."