Fonética Forense: o uso da fusão de escores para verificação de locutor independente de texto

Mayara Ferreira da Silva, Dênis Fernandes, Maria Cristina Felippeto de Castro

Resumo


Este artigo apresenta uma visão geral acerca de Verificação de Locutor Independente de Texto, demonstrando o funcionamento básico de um sistema baseado na aplicação do método da fusão de escores. Detectado um ponto a ser trabalhado dentro da etapa de extração de características, objetiva-se determinar coeficientes ou um conjunto destes, relevantes para discriminação do locutor, com o intuito de minimizar a EER (Equal Error Rate). Primeiramente, é redigida uma breve introdução ao projeto, contextualizando a proposta, e uma revisão sucinta do estado-da-arte. Logo, apresenta-se a metodologia aplicada e os resultados obtidos. Por fim, são feitas as considerações finais a respeito do trabalho e elencadas as perspectivas futuras em torno das pesquisas de Verificação de Locutor Independente de Texto. Com este trabalho atingiu-se uma redução de 4% na EER em comparação ao sistema de referência. Os resultados mostraram que a fusão de escores conduziu a resultados superiores aqueles obtidos com o procedimento usualmente adotado.

Palavras-chave


Fonética Forense; Reconhecimento de Voz; Verificação de Locutor; Fusão de Escores; Modelo de Mistura Gaussiana

Texto completo:

PDF

Referências


J.P.C. JR. Speaker Recognition: a tutorial. Proceedings of the IEEE 85(9), 1437-1462, 1997.

M.A. Hossan; S. Memon; M.A. Gregory. A novel approach for MFCC feature extraction. 4th International Conference on Signal Processing and Communication Systems (ICSPCS), 2010.

D.A. Reynolds; T.F. Quatieri; R.B. Dunn. Speaker Verification Using Adapted Gaussian Mixture Models. Digital Signal Processing. 10, 19-41, 2000.

W.M. Campbell, D.E. Sturim, D.A. Reynolds. Support vector machines using GMM supervectors for speaker verification. Signal Proces. Letters 13(5), 308-311, 2006.

F. Bimbot, J.F. Bonastre, C. Fredouille, G. Gravier, I.M. Chagnolleau, S. Meignier, T. Merlin, J.O. Garcia, D.P. Delacrétaz, D.A. Reynolds. A tutorial on Text-Independent Speaker Verification. Eurasip Journal on Applied Signal Processing. 4, 430-451, 2004.

J. P. Campbell, W. Shen, W.M. Campbell, R. Schwartz, J.-F. Bonastre, D. Matrouf. Forensic speaker recognition. Signal Processing Magazine, IEEE 26(2), 95-103, 2009.

S.Z. Li; A.K. Jain. Encyclopedia of Biometrics. Springer, 2009.

U. Bhattacharjee; K. Sarmah. A Multilingual Speech Database for Speaker Recognition. IEEE International Conference on Signal Processing, Computing and Control (ISPCC), 2012.

W.M. Hartmann. Signals, sound and sensation. Springer Science & Business Media, 1997.

R. Togneri; D. Pullella. An overview of Speaker Identification: Accuracy and Robustness Issues. IEEE Circuits and Systems Magazine, 11(2), 23-61, 2011.

K. Modi; L. Saul. Text Independent Speaker Verification System, 2006.

A.C. Gonçalves. Processamento Digital de Sinais. Estimação Paramétrica. Universidade Federal do Paraná, 2007.

D.A. Reynolds. Speaker identification and verification using Gaussian mixture speaker models. Speech Communication 17, 91-108, 1995.




DOI: http://dx.doi.org/10.15260/rbc.v4i2.92

Creative Commons License
This work is licensed under a Creative Commons Attribution 3.0 License.