Suzete E. N. Correia
Centro Federal de Educação Tecnológica de Minas Gerais
Network
Latest external collaboration on country level. Dive into details by clicking on the dots.
Publication
Featured researches published by Suzete E. N. Correia.
acm symposium on applied computing | 2008
Silvana Cunha Costa; Benedito G. Aguiar Neto; Joseana Macêdo Fechine; Suzete E. N. Correia
Traditional methods to diagnose laryngeal pathologies such as laryngoscopy are considered invasive and uncomfortable. Methods based on acoustic analisys of speech signals have been investigated in order to diminish the number of laryngoscopical exams. Digital signal processing techniques have been used to perform an acoustic analysis for vocal quality assessment due to the simplicity and the non-invasive nature of the measurement procedures. Their employment is of special interest, as they can provide an objective diagnosis of pathological voices, and may be used as complementary tool in laryngoscopy. The degree of reliability and effectiveness of discriminating process of pathological voices from normal ones depends on the characteristics and parameters of voice used to train the employed classifier. This paper aims at evaluating the performance of the Linear Prediction Coding (LPC)-based cepstral analysis to discriminate pathological voices of speakers affected by vocal fold edema. For this purpose, LPC, cepstral, weighted cepstral, delta cepstral weighted delta cepstral mel-cepstral coefficients and are used. A vector-quantizing-trained distance classifier is used in the discrimination process.
issnip biosignals and biorobotics conference biosignals and robotics for better and safer living | 2011
Raissa Tavares; Nathália Brunet; Silvana Cunha Costa; Suzete E. N. Correia; Benedito G. Aguiar Neto; Joseana Macêdo Fechine
This work aims at investigating the combination of classifiers based on three different entropy measurements (Shannon, Relative and Tsallis) and four cepstral coefficients (cepstral, delta-cepstral, weighted cepstral and weighted delta cepstral) to discriminate pathological voices under Reinkes Edema from normal ones. The performance of the combined classifiers is evaluated considering the average and product rules. Classification accuracy is improved when combinations of acoustic features were considered, compared to individual classifiers results.
acm symposium on applied computing | 2008
Silvana Cunha Costa; Suzete E. N. Correia; Hanniere Falcão; Náthalee Almeida; Benedito G. Aguiar Neto; Joseana Macêdo Fechine
Digital signal processing techniques have been used to analyze vocal disorders caused by laryngeal pathologies. Laryngoscopical exams commonly used for detection of these diseases are invasive methods that cause discomfort to the patients. Because of its noninvasive nature, acoustical analysis of the temporal and spectral features of the voice signal can be used as an auxiliary technique in laringoscopical exams. This analysis may be applied for detection of vocal diseases and the evaluation of the vocal quality of patients subjected to surgical processes or medical treatments in the vocal folds. This work aims at investigating the behavior of entropy measures in disordered voices influenced by the presence of pathologies in the vocal folds. For this purpose, the Shannon entropy and the relative entropy are implemented, and their behavior for normal and pathological voices affected by vocal fold edemas is observed. The measurement of the entropy efficiency in discriminating between normal and pathological voices is obtained.
Journal of Voice | 2018
Leonardo Wanderley Lopes; Vinícius Jefferson Dias Vieira; Silvana Cunha Costa; Suzete E. N. Correia; Mara Behlau
The objective of this study was to analyze the accuracy of recurrence quantification measurements (RQMs) in discriminating between individuals with and without voice disorders. This study consisted of a total of 541 recorded voice samples from normal and dysphonic subjects. All subjects recorded a sustained vowel /Ɛ/ and underwent a laryngoscopic examination of the larynx. Twelve RQMs and three parameters related to the topology of the phonatory system were extracted from the samples, for a total of 15 measures. The classification used quadratic discriminant analysis and includes the measures of accuracy, sensitivity, and specificity. Single measurements such as Shannons entropy, average diagonal length, and transitivity had only acceptable performance ratings (≥70%) in discriminating between individuals with and without voice disorders. The combination of the parameters average diagonal length, Shannons entropy, trapping time, length of the longest vertical line, tau, imbedding dimension, neighborhood radius, and transitivity produced the highest accuracy in discrimination (83.27%). Therefore, the performance of RQMs related to the formation of diagonal lines in classifying individuals with and without voice disorders was acceptable at ≥70%. A combination of RQMs showed good performance in discriminating between the study groups, with higher sensitivity and specificity.
International Journal of Bio-inspired Computation | 2017
Taciana A. Souza; Vinícius Jefferson Dias Vieira; Micael A. Souza; Suzete E. N. Correia; Silvana Cunha Costa; Washington C. de A. Costa
Laryngeal pathologies directly affect the quality of the voice. In the last years, digital signal processing techniques have been applied for detection of vocal fold pathologies through speech signal analysis. In this work, a binary Particle Swarm Optimization (PSO) algorithm using Multilayer Perceptron (MLP) neural network is employed for the selection of the most significative features in a pathological voice detection system. The discrimination between healthy and pathological speech signals are obtained by 52 Haralick texture features, extracted from two-dimensional wavelet coefficients of the speech signals recurrence plots. The fitness function adopted is based in the maxima accuracy rate. Experimental results show that the use of PSO increased the accuracy rates with a minimum number of features.
ChemBioChem | 2016
Vinícius Jefferson Dias Vieira; Silvana Cunha Costa; Washington C. de A. Costa; Suzete E. N. Correia; Joseana Macêdo Fechine Régis de Araújo
This article deals with the application of Linear Predictive Coding (LPC) and MLP neural networks in classifying healthy and voices affected by laryngeal pathologies (vocal fold edema, nodules and paralysis). The system performance is evaluated by varying the order of the LPC coefficients from 8 to 32. Classification rates above 98% were obtained in the healthy and pathological voice discrimination. Among pathologies, the accuracy values were higher than 90%. Keywords— Processing of Speech Signals, Linear Predictive Coding, Neural Network MLP, Laryngeal Pathologies.
ChemBioChem | 2016
Suzete E. N. Correia; Washington C. de A. Costa; Silvana Cunha Costa
O presente trabalho emprega a energia normalizada dos coeficientes de detalhes obtidos por meio da transformada wavelet discreta, para distinguir entre sinais de vozes saudáveis de sinais afetados por edema de Reinke e nódulos nas pregas vocais. A wavelet de Daubechies de ordem 35 é usada para decompor os sinais em oito níveis de resolução. As características extraídas são avaliadas individualmente e de forma combinada, com o intuito de determinar as faixas de frequência que fornecem a melhor discriminação entre as vozes saudáveis e patológicas. Para a classificação, a análise discriminante quadrática é empregada. Os resultados atestam que o quarto nível de resolução provê as melhores taxas de reconhecimento. Uma acurácia de 97% foi obtida na discriminação entre os sinais de vozes saudáveis e os sinais afetados por nódulos vocais. Palavras-Chave—Detecção automática de patologias laríngeas; Transformada Wavelet Discreta, Análise Discriminante Quadrática; Abstract— The present work uses the normalized energy of the detail coefficients obtained from Discrete Wavelet Transform to distinguish health voices from that affected by Reinke ́s edema and nodules in vocal folds. The Daubechies wavelet of order 35 is used to decompose the signals at eight resolution levels. The extracted features are evaluated individually and in a combined way in order to determine the frequency bands that provide the best discrimination between healthy and pathological voices. For the classification, quadratic discriminant analysis technique is employed. Results show that the fourth resolution level provides the best recognition rates. An accuracy of 97% is achieved in the discrimination between healthy voices and those affected by vocal nodules. The present work uses the normalized energy of the detail coefficients obtained from Discrete Wavelet Transform to distinguish health voices from that affected by Reinke ́s edema and nodules in vocal folds. The Daubechies wavelet of order 35 is used to decompose the signals at eight resolution levels. The extracted features are evaluated individually and in a combined way in order to determine the frequency bands that provide the best discrimination between healthy and pathological voices. For the classification, quadratic discriminant analysis technique is employed. Results show that the fourth resolution level provides the best recognition rates. An accuracy of 97% is achieved in the discrimination between healthy voices and those affected by vocal nodules. Keywords—Automatic laryngeal pathology detection; Discrete Wavelet Transform, Quadratic Discriminant Analysis; I. INTRODUÇÃO A produção da fala é um processo complexo que envolve movimentos musculatórios, respiração, controle do cérebro e um sistema sensor de realimentação auditiva. Alterações estruturais nesses mecanismos podem causar mudanças no processo articulatório da fala, causando desordens vocais. Certas alterações laríngeas impedem que as pregas vocais tenham uma vibração glotal harmônica, provocando modificações significativas no sinal de voz [1]. Embora a patologia esteja localizada no sistema vibratório pode, ainda, afetar o movimento articulatório regular durante a produção da fala. Além disso, componentes do sistema de ressonância podem ser afetados, resultando em mudanças no trato vocal, produzindo irregularidades tanto nas modificações da frequência fundamental quanto na envoltória espectral do sinal [1]. Hartl et al. [2] atestam que nos sinais de vozes patológicos, os níveis de energia aumentam nas médias e altas frequências e decrescem nas baixas em relação aos sinais de vozes saudáveis. A detecção precoce de patologias laríngeas aumenta significativamente a eficácia do tratamento. Para auxiliar o diagnóstico médico, técnicas de processamento digital de sinais podem ser usadas para avaliar a qualidade vocal, através da análise acústica. Estas técnicas podem ser associadas às técnicas convencionais baseadas na observação clinica para melhorar o diagnóstico e o tratamento das desordens vocais. Além disso, traz como benefícios um exame menos desconfortável para o paciente, uma avaliação quantitativa dos critérios de avaliação da qualidade da voz e possibilitam o desenvolvimento de sistemas automáticos de auxílio ao diagnóstico por computador com baixo custo [3]. Para a detecção eficiente de uma determinada patologia, torna-se necessário escolher características ou parâmetros capazes de capturar a desordem presente no sinal de voz causada pela patologia. A transformada wavelet permite a análise de sinais em resoluções distintas, de modo que, em cada escala, aspectos diferentes possam ser observados. Como a análise com wavelets fornece informações do sinal tanto no domínio do tempo quanto no domínio da frequência, torna-se uma ferramenta de enorme importância em processamento digital de diversos tipos de sinais, inclusive os de vozes saudáveis ou patológicas [4]. Diversos trabalhos, na literatura recente, empregam as wavelets como extratores de características na discriminação entre vozes saudáveis e patológicas. A maioria utiliza medidas baseadas na energia e na entropia de Shannon dos coeficientes wavelets para a representação dos sinais de voz. As wavelets são aplicadas de diversas formas, tais como a transformada wavelet discreta [4-7], a transformada wavelet contínua [8] e as wavelets packets [3, 9 -12]. Neste artigo, um novo método para a detecção automática de patologias laríngeas baseado na transformada wavelet discreta é apresentado. Como parâmetro, é empregado a energia normalizada dos coeficientes de detalhes obtidos por meio da wavelet Daubechies de ordem 35, em oito níveis de resolução. As características extraídas são avaliadas individualmente, por nível de resolução, e combinadas com o intuito de determinar as faixas de frequência que fornecem a maior separação entre os sinais de vozes saudáveis e os sinais afetados por edema de Reinke e nódulos nas pregas vocais. Para a classificação é empregada a análise discriminante quadrática. O artigo está organizado da seguinte maneira: Na Seção II é apresentada uma breve revisão da transformada wavelet discreta e do tipo de wavelet empregada. Na Seção III são apresentadas a base de dados e a metodologia empregada. Os resultados na Seção IV e, por fim, na Seção V, as considerações finais. II. TRANSFORMADA WAVELET DISCRETA A transformada wavelet é uma técnica usada para representar, descrever e processar sinais através da combinação linear de funções elementares. Na análise multirresolucional são empregadas, na decomposição, duas funções ortogonais conhecidas como wavelet mãe, ψ(t), e função escalonamento, (t). Todas as funções base são obtidas pela translação e escalonamento dessas funções: ), 2 ( 2 ) ( , k t t j j k j (1) ), 2 ( 2 ) ( , k t t j j k j (2) em que j e k são inteiros que representam, respectivamente, a escala ou resolução e a translação. Uma função f(t) pode ser decomposta na j-ésima escala em termos da função wavelet e da função escalonamento por: ), ) ( ) ( ) ( ) ( ( ) ( , k , t k d t k c t f k j j k j j (3) em que cj(k) e dj(k) correspondem aos coeficientes de aproximação e detalhe, definidos como: m j j m c k m h k c ), ( ) 2 ( ) ( 1 (4) m j j m c k m g k d ). ( ) 2 ( ) ( 1 (5) As funções h(n) e g(n) são, respectivamente, as respostas ao impulso de filtros de análise passa-baixas e passa-altas. As equações (4) e (5) mostram que os coeficientes wavelets cj(k) e dj(k) são obtidos a partir de convoluções discretas com as respostas ao impulso h(n) e g(n). O fator 2k, no índice dos filtros, representa a decimação por um fator 2. Para cada nível de resolução j é obtida uma aproximação cj(k) e um detalhe dj(k). Os termos aproximação e detalhe correspondem, respectivamente, às componentes de baixas e altas frequências do sinal analisado. As informações extraídas em uma dada resolução são mantidas nos níveis de resolução superiores. Se o sinal original cj-1(k) possui N amostras, então os sinais cj(k) e dj(k) possuem 2 j N amostras. Dessa forma, a decomposição wavelet é formada por sequências que possuem o mesmo tamanho do sinal de entrada. A Figura 1 ilustra o algoritmo de decomposição wavelet uni-dimensional, proposto por Mallat [13], conhecido como transformada wavelet rápida. Fig. 1. Algoritmo de decomposição wavelet para três níveis de resolução. As wavelets de Daubechies são uma família, formada por várias funções que possuem filtros de comprimento diferentes [14]. Os nomes das wavelets são descritos por dbN, em que N é o comprimento do filtro ou ordem da wavelet. Tais wavelets são ortogonais e possuem suporte compacto, ou seja, as respostas ao impulso dos filtros h(n) e g(n) são finitas e os somatórios que definem a transformada wavelet discreta são finitos. Segundo Fonseca et al. [4], as wavelets de Daubechies são muito utilizadas para análise de sinais de voz. III. MATERIAIS E MÉTODOS A. Base de Dados Os dados utilizados neste trabalho fazem parte da base de dados gravada pelo Massachusetts Eye and Ear Infirmary (MMEEI) Voice and Speech Lab [15]. Essa base de dados foi construída para auxílio na análise perceptual de vozes desordenadas para aplicações clínicas e de pesquisa e tem sido largamente utilizada em diversos trabalhos relacionados à análise acústica de sinais de voz. A mesma inclui amostras de pacientes com uma grande variedade de desordens da voz provocadas por causas orgânicas, neurológicas, traumáticas e psicogênicas, entre outras. Nesta pesquisa, são utilizados 53 arquivos de vozes saudáveis e 62 sinais de vozes patológicas, dentre as quais 44 são afetadas por edema de Reinke e 18 por nódulos nas pregas vocais. Dentre os sons produzidos no trato vocal, as vogais sustentadas e algumas consoantes sonoras são as mais facilmente distorcidas na presença da patologia, por isso são usadas para validar sistemas de detecção automática de sinais de vozes patológicas [8]. Todos os sinais utilizados são da
ChemBioChem | 2015
Mikaelle O. Santos; Washington C. de A. Costa; Silvana Cunha Costa; Suzete E. N. Correia; Leonardo Wanderley Lopes
Resumo—A alta prevalência de desvios vocais na infância exige uma atenção especial na avaliação e diagnóstico das vozes infantis. Técnicas de processamento digital de sinais podem ser empregadas para auxiliar outros métodos de avaliação de distúrbios da voz, tais como análise otorrinolaringológica e análise perceptivo-auditiva. A transformada wavelet é uma ferramenta interessante para análise acústica por permitir a representação dos sinais em faixas de frequências diferentes. Neste trabalho, as medidas de energia normalizada e entropia dos coeficientes de detalhes da transformada wavelet discreta são empregadas na avaliação do grau de intensidade do desvio vocal em crianças. São avaliadas 45 wavelets da família de Daubechies em nove níveis de resolução. A classificação dos sinais é realizada empregando a Análise Discriminante Quadrática. A wavelet de Daubechies de ordem 12 apresentou melhor resultado em termos de acurácia e custo computacional.
2015 Latin America Congress on Computational Intelligence (LA-CCI) | 2015
Taciana A. Souza; Micael A. Souza; Washington C. de A. Costa; Silvana Cunha Costa; Suzete E. N. Correia; Vinícius Jefferson Dias Vieira
Laryngeal pathologies directly affect the quality of the voice. In the last years, digital signal processing techniques have been applied for detection of vocal fold pathologies through speech signal analysis. In this work, a binary Particle Swarm Optimization (PSO) algorithm using Multilayer Perceptron (MLP) neural network is employed for the selection of the most significative features in a pathological voice detection system. The discrimination between healthy and pathological speech signals are obtained by 52 Haralick texture features, extracted from two-dimensional wavelet coefficients of the speech signals recurrence plots. The fitness function adopted is based in the maxima accuracy rate. Experimental results show that the use of PSO increased the accuracy rates with a minimum number of features.
2015 International Workshop on Telecommunications (IWT) | 2015
Taciana A. Souza; Micael A. Souza; Silvana Cunha Costa; Washington C. de A. Costa; Suzete E. N. Correia; Vinícius Jefferson Dias Vieira
This work proposes an efficient texture classification strategy performed in the wavelet domain in order to characterize healthy and pathological speech signals from recurrence plots (RP). The two-dimensional wavelet transform is applied to the recurrence plots at one resolution level. Thirteen Haralick texture features are obtained from each approximation and detail subband coefficients. In classification, multilayer perceptron (MLP) neural networks with cross validation are employed. Classification accuracy is improved and the number of features is reduced by particle swarm optimization (PSO). Results suggest that this method may be useful for pathological voice discrimination.
Collaboration
Dive into the Suzete E. N. Correia's collaboration.
Joseana Macêdo Fechine Régis de Araújo
Federal University of Campina Grande
View shared research outputs