Impacto de diferentes métodos de extração de características na classificação de ECGs por redes neurais convolucionais

59
0

A análise de sinais bioelétricos cardíacos desempenha um papel essencial na detecção precoce de disfunções cardíacas. Entretanto, a interpretação manual dos eletrocardiogramas (ECGs) ainda é limitada por fatores subjetivos e pela complexidade dos sinais. Este trabalho propõe um modelo computacional voltado à classificação de ECGs, utilizando redes neurais convolucionais (CNNs) e diferentes métodos de processamento bioelétrico para a extração de características, incluindo as transformadas de Hilbert-Huang (HHT), Fourier (FFT), Wavelet Discreta (DWT) e os coeficientes MFCC. O objetivo é avaliar o impacto de cada técnica na representação dos sinais. A integração entre a biofísica cardíaca e a inteligência artificial representa um avanço para a medicina de precisão, ao permitir o desenvolvimento de ferramentas de suporte ao diagnóstico mais rápidas e acessíveis, contribuindo para o avanço de novas tecnologias na área da saúde.

Autores: Giovanna Venas Oliveira, Gilney Figueira Zebende, Juan A. Leyva-Cruz

Introdução

O eletrocardiograma (ECG) permanece como o exame padrão-ouro não invasivo para o diagnóstico e monitoramento de cardiopatias. A morfologia e os intervalos dos sinais de ECG fornecem indicativos cruciais para a detecção de um vasto espectro de cardiopatias, como arritmias, infartos do miocárdio e insuficiência cardíaca. Nesse cenário, a bioinformática tem se consolidado como uma ferramenta essencial para analisar a crescente quantidade de dados biológicos, dada a sua capacidade de decifrar informações complexas, tanto na genômica quanto na análise de sinais fisiológicos[1], o que a torna fundamental para acelerar o diagnóstico e a pesquisa na área da saúde.

Apesar da ampla utilização clínica dos ECGs, sua interpretação ainda depende fortemente da expertise médica, um processo que pode ser subjetivo e suscetível a erros humanos, especialmente diante de padrões sutis ou sobrepostos. O desafio científico e social que esta pesquisa busca endereçar é a necessidade de sistemas computacionais que auxiliem nas interpretações humanas, aumentando a precisão e velocidade da identificação precoce de anomalias cardíacas. Para superar este problema, a aplicação de ferramentas de bioinformática e inteligência artificial é uma estratégia essencial.

Estratégia de Pesquisa e Abordagem

O objetivo deste trabalho é propor e avaliar um modelo computacional para a classificação de cardiopatias baseado em sinais de ECG. A estratégia central é investigar como diferentes métodos de pré-processamento e extração de características impactam o desempenho de um classificador baseado em Redes Neurais Convolucionais (CNNs). O pré-processamento atua na limpeza dos ruídos do sinal, enquanto a extração de características visa a redução de dimensionalidade, transformando o sinal bruto em um conjunto de características representativas que capturam a informação relevante para a classificação [7].

Nesse contexto, o Deep learning (aprendizado profundo), como um campo emergente, tem demonstrado performance sem precedentes em diversas aplicações. Dentro desse campo, as CNNs têm sido rapidamente adotadas em estudos de imagens biomédicas devido ao seu desempenho notável [2]. O fluxo metodológico da pesquisa está ilustrado na Figura 1.

Figura 1. Fluxo metodológico para a classificação de sinais de ECG utilizando CNNs com diferentes técnicas de extração de características.

O presente trabalho utiliza um conjunto de dados composto por 197 sinais de ECG obtidos do repositório PhysioNet [5], que foram categorizados em quatro classes distintas: Ritmo Sinusal Normal (RSN), Arritmia (ARR), Infarto do Miocárdio (IM) e Insuficiência Cardíaca Congestiva (ICC) [4]. Para analisar o impacto da representação dos dados, o modelo foi treinado e avaliado com características extraídas por quatro técnicas distintas selecionadas para essa pesquisa [4]. A literatura de revisão em processamentos de sinais de ECG destaca a importância de selecionar métodos de extração de características que cubram diferentes domínios [6].

Entendendo os Métodos de Extração de Características

Para que a inteligência artificial possa classificar corretamente as cardiopatias, o sinal elétrico do coração precisa ser processado matematicamente. Nesta pesquisa, comparamos quatro abordagens distintas para extrair as informações essenciais do ECG, cada uma operando em um domínio específico:  

Transformada De Fourier (FFT)

Esta técnica decompõe o sinal do ECG em suas frequências constituintes, conforme fundamentado na teoria de processamento digital de sinais [8]. Tal feito permite identificar a presença de ritmos repetitivos. No entanto, sua principal limitação é a perda da informação temporal: a FFT informa quais frequências existem no sinal, mas não quando elas ocorrem. Isso pode dificultar a detecção de eventos cardíacos transitórios, como arritmias, que dependem da localização exata no tempo.

 

Transformada Wavelet Discreta (DWT)

Diferente da FFT, a Wavelet realiza uma análise conjunta de tempo e frequência, baseada na teoria de multirresolução estabelecida por Mallat [9]. Ela funciona aplicando filtros que decompõem o sinal em diferentes níveis de resolução. Isso permite analisar detalhes finos do sinal (altas frequências) e tendências gerais (baixas frequências) simultaneamente, facilitando a localização temporal de anomalias no ciclo cardíaco. É uma técnica robusta, embora sua eficácia dependa da escolha correta da “wavelet mãe” para a morfologia do sinal analisado.

 

Transformada de Hilbert-Huang (HHT)

O sinal cardíaco é complexo, não linear e varia ao longo do tempo, sendo uma onda não estacionária. A HHT é uma técnica adaptativa ideal para esse tipo de sinal. Proposta originalmente por Huang et al. [10], ela utiliza um processo chamado “Decomposição Empírica de Modos” (EMD) para separar o sinal em componentes oscilatórios intrínsecos, preservando as características físicas do batimento sem forçá-lo a se ajustar a formas de onda pré-definidas. Sua limitação teórica reside na suscetibilidade a efeitos de borda e à mistura de modos, o que pode introduzir distorções nas extremidades do sinal processado.

 

Coeficientes de Frequência Cepstral de Mel (MFCCs)

Originalmente desenvolvida para o reconhecimento de fala, esta técnica captura a “forma” do espectro de energia do sinal de maneira compacta, baseando-se na escala Mel, que imita a percepção auditiva humana. No contexto do ECG, Hossain et al. [11] demonstraram que os MFCCs são eficazes para extrair características que representam a textura do sinal elétrico, permitindo a identificação de padrões patológicos sutis. Contudo, como a escala é otimizada para o ouvido humano, ela pode atenuar detalhes de alta frequência que são clinicamente relevantes para o diagnóstico cardíaco.

A hipótese central é que a escolha da técnica de extração de características é um passo crítico, pois métodos diferentes podem realçar ou ocultar biomarcadores elétricos essenciais para a classificação correta pela CNN.

Conclusão

Esta pesquisa se alinha ao desafio de desenvolver novas tecnologias na área da saúde. Ao avaliar as técnicas de processamento de sinal bioelétrico, este estudo objetiva identificar as abordagens mais robustas para a modelagem computacional de ECGs.

O impacto social esperado é a contribuição para o desenvolvimento de sistemas de diagnóstico auxiliado por computador (CAD) mais precisos, rápidos e acessíveis. A união da biofísica cardíaca com o aprendizado de máquina representa um avanço significativo para a medicina de precisão. Essa abordagem, que integra o Machine Learning a estruturas de bioinformática estabelecidas, tem se mostrado fundamental para o desenvolvimento de novas ferramentas preditivas [3].

Referências

[1] Araújo, ND et al. A era da bioinformática: seu potencial e suas implicações para as ciências da saúde. Estud Biol. 2008 jan/dez;30(70/71/72):143-8 .

[2] Tang, B et al. Recent Advances of Deep Learning in Bioinformatics and Computational Biology. Front. Genet. 10:214 (2019) . doi: https://doi.org/10.3389/fgene.2019.00214

[3] Auslander, N; Gussow, AB; Koonin, EV. Incorporating Machine Learning into Established Bioinformatics Frameworks. Int. J. Mol. Sci. 2021, 22, 2903 . doi: https://doi.org/10.3390/ijms22062903

[4] Oliveira, GV; Zebende, GF. Modelo computacional para imagens bioelétricas cardíacas usando várias técnicas de extração de características usando CNN. Resumo XXIX SEMIC UEFS (2025) .

[5] Goldberger AL, Amaral LAN, Glass L, et al. PhysioBank, PhysioToolkit, and PhysioNet: Components of a New Research Resource for Complex Physiologic Signals. Circulation. 2000 Jun 13;101(23):e215-20. doi: https://doi.org/10.1161/01.cir.101.23.e215

[6] Mir, HY; Singh, O. ECG denoising and feature extraction techniques – a review. J Med Eng Technol. 2021 Nov;45(8):672-684. doi: 10.1080/03091902.2021.1955032.

[7] Al-Surmi, MA; Al-Ghaithi, H; Al-Huti, MA; Al-qaness, MAA. Innovative Time Series-Based ECG Feature Extraction for Heart Disease Risk Assessment. J. Theor. Appl. Inf. Technol. 2023 Nov 30;101(21):7953-66.

[8] Oppenheim AV, Schafer RW. Discrete-Time Signal Processing. 3rd ed. Upper Saddle River, NJ: Prentice Hall; 2010.

[9] Mallat SG. A theory for multiresolution signal decomposition: the wavelet representation. IEEE Transactions on Pattern Analysis and Machine Intelligence. 1989;11(7):674-693.

[10] Huang NE, Shen Z, Long SR, et al. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis. Proc. R. Soc. Lond. A. 1998;454:903-995.

[11] Hossain MS, et al. Arrhythmia Detection Using MFCC and SVM/CNN. In: 2023 International Conference on Computer and Information Technology (ICCIT). IEEE; 2023.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *