Análise de metilação em doenças humanas: convergências e divergências metodológicas rumo a uma padronização

75
0

A padronização de métodos é fundamental para a reprodutibilidade científica, assim como ocorreu historicamente na medicina. Na epigenética, especialmente em estudos de metilação do DNA, a falta depipelines bioinformáticos padronizados dificulta a comparabilidade dos resultados, apesar do grande volume de dados gerados por plataformas como a Illumina Infinium MethylationEPIC BeadChip (850K). Este artigo tem como objetivo analisar as convergências e divergências metodológicas em estudos de metilação do DNA aplicados a doenças humanas, discutindo caminhos para a padronização de fluxos analíticos. A metilação do DNA regula a expressão gênica e está associada a processos biológicos e ao desenvolvimento de doenças. Estudos recentes têm adotado fluxos metodológicos semelhantes, incluindo análises de metilação diferencial, análises funcionais e integração multiômica, correlacionando metilação com expressão gênica e outros níveis moleculares. Essa padronização fortalece a confiabilidade dos achados, permite a identificação consistente de vias celulares afetadas e acelera a aplicação clínica de descobertas epigenéticas, evidenciando a maturação do campo da epigenética.

Palavras-chave: Metilação de DNA, Bioinformática, Metodologia, Medicina, Epigenômica.

Autores: Matheus Mizerani Fernandes de Almeida, Lucas Gabriel Braz da Silva

Introdução

Historicamente, a medicina evoluiu muitas vezes a partir da padronização de métodos e da organização sistemática de dados. Um exemplo clássico vem do século XIX, com Ignaz Semmelweis, o médico húngaro que observou uma elevada mortalidade por febre puerperal em maternidades de Viena. Semmelweis percebeu que a falta de práticas padronizadas de higienização das mãos pelos médicos era a principal causa de infecções pós-parto. Apesar de evidências claras, seus achados só foram amplamente aceitos décadas depois, devido à resistência à mudança e à ausência de protocolos universalmente adotados. Esse atraso custou inúmeras vidas [1]

Analogamente, na era moderna da epigenética, o estudo da metilação do DNA tem gerado uma quantidade enorme de dados sobre assinaturas epigenéticas associadas a diversas doenças humanas. No entanto, a falta de padronização de pipelines bioinformáticos, desde controle de qualidade até análise estatística, ainda compromete a reprodutibilidade e a comparabilidade dos resultados. Tal como a história de Semmelweis mostra, avanços científicos podem ser retardados quando métodos robustos e consistentes não são adotados. Padronizar as etapas de análise da metilação do DNA não apenas aumenta a confiança nos achados, mas também acelera a tradução do conhecimento para aplicações clínicas, ajudando a identificar biomarcadores, vias celulares críticas e potenciais alvos terapêuticos de forma mais confiável.

A metilação do DNA é um mecanismo epigenético fundamental que regula a expressão gênica sem alterar a sequência do genoma. Ela desempenha um papel central na diferenciação celular, na manutenção da estabilidade genômica e no desenvolvimento de diversas doenças humanas. Nos últimos anos, o avanço das tecnologias de sequenciamento permitiu a análise abrangente do metiloma, o conjunto completo de sítios de metilação no DNA, possibilitando estudos detalhados sobre assinaturas epigenéticas associadas a diferentes patologias [2,3,4,5].

Apesar da crescente quantidade de dados gerados, a complexidade das análises de metilação torna essencial a aplicação de pipelines de bioinformática padronizados, capazes de assegurar a qualidade, a reprodutibilidade e a comparabilidade dos resultados. Diferentes grupos de pesquisa têm adotado combinações de softwares e estratégias metodológicas, como controle de qualidade, normalização de dados, filtragem de sítios e análises estatísticas específicas, para identificar padrões de metilação diferencial [6,7].

Busca-se evidenciar, como, intuitivamente ou intencionalmente, os estudos sobre metilação do DNA têm estruturado suas etapas metodológicas, buscando identificar padronizações nos processos de análise e achados recorrentes entre artigos científicos. Ao examinar tanto a consistência das estratégias bioinformáticas quanto os resultados biológicos compartilhados, pretende-se compreender melhor quais elementos metodológicos contribuem para estudos robustos e quais vias ou processos celulares tendem a ser afetados de forma consistente, independentemente da doença ou do tecido analisado [8,9,10].

 

Contexto da metilação nas patologias e processos genéticos humanos

A metilação do DNA é um processo epigenético em que grupos metil (CH3) são adicionados a regiões específicas do genoma, geralmente nas citosinas seguidas de guanina (CpG), sem alterar a sequência do DNA (Figura 1). Esse mecanismo funciona como um “interruptor” molecular, regulando quais genes são ativados ou silenciados em cada célula, influenciando funções essenciais como desenvolvimento, diferenciação celular e reparo genético. Alterações na metilação estão associadas a diversas patologias humanas, incluindo câncer, doenças neurodegenerativas e distúrbios metabólicos, uma vez que podem desregular genes críticos para crescimento celular e resposta imune. Por outro lado, condições patológicas também podem modificar o padrão de metilação, criando um ciclo em que a doença altera o epigenoma, que por sua vez agrava a doença, tornando o estudo da metilação essencial tanto para compreender a biologia da doença quanto para identificar potenciais biomarcadores e terapias epigenéticas [11].

Figura 1. A ilustração detalha o mecanismo epigenético da metilação do DNA, no qual enzimas metiltransferases adicionam o grupo metil às bases Citosina. Esta modificação atua como um ‘cadeado’ na dupla hélice, bloqueando o acesso da RNA Polimerase, o que resulta no silenciamento do gene (gene inativo), enquanto as regiões não metiladas permitem a transcrição normal e mantêm o gene ativo, regulando fundamentalmente a expressão gênica [11].

Busca na literatura

Realizamos uma busca na literatura por artigos que apresentem análises de metilação de DNA em diferentes contextos biológicos. A Tabela 1 apresenta artigos-base para padronização metodológica após busca ativa na base de dados MEDLINE (artigos que versam sobre análise de metilação em doenças médicas). Os estudos incluídos investigaram padrões de metilação do DNA em diferentes contextos, incluindo transmissão intrauterina do vírus da hepatite B [12], regulação de genes diferencialmente expressos na artrite reumatoide [13] e degeneração do disco intervertebral humano [14].

Tabela 1. Artigos utilizados na análise metodológica de metilação do DNA.

Artigo

Tradução

Analysis of differentially methylated sites and regions associated with intrauterine transmission of hepatitis B virus in infants.

Análise de sítios e regiões diferencialmente metiladas associadas à transmissão intrauterina do vírus da hepatite B em lactentes.

Identification of DNA methylation-regulated differentially expressed genes in RA by integrated analysis of DNA methylation and RNA-Seq data.

Identificação de genes diferencialmente expressos regulados por metilação do DNA em AR por meio de análise integrada de metilação do DNA e dados de RNA-Seq. 

Genome-wide analysis of DNA methylation profile identifies differentially methylated loci associated with human intervertebral disc degeneration.

Análise do perfil de metilação do DNA em todo o genoma identifica loci diferencialmente metilados associados à degeneração do disco intervertebral humano.

A Tabela 2 apresenta a comparação, as convergências e as divergências entre os três artigos sobre metilação em patologias médicas.

Tabela 2. Análise metodológica de metilação de DNA (divulgação científica): mecanismos e ferramentas de bioinformática utilizadas em três artigos

Autor(es) (ABNT)

Plataforma de Metilação

Sigla e Significado (Mecanismo Principal)

Objetivo Central do Estudo

Ferramentas de Bioinformática Chave

SU, Z. et al. (2025)

Illumina Infinium MethylationEPIC BeadChip (850K)

DMPs (Pontos Diferencialmente Metilados) e DMRs (Regiões Diferencialmente Metiladas)

Identificar e analisar alterações de metilação de DNA (epigenéticas) no sangue de bebês associadas à transmissão intrauterina do vírus da hepatite B (HBV).

Pacote ChAMP (R) e DAVID (análise de enriquecimento funcional).

ZHANG, R. et al. (2022)

Illumina 850K DNA Methylation BeadChip

MeDEGs (Genes de Expressão Diferencial Regulados por Metilação)

Análise integrada (metilação + expressão gênica por RNA-Seq) para identificar genes controlados epigeneticamente na Artrite Reumatoide (RA).

Pacote ChAMP (R), RNA-Seq, GSEA e WGCNA.

IKUNO, A. et al. (2019)

Infinium Methylation EPIC BeadChip array

DMLs (Locos Diferencialmente Metilados)

Mapear o perfil de metilação em todo o genoma para encontrar marcadores epigenéticos associados à degeneração do disco intervertebral humano (DD).

Pacote ChAMP (R), minfi e SWAN (Métodos de Normalização).

DMPs/DMLs: Pontos Diferencialmente Metilados | MeDEGs: Genes Regulados por Metilação | R/ChAMP/GSEA/WGCNA: Pacotes e Métodos de Bioinformática.

Nota-se que os três estudos analisaram a metilação do DNA usando uma tecnologia chamada Illumina Infinium MethylationEPIC BeadChip (850K). Essa plataforma permite medir o estado de metilação em mais de 850 mil pontos específicos do DNA, chamados sítios CpG, que estão espalhados por regiões importantes do genoma, como genes e regiões regulatórias [15]. Um CpG é uma sequência curta de DNA onde a letra C (citosina) está imediatamente seguida da letra G (guanina). Esses locais são especiais porque a citosina pode receber uma modificação química chamada metilação, que funciona como um “interruptor” que liga ou desliga a atividade de um gene. Em termos simples, a tecnologia atua como um detector em massa, mostrando quais trechos do DNA estão ativos ou inativos por essas modificações químicas, sem alterar a sequência genética [16].

Sobre a plataforma Illumina Infinium MethylationEPIC BeadChip (850K)

A Figura 2 apresenta uma ilustração mostrando o funcionamento desta plataforma. Primeiro é feita a coleta das amostra de DNA, seguido da preparação do DNA. Em seguida, a plataforma Illumina Infinium MethylationEPIC BeadChip (850K) é utilizada para fazer a detecção da metilação seguido da liberação dos resultados para a análise dos dados.

Figura 2. Funcionamento simplificado da plataforma Illumina Infinium MethylationEPIC BeadChip (850K). Fonte: Elaborado pelo autor conforme referência [17].

A Figura 3 apresenta um exemplo do equipamento.

Figura 3. Componente físico do array de metilação Illumina Infinium EPIC, contendo unidades de sondas distribuídas em módulos organizados, empregado para análise epigenômica de alta densidade em estudos de metilação do DNA [18]. Números meramente ilustrativos. Fonte: elaborado pelo autor.

 

Pontuações relevantes sobre as convergências metodológicas em análises de metilação em patologias méticas

A Figura 4 apresenta um fluxograma ilustrando as etapas do processo comumente descritas nos artigos.

 Figura 4. Fluxograma do pipeline metodológico comum dos artigos [12,13,14]. Fonte: Elaborado pelo autor conforme referências.

Os achados representados no fluxograma refletem um padrão metodológico altamente relevante na área de epigenética aplicada a patologias humanas. O fato de os três artigos convergirem nesse mesmo fluxo de etapas, desde a obtenção e purificação do DNA até a integração multiômica e interpretação biológica, evidencia uma maturação científica do campo, que passou de análises fragmentadas para abordagens integradas e sistematizadas [19].

Um ponto central nas pesquisas em epigenética é o uso de análises diferenciais e funcionais. Por exemplo, ao comparar o DNA metilado de pacientes e indivíduos saudáveis, os pesquisadores identificam “diferentially methylated positions” (DMPs), ou seja, regiões específicas do DNA onde a metilação — uma modificação química que regula a atividade gênica — varia entre os grupos. Também podem identificar “differentially methylated regions” (DMRs), que são conjuntos de posições do DNA com alterações de metilação coordenadas [20].

Para traduzir esses achados em informação biológica significativa, utilizam-se ferramentas de análise funcional, como Gene Ontology (GO), que classifica genes em termos de processos biológicos, funções moleculares e componentes celulares, e Kyoto Encyclopedia of Genes and Genomes (KEGG), que organiza genes em vias metabólicas e sinalização celular. Essas análises ajudam a descobrir quais genes e vias moleculares estão alterados em uma doença, oferecendo pistas sobre os mecanismos que levam à condição e potenciais alvos para tratamentos [21].

Quando combinadas com integração multiômica, a qual conecta alterações epigenéticas com dados de expressão gênica, proteínas e metabólitos, essas abordagens fornecem uma visão sistêmica da biologia da doença. Assim, os resultados não só revelam alterações moleculares isoladas, mas também mostram como essas alterações interagem dentro de células e tecidos, fortalecendo a ponte entre a pesquisa básica em genômica e sua aplicação clínica [22]

A integração multiômica é realizada combinando diferentes camadas de dados biológicos obtidas de uma mesma amostra ou paciente. Por exemplo, os pesquisadores podem correlacionar regiões do DNA com alterações de metilação (epigenoma) com níveis de RNA mensurados por sequenciamento (transcriptoma), abundância de proteínas detectadas por proteômica e perfis de metabólitos obtidos por metabolômica. Para isso, utilizam-se ferramentas computacionais e estatísticas, como análise de redes biológicas, algoritmos de aprendizado de máquina e modelos de regressão multivariada, que permitem identificar relações consistentes entre essas camadas e inferir mecanismos causais ou regulatórios. [23]

Portanto, a importância central desses achados está no fato de que eles consolidam uma estrutura metodológica confiável e reprodutível, indispensável para transformar dados epigenéticos em descobertas clínicas concretas. Essa uniformização não apenas eleva a qualidade das pesquisas, mas também acelera o caminho translacional, do laboratório à prática médica, possibilitando a identificação de biomarcadores diagnósticos e prognósticos com base em evidências sólidas e comparáveis entre diferentes contextos patológicos.

Lista de siglas

A Tabela 3 apresenta siglas comumente usadas em análises de metilação de DNA.

Tabela 3. Siglas comumente usadas em análises de metilação de DNA

Sigla

Significado Completo

Área / Contexto

850K

Illumina Infinium MethylationEPIC BeadChip

Plataforma de Perfil de Metilação

ABNT

Associação Brasileira de Normas Técnicas

Formato de Referência

ChAMP

Chip Analysis Methylation Pipeline

Pacote/Pipeline de Bioinformática (R)

DAVID

Database for Annotation, Visualization and Integrated Discovery

Análise Funcional

DMLs/DMPs

Pontos Diferencialmente Metilados (Differentially Methylated Probes/Loci)

Resultado de Metilação

DMRs

Regiões Diferencialmente Metiladas (Differentially Methylated Regions)

Resultado de Metilação

GO

Gene Ontology

Análise Funcional

GSEA

Análise de Enriquecimento de Conjunto de Genes (Gene Set Enrichment Analysis)

Metodologia de Bioinformática

HBV/RA/DD

Vírus da Hepatite B / Artrite Reumatoide / Degeneração Discal

Contexto de Doença

KEGG

Kyoto Encyclopedia of Genes and Genomes

Análise de Vias Biológicas

MeDEGs

Genes de Expressão Diferencial Regulados por Metilação

Resultado da Análise Integrada

PPI

Interação Proteína-Proteína (Protein-Protein Interaction)

Análise de Redes

R

R software

Ambiente de Software (Explicitamente Solicitado)

RNA-Seq

Sequenciamento de RNA (RNA Sequencing)

Metodologia para Expressão Gênica

SWAN

Subset-quantile Within Array Normalization

Método de Normalização de Dados de Metilação

WGCNA

Análise Ponderada de Rede de Co-Expressão Gênica

Análise de Redes

Siglas usadas frequentemente nos processos de análises de metilação [12,13,14]. Fonte: gerada pelo próprio autor.

REFERÊNCIAS

[1] SALAVERRY GARCÍA, Oswaldo. [Institutional iatrogeny and maternal death: Semmelweis and puerperal fever]. Revista Peruana De Medicina Experimental Y Salud Publica, v. 30, n. 3, p. 512–517, jul. 2013.

 

[2] JONES, Peter A. Functions of DNA methylation: islands, start sites, gene bodies and beyond. Nature Reviews. Genetics, v. 13, n. 7, p. 484–492, 29 maio 2012.

 

[3] ROBERTSON, Keith D. DNA methylation and human disease. Nature Reviews. Genetics, v. 6, n. 8, p. 597–610, ago. 2005.

 

[4] GOPALAKRISHNAN, Suhasni; VAN EMBURGH, Beth O.; ROBERTSON, Keith D. DNA methylation in development and human disease. Mutation Research, v. 647, n. 1–2, p. 30–38, 1 dez. 2008.

 

[5] KHAVARI, David A.; SEN, George L.; RINN, John L. DNA methylation and epigenetic control of cellular differentiation. Cell Cycle (Georgetown, Tex.), v. 9, n. 19, p. 3880–3883, 1 out. 2010.

 

[6] MORRIS, Tiffany J. et al. ChAMP: 450k Chip Analysis Methylation Pipeline. Bioinformatics (Oxford, England), v. 30, n. 3, p. 428–430, 1 fev. 2014.

 

[7] WRIGHT, Michelle L. et al. Establishing an analytic pipeline for genome-wide DNA methylation. Clinical Epigenetics, v. 8, p. 45, 2016.

 

[8] VAN ROOIJ, Jeroen et al. Evaluation of commonly used analysis strategies for epigenome- and transcriptome-wide association studies through replication of large-scale population studies. Genome Biology, v. 20, n. 1, p. 235, 14 nov. 2019.

 

[9] KÜPERS, Leanne K. et al. Meta-analysis of epigenome-wide association studies in neonates reveals widespread differential DNA methylation associated with birthweight. Nature Communications, v. 10, n. 1, p. 1893, 23 abr. 2019.

 

[10] JUVINAO-QUINTERO, Diana L. et al. DNA methylation of blood cells is associated with prevalent type 2 diabetes in a meta-analysis of four European cohorts. Clinical Epigenetics, v. 13, n. 1, p. 40, 23 fev. 2021.

 

[11] JURKOWSKA, Renata Z.; JELTSCH, Albert. Silencing of gene expression by targeted DNA methylation: concepts and approaches. Methods in Molecular Biology (Clifton, N.J.), v. 649, p. 149–161, 2010.

 

[12] SU, Zhengqin et al. Analysis of differentially methylated sites and regions associated with intrauterine transmission of hepatitis B virus in infants. Infection, Genetics and Evolution: Journal of Molecular Epidemiology and Evolutionary Genetics in Infectious Diseases, v. 127, p. 105705, jan. 2025.

 

[13] ZHANG, Runrun et al. Identification of DNA methylation-regulated differentially expressed genes in RA by integrated analysis of DNA methylation and RNA-Seq data. Journal of Translational Medicine, v. 20, n. 1, p. 481, 22 out. 2022.

 

[14] IKUNO, Akihiro et al. Genome-wide analysis of DNA methylation profile identifies differentially methylated loci associated with human intervertebral disc degeneration. PloS One, v. 14, n. 9, p. e0222188, 2019.

 

[15] MORAN, Sebastian; ARRIBAS, Carles; ESTELLER, Manel. Validation of a DNA methylation microarray for 850,000 CpG sites of the human genome enriched in enhancer sequences. Epigenomics, v. 8, n. 3, p. 389–399, mar. 2016.

 

[16] WU, Michael C.; KUAN, Pei-Fen. A Guide to Illumina BeadChip Data Analysis. Methods in Molecular Biology (Clifton, N.J.), v. 1708, p. 303–330, 2018.

 

[17] ZHOU, Wanding; LAIRD, Peter W.; SHEN, Hui. Comprehensive characterization, annotation and innovative use of Infinium DNA methylation BeadChip probes. Nucleic Acids Research, v. 45, n. 4, p. e22, 28 fev. 2017.

 

[18] SUN, Yan V.; HU, Yi-Juan. Integrative Analysis of Multi-omics Data for Discovery and Functional Studies of Complex Human Diseases. Advances in Genetics, v. 93, p. 147–190, 2016.

 

[19] JANSSENS, Katleen et al. Epigenome-wide methylation analysis of colorectal carcinoma, adenoma and normal tissue reveals novel biomarkers addressing unmet clinical needs. Clinical Epigenetics, v. 15, n. 1, p. 111, 6 jul. 2023.

 

[20] LIANG, Yu et al. Identification of Methylation-Regulated Differentially Expressed Genes and Related Pathways in Hepatocellular Carcinoma: A Study Based on TCGA Database and Bioinformatics Analysis. Frontiers in Oncology, v. 11, p. 636093, 2021.

 

[21] LIANG, Wen-Wei et al. Integrative multi-omic cancer profiling reveals DNA methylation patterns associated with therapeutic vulnerability and cell-of-origin. Cancer Cell, v. 41, n. 9, p. 1567- 1585.e7, 11 set. 2023.

 

[22] PICARD, Milan et al. Integration strategies of multi-omics data for machine learning analysis. Computational and Structural Biotechnology Journal, v. 19, p. 3735–3746, 2021.

 

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *