Índices de correlação entre a expressão de genes condutores e a desdiferenciação celular em câncer

6
0

O câncer explora o estado de desdiferenciação celular para promover a progressão tumoral e a resistência aos tratamentos. Genes com potencial para influenciar a formação do câncer são chamados de condutores. Não há uma definição clara de como tais genes, oncogenes e supressores de tumores, agem interferindo no processo de desdiferenciação tumoral. Neste trabalho, analisaremos o impacto de 741 genes condutores definidos pelo Cancer Gene Census (COSMIC) na desdiferenciação celular em 33 tipos de tumores do TCGA. Investigaremos aqui, de modo preliminar, dados de correlação entre a desdiferenciação celular tumoral e dados de expressão, metilação, mutação e variação do número de cópias de genes condutores de câncer. Definindo um limiar exploratório, encontramos que pelo menos 177 genes condutores apresentam correlações diretas ou inversas entre a expressão gênica e a desdiferenciação celular em pelo menos um tipo de tumor, além de um total de 290 correlações distintas.

Autores: Leonardo Henrique da Silva, Milenna Machado Pirovani, Raquel Cardoso de Melo-Minardi

1. Introdução

Um dos mecanismos mais estudados na origem do câncer é a presença de conjuntos de mutações capazes de alterar o equilíbrio entre proliferação e morte celular. A proliferação celular é bem caracterizada em células-tronco, células embrionárias e células desdiferenciadas. No câncer, esse estado de desdiferenciação é explorado de forma a contribuir para evitar a vigilância imunológica, resistir a tratamentos e avançar na progressão tumoral [1]. Genes com potencial para influenciar o processo de formação do câncer são conhecidos como condutores, geralmente se encaixando em subclasses de oncogenes ou de supressores de tumores.

Nos últimos anos, o  estudo desses genes tem sido impulsionado pelos grandes volumes de dados ômicos gerados. Nesse contexto, duas das maiores fontes de dados sobre o câncer atualmente são o Catalogue Of Somatic Mutations In Cancer (COSMIC) [3] e o The Cancer Genome Atlas (TCGA). A base de dados do COSMIC, ou especificamente sua aba de Cancer Gene Census (CGC), contém uma lista de genes curados como condutores de câncer, mantida por meio de curadoria manual, com base na literatura científica – que exige pelo menos dois estudos independentes para a inclusão de um gene. Por outro lado, o TCGA é um projeto que disponibiliza dados clínicos de estudos de câncer, incluindo informações genéticas e fenotípicas, a partir das quais se pode fazer inferências por diferentes estratégias de análise de dados, como correlações estatísticas ou predição por Machine Learning. A integração dos dados das duas plataformas é uma ótima maneira de filtrar alvos e obter percepções sobre a biologia molecular do câncer.

Em 2018, MALTA et al. [2] desenvolveram uma metodologia para predizer correlações entre a expressão gênica e a desdiferenciação celular em diferentes cânceres por meio de Machine Learning. Essa mesma abordagem pode ser utilizada para diferentes conjuntos de dados, como os de metilação, de variação do número de cópias e de número de mutações. Além de um escopo menor de alvos para filtrar percepções relevantes a diferentes perguntas.

2. Dados e Metodologia

Com base nos dados do CGC disponíveis no COSMIC, definimos uma lista de 741 genes condutores. Utilizando a biblioteca do UCSCXenaShiny [4] em R, e a função baseada  no método de regressão logística (introduzido por [2]), investigaremos os dados de expressão, metilação, mutação e alteração do número de cópias presentes no TCGA –  buscando criar índices de correlação (spearman) variando entre 1 e -1, entre variáveis de genes condutores e a observação de desdiferenciação celular em cada um dos 33 tipos de tumores do TCGA. De maneira exploratória, definimos um limiar de correlação de 𝜌 > 0.7 ou 𝜌 < -0.7 para reduzir os resultados a apenas os genes mais fortemente associados.

3. Resultados Parciais

Encontramos que 177 genes, dos 741 genes condutores observados, possuem índices de correlação entre expressão gênica e desdiferenciação celular com um 𝜌 > 0.7 ou 𝜌 < -0.7 em pelo menos um tipo de tumor. Alguns atingem mais de um tipo de câncer e totalizam 290 correlações diferentes, das quais 254 eram correlações negativas e 36 positivas.

Figura 1. Plot de radar indicando a correlação entre a expressão gênica e a observação de desdiferenciação celular em 33 tipos de tumores do TCGA. Os dados de correlação estão definidos entre um índice de 1 e -1: quanto mais próximos os pontos estiverem da margem externa do círculo, maior a correlação entre a expressão gênica e os níveis de desdiferenciação celular no câncer indicado; quanto mais próximos do centro, menor a correlação. Na figura A, perfil de correlação da expressão do gene RARA difundidamente negativo. Na figura B, perfil de correlação de POU5F1, com uma correlação altamente notável com o tumor de TGCT (Tenosynovial Giant Cell Tumor).

Futuramente, esses resultados podem ser expandidos para correlações envolvendo dados de metilação, mutações e variações no número de cópias. Após a obtenção dos resultados completos, esperamos identificar a existência de subconjuntos de genes condutores com características genéticas ou epigenéticas associadas aos tumores em que suas mutações condutoras foram previamente observadas.             Bem como descobrir novos tumores em que essas observações ainda não tenham sido realizadas, confirmando achados prévios e identificando novos.

4. Conclusão

Acreditamos que essas observações podem contribuir para aprimorar o conhecimento sobre as bases moleculares do câncer, identificar novos tumores associados a genes condutores conhecidos e somar evidências para a identificação de potenciais alvos terapêuticos de diferentes tipos tumorais.

Agradecimentos. Os autores agradecem a rede de pesquisa do TCGA (https://www.cancer.gov/tcga.) pelos dados sob os quais os resultados aqui apresentados se baseiam em parte. Além disso, agradecemos às agências de fomento à pesquisa: Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES), Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) e a Fundação de Amparo à Pesquisa do Estado de Minas Gerais (Fapemig).

4. Referências

[1] CARNERO, A. et al. The cancer stem-cell signaling network and resistance to therapy. Cancer treatment reviews, Netherlands, v. 49, p. 25–36, 2016.

[2] MALTA, Tathiane M. et al. Machine Learning Identifies Stemness Features Associated with Oncogenic Dedifferentiation. Cell, [s. l.], v. 173, n. 2, p. 338-354.e15, 2018.

[3] TATE, John G. et al. COSMIC: the Catalogue Of Somatic Mutations In Cancer. Nucleic acids research, England, v. 47, n. D1, p. D941–D947, 2019.

[4] WANG, Shixiang et al. UCSCXenaShiny: an R/CRAN package for interactive analysis of UCSC Xena data. Bioinformatics (Oxford, England), England, v. 38, n. 2, p. 527–529, 2022.

 

 

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *