A Bioinformática na busca implacável: Onde estão os pseudogenes?

Os pseudogenes são comumente rotulados como “DNA lixo” devido ao seu status não funcional compreendido. A definição de função é um conceito complexo e muitas vezes controverso na biologia. No entanto, o advento dos projetos de genômica em larga escala propiciou a reavaliação da biologia dos pseudogenes, destacando seus principais papéis funcionais e regulatórios em inúmeros organismos e até mesmo em doenças humanas como o câncer. Diferentes estratégias de bioinformática já foram desenvolvidas para identificação destas importantes moléculas biológicas. Assim, o presente estudo descreve a importância dos pseudogenes assim como diversas estratégias e ferramentas em bioinformática empregadas na identificação e determinação de suas funções até então pouco compreendidas.

Autores: Mayla Abrahim Costa ^{https://orcid.org/0000-0001-5613-1059} , Alexandro Guterres ^{https://orcid.org/0000-0001-8323-1477}

Revisão: Ana Carolina Silva Bulla ^{https://orcid.org/0000-0003-4118-294X}

O que são pseudogenes?

Pseudogenes são descritos como segmentos de DNA (ácido desoxirribonucleico) derivados de genes, que perderam sua função original. Tais sequências podem ser reconhecidas por apresentarem alterações em seus quadros de leitura provocadas, por exemplo, por mudanças de fase (frameshift) e/ou por códons de terminação prematuros [1-5] (Figura 1). O termo “pseudogene” surgiu, originalmente, da investigação do genoma de Xenopus laevis onde em 1977, os pesquisadores Miller e Brownlee identificaram uma região genômica com uma estrutura homóloga ao gene que codifica o RNA 5S do oócito em X. laevis. Entretanto, apesar dessa região parecer homóloga, apresentando alta similaridade com o gene ancestral, diferenças foram identificadas, resultando na denominação pseudogene [6]. Atualmente, os pseudogenes são denotados de diferentes maneiras, incluindo no prefixo o símbolo grego Ψ (PSI) (por exemplo: ΨPGK-1) ou por um sufixo “P” principal (por exemplo CYP21P) [7].

Figura 1: Representação esquemática das principais características que caracterizam os pseudogenes (Ψ). Fonte: Próprio autor

Desde então, os pseudogenes foram observados em bactérias, plantas, insetos e diversos organismos, incluindo mamíferos, onde são abundantes [8]. Surpreendentemente, pesquisadores estimam que o genoma humano contém cerca de 15.000 pseudogenes, dos quais, mais de 20% podem ser transcricionalmente ativos [9-11]. Similarmente, estima-se que em ratos cerca de 15% dos pseudogenes são transcritos [12]. O genoma da cevada foi descrito como um genoma profuso em pseudogenes, contudo, a porcentagem de pseudogenes transcricionalmente ativos é de 7,2% [13]. Em protozoários, diferentes pseudogenes foram descritos sendo transcritos, por exemplo, em tripanosomatídeos, dentre os quais, o pseudogene A2 está associado a sobrevivência em órgãos viscerais do hospedeiro e na proteção da Leishmania donovani contra altas temperaturas (febre) e estresse oxidativo [14]. Outrossim, o genoma de Mycobacterium leprae, agente etiológico da hanseníase, inclui 1.133 pseudogenes, o que representa 38% do genoma total [15, 11].

Tipos de pseudogenes

Com base na sua origem, os pseudogenes podem ser divididos em duas categorias principais: pseudogenes processados (também conhecidos como retropseudogenes) e pseudogenes não processados, dos quais podem ser pseudogenes unitários ou duplicados (Figura 2). Sendo eles:

Pseudogene Processado: Origina-se da transcrição reversa do RNA mensageiro (mRNA) que foi inserido de volta ao genoma e raramente contém promotores ou íntrons [16, 17].
Pseudogene Unitário: São derivados de genes funcionais de cópia única, que acumularam mutações durante a evolução e perderam suas funções primárias. Estes pseudogenes não possuem gene parental ou genes parálogos no mesmo genoma onde residem, mas podem ter ortólogos em espécies relativas [18-20].
Pseudogene Duplicado: São gerados por duplicações segmentares e desativados por mutações, e tipicamente possuem promotor, íntron e exon, embora, esses elementos possam perder suas funções originais [9, 20].
A partir 2016, uma quarta categoria de pseudogenes foi descrita como Pseudo-Pseudogenes, dos quais agrupam pseudogenes que são codificados em proteínas e possuem funções biologicamente importantes, entretanto, ainda pouco se sabe sobre essa categoria [21-23].

Figura 2: Principais categorias de classificação dos pseudogenes com base na sua origem. Fonte: Próprio autor

Importância dos pseudogenes e relação com as doenças

Desde a sua descoberta em 1977 até o final da década de 90, os pseudogenes eram conhecidos como “DNA lixo” e descritos como desprovidos de função [6]. Entretanto, em 1999 a hipótese a respeito da funcionalidade dos pseudogenes surgiu pela primeira vez, quando Korneev e colaboradores identificaram em Lymnaea stagnalis o pseudogene NOS que contém múltiplos códons de terminação prematura nas três fases de leitura, porém é transcrito em certos neurônios no sistema nervoso central [24].

Os pseudogenes são descritos, desde então, não só como uma ferramenta relevante para registrar a evolução dos genomas, como também, algumas dessas “relíquias moleculares” possuem importantes funções biológicas e prevalência em papéis vitais na fisiologia básica dos organismos, bem como, na progressão de doenças. Estes pseudogenes transcritos podem inibir a diferenciação celular, influenciar na atividade de outros genes que codificam proteínas, alterando a expressão e afetando o fenótipo do organismo. Além disso, eles são capazes de reprimir ou ativar genes codificadores de proteínas com os quais compartilham homologia de sequências, afetando a expressão gênica parental no nível pós-transcricional [8, 25, 26].

Recentemente, as duplicações específicas em humanos do gene NOTCH2 (NOTCH2NL) foram descobertas para expandir a neurogênese cortical [27][28]. Entretanto o pseudogene NOTCH2NL é truncado e contém menos da metade da sequência de codificação do seu gene parental NOTCH2. Essa proteína truncada codifica o domínio de ligação ao ligante, mas não o domínio de transativação. Portanto, ao ligar-se na NOTCH DELTA, não é induzida a transativação, mas há uma modulação do nível de atividade NOTCH no córtex pelo NOTCH2NL. Da mesma forma, uma proteína truncada codificada por um pseudogene humano de SRGAP2 pode inibir seu gene parental [29, 30]. Assim, muitos pseudogenes podem funcionar como genes codificadores de proteínas apesar do truncamento em relação ao seu gene parental.

Os pseudogenes também podem ser biologicamente ativos e atuar no processo de regulação da expressão gênica, formação de RNAs (ácido ribonucleico) não codificadores, bem como, na regulação da estabilidade do mRNA de genes funcionais similares. Ademais, transcritos derivados de pseudogenes podem desempenhar papéis biológicos importantes, como por exemplo, em diferentes tipos de doenças e, substancialmente, servir como marcadores moleculares altamente específicos de identidade celular e utilizados como marcadores diagnósticos e prognósticos [8, 25, 26, 31].

Alguns pseudogenes já foram identificados em pacientes e associados a diferentes doenças, como por exemplo em: leucemia mielóide aguda possuem diferença na expressão do pseudogene BMI1P1 que podem ser utilizados como um novo preditor para o desenvolvimento e prognóstico [32]. Na pré-eclâmpsia, o pseudogene URAHP promove a proliferação e regula a patogênese, além de fornecer um novo alvo para o tratamento abrangente da pré-eclâmpsia [33, 34]. Os pseudogenes também já foram descritos e relacionados às doenças cardiovasculares, resistência à insulina e diabetes tipo 2, e ainda, utilizados por alguns microrganismos patogênicos, como Borrelia hermsii e Trypanosoma brucei, a fim de superar a resposta imune do organismo hospedeiro [35-37].

Já nos diferentes tipos tumorais, os pseudogenes são associados à progressão da doença e fisiopatologia dos tumores como em:

Câncer de próstata – a triagem de amostras de urina dos pacientes demonstrou que com a fusão KLK4-KLKP1 (gene codificador de proteína KLK4 e pseudogene não codificador KLKP1) pode ser detectado de forma não invasiva na urina com aplicações potenciais como biomarcador para rastreamento de rotina nos tumores de próstata [38].
Câncer gástrico – pacientes com tumor gástrico podem ser caracterizados por níveis mais baixos do pseudogene PTENP1, demonstrando uma capacidade diagnóstica [32].
Gliomas – um tipo comum de tumor que se origina no cérebro, são encontrados cinco pseudogenes (ANXA2P2, EEF1A1P9, FER1L4, HILS1 e RAET1K) que estão correlacionados com a sobrevivência dos pacientes e estabelece uma assinatura de risco [39].
Câncer de mama – o aumento da expressão do pseudogene PTTG3P pode ser um novo alvo terapêutico [40].
Carcinoma hepatocelular – o pseudogene DUXAP10 atua como marcador diagnóstico e prognóstico, outrossim, também demonstrou ser superexpresso em vários cânceres humanos e emergiu como um regulador chave do câncer. [41, 42].
Câncer de pulmão – a transcrição do RNA não codificador do PPIAP43 pode servir como um potencial biomarcador de radiossensibilidade [43]. Ademais, oito pseudogenes isolados podem servir como biomarcadores diagnósticos e prognósticos para uma “biópsia líquida” não invasiva de adenocarcinoma pulmonar [44].
Câncer de endométrio – Uma assinatura de pseudogene foi identificada relacionada ao sistema imunológico e fornece novas estratégias para o tratamento desse câncer [45].

Por fim, os pseudogenes podem desempenhar uma infinidade de funções em diferentes níveis (DNA, RNA e proteína), tanto na saúde quanto na doença. Assim, no termo, pseudogene, “pseudo” pode indicar a variação da sequência em comparação com o seu gene ancestral e, não necessariamente, indicar ausência de função. Entretanto, a anotação dos pseudogenes pode ser deficiente e/ou inexistente, uma vez que a prioridade nos processos de anotação é somente separar regiões codificadoras de não codificadoras e inferir a função biológica das regiões codificadoras [10, 11, 46, 47] (Figura 3).

Figura 3: Principais funções dos pseudogenes ao nível de DNA, RNA e proteína. Fonte: Próprio autor.

Bioinformática na identificação dos pseudogenes

A similaridade entre os pseudogenes e genes funcionais representa um desafio para os cientistas, pois muitas dessas sequências podem estar descaracterizadas devido ao acúmulo de mutações ao longo dos anos. Assim, torna-se impreciso quantificar o número total de pseudogenes dentro de um organismo, até que o seu genoma seja completamente sequenciado. Todavia, a complexidade da identificação de pseudogenes pode ser superada com análises in silico [11, 48, 47].

A identificação de pseudogenes é um esforço contínuo e, uma abordagem para identificá-los é aquela baseada em similaridade através de alinhamentos de sequências de proteínas ao DNA genômico total, utilizando programas de alinhamento de sequências como o BLAST (https://blast.ncbi.nlm.nih.gov/Blast.cgi) e/ou SSEARCH (http://rothlab.ucdavis.edu/genhelp/ssearch.html), seguido de filtragem adequada. Os pseudogenes encontrados por este método geralmente podem ser atribuídos a um gene ancestral [11]. Atualmente, existem diferentes métodos desenvolvidos por grupos independentes para identificar pseudogenes como PseudoPipe [49], PseudoFinder [50], PPFINDER [16] e PseudoGeneQuest [51] e algumas bases de dados como Consórcio ENCODE, HOPPSIGEN, Pseudofam e Pseudogene.Org e dreamBase [52-56] (Tabela 1).

Programa	Tipo de pseudogene	Organismo	Referência
PseudoPipe	Pseudogenes processados e não processados	Mamíferos	[49]
PseudoFinder	Pseudogenes processados e não processados	Bactérias e Archaea	[50]
PPFINDER	Pseudogenes processados	Mamíferos	[16]
PseudoGeneQuest	Pseudogenes processados ou duplicados	Humanos	[51]
PSILC	Pseudogenes processados e não processados	Não informado	[57]

Tabela 1: Resumo de métodos desenvolvidos por grupos independentes para identificar pseudogenes em diferentes organismos.

Programas para identificação de pseudogenes

Dentre os principais algoritmos utilizados estão:

PseudoPipe é um pipeline computacional baseado em similaridade, pode ser implementado em genoma de mamíferos, sendo projetado e melhor utilizado, para detectar os pseudogenes que não podem ser traduzidos em proteínas [49].

PseudoFinder é um script em linguagem de programação Python que detecta candidatos a pseudogene anotados nos genomas de bactérias e Archaea a partir de arquivos no formato Genbank [50].

PPFINDER é um programa baseado em linguagem de programação Perl que identifica pseudogenes processados, que tenham sido incorporados em qualquer anotação do genoma de mamíferos, assim, o programa é capaz de identificar tais pseudogenes processados e removê-los da anotação gênica [16].

PseudoGeneQuest é uma ferramenta online para anotação de pseudogene processados ou duplicação, no genoma humano. O serviço tem uma interface web amigável e fornece tempo de execução relativamente rápido. Outrossim, o programa mescla seus próprios resultados de pesquisa com o programa tBLASTn contra o genoma humano e anotações pré-existentes na base de dados pseudogene.org [51].

PSILC (Pseudogene Inference from Loss of Constraint) é uma ferramenta disponibilizada pelo Instituto Wellcome Genome e incorpora novos métodos para separar pseudogenes de genes funcionais [57].

Bases de dados de pseudogenes

Dentre as principais bases de dados utilizadas estão:

ENCODE (ENCyclopedia Of DNA Elements – Enciclopédia de elementos do DNA) (https://www.encodeproject.org/), tem como objetivo identificar todos os elementos funcionais codificados no genoma humano e mapear sistematicamente regiões de transcrição. O grupo também detectou uma lista de pseudogenes a partir de cinco métodos: GIS-PET do Genome Institute of Singapore, o método de anotação manual de pseudogene desenvolvido pela equipe de Análise e Anotação de Humanos e Vertebrados (HAVANA – Human and Vertebrate Analysis and Annotation) do Instituto Wellcome Trust Sanger, PseudoPipe do grupo de pesquisa da Universidade de Yale, PseudoFinder da Universidade da Califórnia em Santa Cruz (UCSC) e RetroFinder também da UCSC, focado especificamente em pseudogenes processados [52, 53].

HOPPSIGEN (http://pbil.univ-lyon1.fr/databases/hoppsigen.html) é uma base de dados nucleica de homólogos de pseudogenes processados compartilhados entre os genomas de camundongos e humanos. Ademais, contém informações relativas à localização genômica, função potencial e estrutura genética dos pseudogenes processados.

Pseudogene.Org (http://pseudogene.org/index.html) é um repositório baseado em MySQL que inclui mais de 100.000 pseudogenes anotados de 75 genomas, principalmente de humanos, camundongos e moscas. Os pseudogenes são classificados em processados, pseudogenes duvidosos, outros pseudogenes não processados (como pseudogenes unitários) e não classificados (devido à degradação do sinal ou ambiguidade estrutural). A base de dados foi criada com uma variedade de recursos dos quais permite a integração de informações de pseudogenes identificadas de diferentes fontes, possibilitando a interação de forma robusta com outros bancos de dados de pseudogene [54].

Pseudofam (http://pseudofam.pseudogene.org) é uma base de dados de famílias de pseudogenes baseada nas famílias de proteínas da base de dados Pfam. Ela fornece recursos para analisar a estrutura das famílias de pseudogenes, incluindo ferramentas de consulta, resumos estatísticos e alinhamentos de sequências. Contém ainda, mais de 125.000 pseudogenes identificados em 10 genomas eucarióticos e alinhados em aproximadamente 3.000 famílias (cerca de um terço do total de famílias em PfamA) [55].

DreamBase (DNA Modification, RNA Regulation and Protein Binding on Expressed Pseudogenes in Human Health and Disease) (https://rna.sysu.edu.cn/dreamBase/) é uma plataforma integrada que visa fornecer dados e ferramentas para estudar de forma abrangente as características e funções reguladoras de pseudogenes potencialmente expressos, bem como, a transcrição, expressão, regulação e modificação de pseudogenes em vários tipos tumorais e tecidos normais na saúde e na doença humana [56].

psiCube (http://pseudogene.org/psicube/) é uma base de dados que disponibiliza uma análise comparativa de anotação, atividade e evolução de pseudogenes em humanos, vermes e moscas. O site também disponibiliza famílias de pseudogenes em vários organismos, incluindo humanos, macacos, camundongos, peixes-zebra, vermes e moscas [58].

Validação dos pseudogenes anotados

Um fato relevante a ser considerado é que devido a erros iniciais de categorização, os pseudogenes são frequentemente excluídos das análises genômicas. Os pipelines e ferramentas de bioinformáticas são cada vez mais utilizados nas anotações genômicas e a curadoria dessas anotações podem levar a um maior refinamento dos dados anotados. Por exemplo, em uma análise, mais de 1.400 genes humanos, até então, rotulados como codificadores de proteínas, em três fontes principais de anotação de genes/proteínas humanas, foram estimados como não codificantes [59].

A fim de assegurar que não ocorra equívocos nas anotações e em sua propagação é aconselhável realizar a curadoria dos dados. Dentre as abordagens que podem ser utilizadas nas validações, destacam-se:

A utilização de programas de anotação de genes para validar a existência de mudança no quadro de leitura (frameshift), apesar da dificuldade em distinguir pseudogenes.
A validação de pseudogenes processados verificando características dos pseudogenes putativos e seu gene ancestral, tais como: presença de éxons e íntrons, cauda Poli-A, repetições curtas em suas extremidades 5′ e 3′ e menor teor de GC. Embora pseudogenes que foram processados e formados recentemente podem apresentar ausência de “deficiências” [11, 60, 61].
A investigação dos padrões de substituição de códons através da razão Ka/Ks (proporções de taxas de substituições não sinônimas para sinônimas) que podem indicar a falta de capacidade de codificação de proteínas [62-65].
A identificação de atributos que podem ser utilizados na caracterização dos pseudogenes como a falta de códon de início e/ou terminação. Tais características pseudogenicas podem estar acompanhadas por deficiências mais óbvias, como códons de terminação prematuros e mudanças no quadro de leitura [11].
Analisar as coordenadas genômicas disponíveis nas bases de dados e nos programas de anotação, a fim de remover duplicatas, anotadas com diferentes nomes [47].

Conclusões

Os recentes avanços no desenvolvimento tecnológico, estudos das “ômicas” e análises de bioinformática, permitiram a identificação de diversos pseudogenes em diferentes organismos, e possibilitou o reconhecimento do seu potencial funcional como reguladores gênicos, na saúde e na doença. Entretanto, devido a erros iniciais de categorização, os pseudogenes são frequentemente descartados das análises genômicas ou anotados de forma errônea. Tais problemas de anotação podem se tornar um grande problema para os grupos de pesquisa devido a propagação destas falhas. Por fim, fica evidente que os pseudogenes são importantes moléculas que necessitam de mais atenção dos grupos de pesquisas e torna-se fundamental realizar sua identificação e anotação de forma criteriosa e em larga escala. Ademais estudos in vitro e in vivo são relevantes para aplicação médica já descrita em análises primárias.

Referências

P. M. Harrison and M. Gerstein, “Studying genomes through the aeons: Protein families, pseudogenes and proteome evolution,” J. Mol. Biol., vol. 318, no. 5, pp. 1155–1174, 2002.
Y. Liu, P. M. Harrison, V. Kunin, and M. Gerstein, “Comprehensive analysis of pseudogenes in prokaryotes: widespread gene decay and failure of putative horizontally transferred genes.,” Genome Biol., vol. 5, no. 9, p. R64, 2004.
M. Gerstein and D. Zheng, “Real Life of Pseudogenes,” Sci. Am., pp. 48–55, 2006.
R. C. Pink, K. Wicks, D. P. Caley, E. K. Punch, L. Jacobs, and D. R. F. Carter, “Pseudogenes: pseudo-functional or key regulators in health and disease?,” RNA, vol. 17, no. 5, pp. 792–8, 2011.
P. R. Shidhi, P. Suravajhala, A. Nayeema, A. S. Nair, S. Singh, and P. K. Dhar, “Making novel proteins from pseudogenes,” Bioinformatics, vol. 31, no. 1, pp. 33–39, 2015.
J. R. Miller and G. G. Brownlee, “A Pseudogene laevis Structure in 5S DNA of Xenopus,” Cell, vol. 12, no. September, pp. 109–120, 1977.
A. J. Mighell, N. R. Smith, P. A. Robinson, and A. F. Markham, “Vertebrate pseudogenes,” FEBS Letters, vol. 468, no. 2–3. pp. 109–114, 2000.
Y. Tutar, “Pseudogenes,” Comp. Funct. Genomics, vol. 2012, pp. 6–9, 2012.
C. M. Ji, A. Y. Huang, W. L. Liu, G. H. Pan, and G. C. Wang, “Identification and bioinformatics analysis of pseudogenes from whole genome sequence of Phaeodactylum tricornutum,” Chinese Sci. Bull., vol. 58, no. 9, pp. 1010–1017, 2013.
E. Chiefari et al., “Methods to Study Protein-Binding to Pseudogene Transcripts,” 2021, pp. 187–202.
P. M. Harrison, “Computational Methods for Pseudogene Annotation Based on Sequence Homology,”, pp. 35–48, 2021.
D. T. Odom, P. Flicek, T. Keane, and T. Hubbard, “Pseudogenes in the mouse lineage: transcriptional activity and strain-specific history,” bioRxiv, 2018.
H. Gundlach, S. Twardziok, B. Chapman, C. Tan, P. Langridge, and V. M. Prade, “The pseudogenes of barley,” pp. 502–514, 2018.
W. Zhang et al., “Comparison of the A2 Gene Locus in Leishmania donovani and Leishmania major and Its Control over Cutaneous Infection *,” vol. 278, no. 37, pp. 35508–35515, 2003.
E. M. Muro, N. Mah, G. Moreno-Hagelsieb, and M. A. Andrade-Navarro, “The pseudogenes of Mycobacterium leprae reveal the functional relevance of gene order within operons,” Nucleic Acids Res., vol. 39, no. 5, pp. 1732–1738, 2011.
M. J. Van Baren and M. R. Brent, “Iterative gene prediction and pseudogene removal improves genome annotation,” Genome Res., vol. 16, no. 5, pp. 678–685, 2006.
F. H. C. Crick, “Central Dogma of Molecular Biology,” Nature, vol. 227, no. 5258. pp. 561–563, 1970.
E. C. Rouchka and E. Cha, “Current Trends in Pseudogene Detection and Characterization,” Curr. Bioinform., vol. 4, pp. 112–119, 2009.
W. Li, W. Yang, and X. J. Wang, “Pseudogenes: Pseudo or Real Functional Elements?,” J. Genet. Genomics, vol. 40, no. 4, pp. 171–177, 2013.
X. Shi, F. Nie, Z. Wang, and M. Sun, “Pseudogene-expressed RNAs: a new frontier in cancers,” Tumor Biol., vol. 37, no. 2, pp. 1471–1478, 2016.
M. C. Stensmyr, “Evolutionary Genetics : Smells like a Pseudo-pseudogene,” Curr. Biol., vol. 26, no. 24, pp. R1294–R1296, 2016.
L. L. Prieto-godino et al., “Funders Group Olfactory receptor pseudo-pseudogenes,” Eur. PMC, vol. 539, no. 7627, pp. 93–97, 2016.
J. Carron, R. Della Coletta, and G. J. Lourenço, “Pseudogene transcripts in head and neck cancer: Literature review and in silico analysis,” Genes (Basel)., vol. 12, no. 8, 2021.
S. A. Korneev, J. Park, and M. O. Shea, “Neuronal Expression of Neural Nitric Oxide Synthase (nNOS) Protein Is Suppressed by an Antisense RNA Transcribed from an NOS Pseudogene,” J. Neurosci., vol. 19, no. 18, pp. 7711–7720, 1999.
R. C. Pink and D. R. F. Carter, “Pseudogenes as regulators of biological function.,” Essays Biochem., vol. 54, pp. 103–12, 2013.
L. Poliseno, A. Marranci, and P. P. Pandolfi, “Pseudogenes in Human Cancer,” Front. Med., vol. 2, no. September, pp. 1–8, 2015.
I. K. Suzuki et al., “Human-Specific NOTCH2NL Genes Expand Cortical Neurogenesis through Delta/Notch Regulation,” Cell, vol. 173, no. 6, pp. 1370-1384.e16, 2018.
I. T. Fiddes et al., “Human-Specific NOTCH2NL Genes Affect Notch Signaling and Cortical Neurogenesis,” Cell, vol. 173, no. 6, pp. 1356-1369.e22, 2018.
M. Y. Dennis et al., “BAKER PRS-3000.pdf,” vol. 149, no. 4, pp. 912–922, 2012.
J. De Marchena, W. Jin, P. Vanderhaeghen, and A. Ghosh, “Induces Neoteny During Spine Maturation,” vol. 149, no. 4, pp. 923–935, 2013.
D. Zheng and M. B. Gerstein, “The ambiguous boundary between genes and pseudogenes: the dead rise up, or do they?,” Trends Genet., vol. 23, no. 5, pp. 219–224, 2007.
L. Y. Zhou et al., “Pseudogene BMI1P1 expression as a novel predictor for acute myeloid leukemia development and prognosis,” Oncotarget, vol. 7, no. 30, pp. 47376–47386, 2016.
W. Li and Y. Li, “The pseudogene URAHP promotes proliferation and regulates the pathogenesis of preeclampsia,” Am. J. Transl. Res., vol. 12, no. 8, pp. 4715–4727, 2020.
H. Zheng, M. Shi, Z. Chi, H. Wang, H. Wang, and D. Xu, “Dysregulated pseudogene BNIP3P1 inhibited cell proliferation and promoted cell apoptosis in preeclampsia by acting as a competing endogenous RNA for BNIP3,” Environ. Toxicol., vol. 37, no. 5, pp. 971–982, 2022.
T. F. Kovalenko and L. I. Patrushev, “Pseudogenes as Functionally Significant Elements of the Genome,” Biochem., vol. 83, no. 11, pp. 1332–1349, 2018.
E. Chiefari et al., “Pseudogene-mediated posttranscriptional silencing of HMGA1 can result in insulin resistance and type 2 diabetes,” Nat. Commun., vol. 1, no. 4, pp. 1–7, 2010.
Y. Qi, X. Wang, W. Li, D. Chen, H. Meng, and S. An, “Pseudogenes in Cardiovascular Disease,” Front. Mol. Biosci., vol. 7, no. February, pp. 1–9, 2021.
B. V. Chakravarthi et al., “Pseudogene Associated Recurrent Gene Fusion in Prostate Cancer,” Neoplasia (United States), vol. 21, no. 10, pp. 989–1002, 2019.
X. Chen, L. Wan, W. Wang, W. J. Xi, A. G. Yang, and T. Wang, “Re-recognition of pseudogenes: From molecular to clinical applications,” Theranostics, vol. 10, no. 4, pp. 1479–1499, 2020.
W. Lou, B. Ding, and W. Fan, “High Expression of Pseudogene PTTG3P Indicates a Poor Prognosis in Human Breast Cancer,” Mol. Ther. – Oncolytics, vol. 14, no. September, pp. 15–26, 2019.
C. Yue et al., “Pseudogene DUXAP10 acts as a diagnostic and prognostic marker and promotes cell proliferation by activating PI3K/AKT pathway in hepatocellular carcinoma,” Onco. Targets. Ther., vol. 12, pp. 4555–4566, 2019.
C. Yue et al., “Pseudogene DUXAP10 can be used as a diagnostic and prognostic biomarker in human cancers,” J. Cell. Physiol., vol. 234, no. 12, pp. 23685–23694, 2019.
S. Wang and J. Yu, “Long non-coding RNA transcribed from pseudogene PPIAP43 is associated with radiation sensitivity of small cell lung cancer cells,” Oncol. Lett., vol. 18, no. 5, pp. 4583–4592, 2019.
X. Q. Liu, A. Tufman, R. Kiefl, G. F. Li, Q. L. Ma, and R. M. Huber, “Identification of lung adenocarcinoma-specific exosome RNAs in peripheral blood by RNA-Seq analysis,” Eur. Rev. Med. Pharmacol. Sci., vol. 24, no. 4, pp. 1877–1886, 2020.
S. Tang and Y. Zhuge, “An immune-related pseudogene signature to improve prognosis prediction of endometrial carcinoma patients,” Biomed. Eng. Online, vol. 20, no. 1, pp. 1–19, 2021.
L. Xiao-Jie, G. Ai-Mei, J. Li-Juan, and X. Jiang, “Pseudogene in cancer: Real functions and promising signature,” J. Med. Genet., vol. 52, no. 1, pp. 17–24, 2015.
A. Meller and F.-M. Boisvert, “Mining Proteomics Datasets to Uncover Functional Pseudogenes,”, pp. 241–251, 2022.
C. Sisu et al., “Comparative analysis of pseudogenes across three phyla,” Proc. Natl. Acad. Sci. U. S. A., vol. 111, no. 37, pp. 13361–13366, 2014.
Z. Zhang, N. Carriero, D. Zheng, J. Karro, P. M. Harrison, and M. Gerstein, “Genome analysis PseudoPipe : an automated pseudogene identification pipeline,” vol. 22, no. 12, pp. 1437–1439, 2006.
M. J. Syberg-Olsen, A. I. Garber, P. J. Keeling, P. John, and F. Husnik, “Pseudofinder : detection of pseudogenes in prokaryotic genomes,” bioRxiv, 2021.
C. Ortutay and M. Vihinen, “PseudoGeneQuest – Service for identification of different pseudogene types in the human genome,” BMC Bioinformatics, vol. 9, pp. 1–6, 2008.
E. N. C. O. D. E. P. Consortium et al., “An integrated encyclopedia of DNA elements in the human genome.,” Nature, vol. 489, no. 7414, pp. 57–74, 2012.
C. A. Davis et al., “The Encyclopedia of DNA elements (ENCODE): data portal update,” vol. 46, no. November 2017, pp. 794–801, 2018.
J. E. Karro et al., “Pseudogene.org: a comprehensive database and comparison platform for pseudogene annotation,” vol. 35, no. November 2006, pp. 55–60, 2007.
H. Y. K. Lam et al., “Pseudofam: The pseudogene families database,” Nucleic Acids Res., vol. 37, no. SUPPL. 1, pp. 738–743, 2009.
L. L. Zheng et al., “DreamBase: DNA modification, RNA regulation and protein binding of expressed pseudogenes in human health and disease,” Nucleic Acids Res., vol. 46, no. D1, pp. D85–D91, 2018.
L. Coin and R. Durbin, “Improved techniques for the identification of pseudogenes,” Bioinformatics, vol. 20, no. SUPPL. 1, 2004.
C. Sisu et al., “Comparative analysis of pseudogenes across three phyla,” Proc. Natl. Acad. Sci., vol. 111, no. 37, pp. 1407293111-, 2014.
F. Abascal et al., “Loose ends: Almost one in five human genes still have unresolved coding status,” Nucleic Acids Res., vol. 46, no. 14, pp. 7070–7084, 2018.
G. Liu, X. Cui, H. Li, and L. Cai, “Evolutionary direction of processed pseudogenes,” Sci. China Life Sci., vol. 59, no. 8, pp. 839–849, 2016.
E. Khurana, H. Y. K. Lam, C. Cheng, N. Carriero, P. Cayting, and M. B. Gerstein, “Segmental duplications in the human genome reveal details of pseudogene formation,” Nucleic Acids Res., vol. 38, no. 20, pp. 6997–7007, 2010.
Z. Zhang, P. M. Harrison, Y. Liu, and M. Gerstein, “Millions of years of evolution preserved: A comprehensive catalog of the processed pseudogenes in the human genome,” Genome Res., vol. 13, no. 12, pp. 2541–2558, 2003.
Z. Yu, D. Morais, M. Ivanga, and P. M. Harrison, “Analysis of the role of retrotransposition in gene evolution in vertebrates,” BMC Bioinformatics, vol. 8, pp. 1–13, 2007.
D. Torrents, M. Suyama, E. Zdobnov, and P. Bork, “A genome-wide survey of human pseudogenes,” Genome Res., vol. 13, no. 12, pp. 2559–2567, 2003.
Z. Zhang, P. Harrison, and M. Gerstein, “Identification and analysis of over 2000 ribosomal protein pseudogenes in the human genome,” Genome Res., vol. 12, no. 10, pp. 1466–1482, 2002.

04 Baixar

Deixe um comentário Cancelar resposta

One thought on “A Bioinformática na busca implacável: Onde estão os pseudogenes?”

Desafios na padronização da anotação genômica – BIOINFO
· 25 de julho de 2023 at 13:41

[…] diminui a acurácia da anotação, já que por vezes pode alterar a fase de leitura ou levar a predição de pseudogenes […]