O projeto Genoma Humano começou em 1990 e alcançou seu primeiro grande resultado em 2001, quando foi publicada a primeira montagem completa de todos os cromossomos humanos simultaneamente nas revistas Nature e Science [1]. Essa primeira montagem nos trouxe informações que ainda são discutidas na comunidade científica, como o fato de que apenas 3% do genoma humano representa sequências associadas a genes e que o ser humano possui cerca de 30 a 40 mil genes, valor muito similar ao de vários parasitas, seres que eram considerados “menos complexos”. Em 2022, com a possibilidade de sequenciarmos fragmentos de tamanhos maiores, alcançamos o objetivo final criado em 1990: um sequenciamento e montagem completa de um genoma humano do início ao fim [2].
Esse novo sequenciamento foi chamado “de telômero a telômero”, os telômeros sendo uma região altamente repetitiva no início e no fim de todos os cromossomos. Essa nova montagem do genoma humano de forma impressionante reduziu ainda mais o número de genes para entre 20 e 25 mil. De 2001 até hoje, foi descoberto que a grande parte da variabilidade humana estava na produção de RNA e não do DNA, isso ocorre pois durante processamento do RNA recém transcrito do “molde” do gene, cada gene pode ser processado em vários RNAs maduros diferentes e estes, inclusive podem codificar diferentes proteínas e vários RNAs que não codificam proteínas. Genes que são, a princípio, não codificadores de proteínas, como os RNAs longos não codificadores possuem ainda mais formas de RNA maduro diferentes se comparados com genes codificadores [3] (Figura 1). Essa grande variabilidade no nível do RNA é o que difere os vertebrados dos demais seres vivos e vários RNAs produzidos a partir do mesmo gene podem ser processados e ter funções completamente diferentes da proteína que é associada à tradução daquele locus.
Sendo assim, como nomear cada gene? Normalmente o nome dado a um gene está associado a sua função, por exemplo, o gene humano TP53 vem do inglês Tumor Protein 53, ou proteína associada a tumores 53. No entanto, esse gene possui 27 RNAs que são transcritos a partir de seu locus, a grande maioria deles produtores de proteínas e que variam de 175 a 2580 pares de base no tamanho do RNA. Por essa grande variabilidade de tamanho é de se esperar que essas proteínas possuem funções distintas umas das outras, então o nome TP53 acaba não representando a função do gene, somente a primeira função que foi associada a ele.
Um artigo recentemente publicado [4] discute exatamente isso, que as nomeações de genes que temos hoje prejudicam análises subsequentes e mesmo a interpretação de características moleculares associadas a certo gene. Por exemplo, se o gene GENE está associado à doença Y, nada impede um clínico que estuda a doença Z e encontra esse gene presente em seus pacientes, pense que ambas as doenças poderiam compartilhar mecanismos parecidos. Ou mesmo que a presença da expressão um gene em certa condição seja erroneamente associada a presença de sua proteína, quando na maioria das vezes não é o caso. Os autores chegaram à conclusão de que a melhor forma seria de que cada gene fosse anotado e depositado em bancos públicos associados a todas as suas possíveis funções e a todos os RNAs associados a este que também têm funções biológicas descritas. Isso permitiria uma melhor descrição do gene com todas as suas funções e auxiliaria bioinformatas e outros profissionais na interpretação de resultados de sequenciamentos.
Referências
[1] LANDER, E. S. et al. Initial sequencing and analysis of the human genome. Nature, v. 409, n. 6822, p. 860–921, 2001.
[2] NURK, S. et al. The complete sequence of a human genome. Science (New York, N.Y.), v. 376, n. 6588, p. 44–53, 2022.
[3] CONCEIÇÃO, I. M. C. A. et al. Metformin treatment modulates long non-coding RNA isoforms expression in human cells. Non-coding RNA, v. 8, n. 5, p. 68, 2022.
[4] AMARAL, P. et al. The status of the human gene catalogue. 2023. Disponível em: <http://arxiv.org/abs/2303.13996>. Acesso em: 13 jul. 2023.
Autora: Izabela Mamede https://orcid.org/0000-0002-0707-5588
Revisão: Luana Bastos; Bárbara Rebeca de Macedo Pinheiro
Cite este artigo:
Conceição, IMCA. O problema da nomeação dos genes. BIOINFO. ISSN: 2764-8273. Vol. 3. p.03 (2023). doi: 10.51780/bioinfo-03-03
[…] O problema da nomeação dos genes […]
[…] O problema da nomeação dos genes […]