Genômica comparativa de Ornithorhynchus anatinus revela genes mais próximos de tartarugas do que de outros mamíferos

140
0

O Ornithorhynchus anatinus, popularmente conhecido como ornitorrinco, é um mosaico de características por conter o bico semelhante ao de pato, a postura de ovos e a produção de leite sem a saída por mamilos. Ao comparar o seu proteoma com outros organismos, é possível investigar pistas da origem de seus genes e a proximidade deles de outros grupos. Dessa forma, o presente estudo tem como objetivo explorar a genômica comparativa do ornitorrinco, através da obtenção e análise de proteomas completos de organismos eucariontes. Para isso, foram utilizados 2.765 proteomas de referência obtidos do UniProt, incluindo o do ornitorrinco. O conjunto foi utilizado na construção de uma base de dados no software DIAMOND, e o proteoma do ornitorrinco foi alinhado utilizando a função BLASTp, com aplicação de diferentes faixas do parâmetro –top para análise do LCA dos genes mais similares aos dele. Os resultados indicaram que maior parte dos genes apresentaram como LCA a própria espécie, refletindo o efeito do self-score elevado. À medida que o intervalo top aumentou, observou-se que a incorporação de genes com ancestrais mais profundos, como a linhagem Gnathostomata. Além disso, a classe que reúne as tartarugas apresenta-se como a mais ocorrente para aqueles genes que tiveram hits contendo apenas o ornitorrinco como representante dos mamíferos. As análises de enriquecimento funcional desse subconjunto, bem como suas reconstruções filogenéticas, identificaram termos associados à formação da casca do ovo e confirmaram que as tartarugas são mais próximas do ornitorrinco para esse subconjunto, refletindo um caso potencial de homologia profunda e evidenciando a natureza mosaica do genoma dos monotremados.

Autores: Ryan Fernandes Vieira de Souza, José Miguel Ortega

1. Introdução

O Onithorhynchus anatinus (Figura 1), junto com a equidna (Tachyglossus aculeatus), são os únicos mamíferos que põem ovos (ovíparos) e são membros da ordem Monotremata [1]. Com uma peculiar mistura de características, o ornitorrinco tem uma pelagem adaptada ao habitat aquático; as fêmeas têm a capacidade de amamentar e botar ovos; e os machos têm um veneno em seu bico semelhante ao dos répteis [2].

Figura 1. Ilustração de um de ornitorrinco (Ornithorhynchus anatinus). Fonte: Wikimedia Commons (CC BY-SA 4.0).

 

Os monotremados por ocuparem uma posição basal entre os Amniotas não mamíferos e os Therianos (marsupiais e placentários), constituem um grupo-chave para compreender a transição evolutiva até os mamíferos modernos [3]. Nesse âmbito, a genômica comparativa tem um importante papel em estudar os genes desses organismos buscando compreender a evolução de suas características compartilhadas por ancestralidade comum [4]. Entre os conceitos fundamentais da área está o de homologia profunda (deep homology), que é um fenômeno no qual genes, redes regulatórias ou módulos de desenvolvimento extremamente conservados são reutilizados ao longo da evolução em linhagens muito distantes. Assim, estruturas ou funções aparentemente inovadoras podem, na realidade, emergir de arcabouços genéticos mais ancestral que se imagina [5]. Em organismos como o ornitorrinco, que retém tanto características típicas de mamíferos quanto traços mais próximos de aves e répteis, a homologia profunda fornece uma possível explicação quando genes específicos apresentam maior similaridade com linhagens distantes ao invés de outros organismos da mesma linhagem, nesse caso os mamíferos. Apesar de sua forte importância, estudos de genômica comparativa enfrentam limitações que podem influenciar a interpretação dos resultados. Uma delas é a ausência de genomas completos e de alta qualidade para uma boa parte da biodiversidade eucariótica, o que faz com que se crie lacunas filogenômicas que distorcem análises e inferências do último ancestral comum (LCA – Least Common Ancestor). Por exemplo, até 2011 estimava-se que entre 1,5 e 1,9 milhão de espécies eucariontes haviam sido formalmente descritas [6]. No entanto, até o final de 2024, apenas cerca de 3.039 a 4.000 espécies tiveram seus genomas sequenciados no âmbito do Earth BioGenome Project e de iniciativas associadas [7]. Essa escassez gera vieses de amostragem, nos quais o LCA passa a refletir artificialmente o último ancestral comum que simplesmente reúne os organismos com proteomas completos disponíveis no banco. Como consequência, a classificação tende a ser aproximada e não exata, aumentando uma probabilidade significativa de uma predição exagerada de atribuições filogenéticas inflacionadas [8]. Dessa forma, embora com ressalvas pela necessidade de bancos de dados mais abrangentes e representativos, a investigação da distribuição de LCA dos genes do ornitorrinco em múltiplos níveis de alinhamento torna-se uma abordagem ainda relevante para compreender a proximidade evolutiva desses genes ao longo da linhagem dos eucariotos e sustentar interpretações sobre o mosaico genômico característico desse monotremado.

2. Desenvolvimento

Figura 2: Fluxograma das etapas utilizadas para investigar a evolução gênica do ornitorrinco. O diagrama apresenta todas as etapas do processo, iniciando pela obtenção dos proteomas completos da divisão Reference proteomes (UniProt) seguido pela formatação da base e os subsequentes passos feitos através da ferramenta DIAMOND. Os alinhamentos são feitos aplicando diferentes faixas de top hit (5%, 10% e 15%), gerando as saídas em formato LCA. Esses resultados são então integrados ao banco Taxallnomy para recuperar a distribuição taxonômica dos LCAs, seguida por análises de enriquecimento funcional e reconstrução filogenética.

 

Para explorar a evolução gênica do ornitorrinco, é essencial reunir um grande conjunto de proteínas. Essas informações estão disponíveis em bancos de dados públicos, como o UniProt (https://uniprot.org), que reúne sequências de milhares de organismos. Entre suas coleções, destaca-se a seção Reference Proteomes, que reúne, no final do ano de 2025, mais de 35 mil proteomas completos e manualmente revisados para cada espécie. Dentre eles, mais de 2.700 pertencem ao domínio Eukaryota, totalizando quase 50 milhões de sequências disponíveis para estudos. No caso do ornitorrinco, o UniProt disponibiliza mais de 17 mil sequências de proteínas completas, o que permite compará-lo com diversos outros organismos e contribuindo para compreender melhor a evolução e as particularidades biológicas desse animal tão singular. Com esse conjunto de dados em mãos, utilizamos ferramentas modernas capazes de comparar proteínas em larga escala de forma rápida e eficiente. Uma das mais citadas é o software DIAMOND, desenvolvido para encontrar rapidamente similaridades entre sequências, mantendo uma sensibilidade comparável à do tradicional BLAST, do NCBI (https://blast.ncbi.nlm.nih.gov/Blast.cgi). Essa ferramenta compara cada proteína do organismo do nosso interesse, nesse caso, o ornitorrinco, com um vasto conjunto de proteínas de outras espécies, aqui representadas por organismos do domínio Eukaryota. Ela também disponibilizada diferentes formatos de saída para os alinhamentos. Um deles é o formato LCA acessado pela flag -f 102, que identifica qual é o ancestral comum mais recente compartilhado pelos resultados para cada query (com escore acima de determinada % do melhor escore) dentro de um limiar de similaridade definida pelo usuário, com a flag –top %. No presente estudo, aplicamos três diferentes faixas de top (5%, 10% e 15%) e analisamos a distribuição de LCAs entre elas. Essa saída retorna o TaxId do NCBI correspondente ao LCA e recuperar as informações taxonômicas desse identificador, como por exemplo: “Qual é a classe pertencente a esse LCA?”, a ferramenta Taxallnomy (http://bioinfo.icb.ufmg.br/taxallnomy/) é uma excelente opção, pois permite que seus dados em formato de tabelas sejam integrados a algum banco de dados relacional local, como o MariaDB, baseado na linguagem SQL. Esta ferramenta complementa e corrige inconsistências da Taxonomy do NCBI, interpolando categorias taxonômicas ausentes, como o nível “Cla_of_Testudinata” para a classe de tartarugas.

3. Resultados e Discussão

As análises iniciais revelaram um padrão esperado no conjunto gênico do ornitorrinco. A maior parte das sequências apresentou o LCA na própria espécie, sobretudo nos limiares mais restritivos de alinhamento. Esse comportamento decorre do fato de que o filtro top é baseado no score do best hit, o que gera um viés quando o proteoma de entrada também está presente na base de comparação. Nessas condições, o self-score elevado tende a excluir, nos intervalos de top mais estreitos, hits com scores inferiores, justamente aqueles mais divergentes, porém essenciais para investigar a história evolutiva de genes menos conservados, pois esses genes podem marcar inovações específicas da linhagem quando analisados mais a fundo. Por outro lado, à medida que os intervalos de top foram ampliados, surgiu um número crescente de genes cujo ancestral comum mais antigo remonta à linhagem Gnathostomata, nosso ancestral com tubarões. Esse comportamento reflete a inclusão de hits menos similares, que tendem a recuperar relações filogenéticas mais distantes. Um resultado particularmente intrigante emergiu quando focamos nos genes cujos alinhamentos não recuperaram outros representantes de Mammalia além do ornitorrinco. Nesses casos, a classe que reúne as tartarugas surgiu como o grupo mais recorrente. A análise funcional com Gene Ontology deste subconjunto identificou vários genes, entre os quais haviam genes associados a processos ligados à formação da casca do ovo. As reconstruções filogenéticas manuais dessas proteínas reforçaram essa observação, indicando que a classe que reúne as tartarugas aparece consistentemente como o táxon de maior proximidade filogenética relacionado a esses genes, em comparação aos demais mamíferos. Esse padrão não deve ser interpretado apenas como uma afinidade filogenética entre monotremados e tartarugas, mas sim como possível evidência de uma homologia profunda, ou seja, a persistência e reutilização de repertórios genéticos ancestrais relacionados à reprodução ovípara. No caso dos monotramados, alguns componentes moleculares associados à produção, deposição mineral ou organização estrutural da casca do ovo podem ter sido conservados de maneira mais próxima ao padrão dos ovos das tartarugas, enquanto os mamíferos posteriores aos monotremados, por terem perdido completamente a oviparidade, abandonaram ou modificaram profundamente essas vias.  Esses resultados, portanto, revelam que, embora o ornitorrinco pertença à classe Mammalia, uma fração específica de seu repertório gênico, especialmente genes relacionados à formação de ovos, apresenta maior proximidade evolutiva com Testudines do que com outros mamíferos, reforçando o papel da homologia profunda como mecanismo explicativo para a retenção de características genéticas ancestrais em linhagens filogeneticamente distantes.

Agradecimentos. À Fundação de Amparo à Pesquisa do Estado de Minas Gerais (FAPEMIG) e ao Programa Interunidades de Pós-Graduação em Bioinformática – ICB/UFMG.

5. Referências

[1] Griffiths, M. The platypus. Scientific American, Vol. 258, p. 84-91 (1988). doi: https://www.jstor.org/stable/10.2307/24989089 

[2] Warren, W C et al. Platypus genome analysis reveals unique evolution signatures. Nature, V. 453 p. 175–183 (2008). doi: https://www.nature.com/articles/nature06936 

[3] Rheede T v et al. The Platypus Is in Its Place: Nuclear Genes and Indels Confirm the Sister Group Relation of Monotremes and Therians. Molecular Biology and Evolution, V. 23 Issue 3 p. 587–597 (2006). doi: https://doi.org/10.1093/molbev/msj064 

[4] Zhang D et al. Homoplasy or plesiomorphy? Reconstruction of the evolutionary history of mitochondrial gene order rearrangements in the subphylum Neodermata. International Journal for Parasitology, V 49 p 819-829 (2019). doi: https://doi.org/10.1016/j.ijpara.2019.05.010

[5] Shubin, N et al. Deep homology and the origins of evolutionary novelty. Nature V 457 p 818–823 (2009). doi: https://doi.org/10.1038/nature07891

[6] Sweetlove, L. Number of species on Earth tagged at 8.7 million. Nature (2011). https://doi.org/10.1038/news.2011.498

[7] Eric Meunier E. The genome of 1.8 million species is being sequenced. infOGM – Citizen information watchdog on GMOs and seeds (2024). Disponível em: https://infogm.org/en/the-genome-of-1-8-million-species-is-being-sequenced/#sdendnote4sym. Acesso em: 25/11/2025.

[8] Huson, D H et al. MEGAN analysis of metagenomic data. Genome Research V 17 p 377-386 (2007). doi:  https://doi.org/10.1101/gr.5969107

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *