As conexões invisíveis da vida: o papel das interações proteína-RNA e suas aplicações tecnológicas

As interações entre proteínas e RNA são um dos pilares da regulação celular. A compreensão dessas interações é essencial para desvendar os mecanismos de reconhecimento molecular e as funções que essas macromoléculas realizam. O estudo estrutural dos complexos proteína-RNA tem sido impulsionado por avanços em técnicas experimentais. Entretanto, a limitação de dados estruturais disponíveis, bem como custo e dificuldades de lidar com a flexibilidade do RNA, ainda representam um desafio para a consolidação do conhecimento nessa área. Discutir a importância do estudo dessas interações e a aplicação de metodologias de bioinformática é fundamental para o desenvolvimento de metodologias que ajudem a compreender os mecanismos da regulação celular. Além disso, esse entendimento ajuda a embasar pesquisas voltadas a patologias associadas à disfunção de complexos proteína-RNA e o desenvolvimento de novas terapias.

Autores: Luana Luiza Bastos, Tatiane Senna Bialves, Raquel Minardi

1. Introdução

O bom funcionamento celular depende da interação constante entre moléculas. Essas interações formam uma rede de comunicações invisível, que conduz e regula inúmeros processos. Essas interações são fundamentais para, por exemplo, determinar quando um gene será ativado ou quando a resposta a um estímulo deve começar. Entre os protagonistas dessa rede de interação, encontramos as proteínas e o ácido ribonucleico (RNA), duas macromoléculas essenciais para o equilíbrio celular [1].

Proteínas são moléculas fundamentais para a vida. Elas possuem múltiplas funções, como dar suporte e controlar processos celulares. Um grupo específico é especializado em interagir com as moléculas de RNA, são elas as proteínas de ligação do RNA (RNA-binding proteins ou RBPs) [2]. O RNA, por sua vez, também possui diferentes funções. Embora sua atribuição mais famosa seja a de mensageiro, sabemos que o RNA também atua como um coordenador, regulando diversas atividades celulares. Podemos dividir os RNAs em dois grupos principais: os construtores e os reguladores [3].

● Construtores: incluem o mRNA (RNA mensageiro), a molécula que atua como molde contendo as instruções para a tradução em proteína. O tRNA (RNA transportador), que tem como função transportador de aminoácidos até o ribossomo para a tradução. E por fim, o rRNA (RNA ribossômico), que é um componente principal da estrutura do ribossomo [3].

● Reguladores: Os RNAs reguladores são RNAs que participam do controle celular. Existem vários RNAs nessa classe, mas podemos citar como exemplo os miRNAs (microRNAs), que atuam como interruptores, ou seja, desligam a produção de proteínas específicas. E os lncRNAs (RNAs longos não codificantes), que atuam como coordenadores, ajudando a organizar quando e como diferentes genes devem funcionar [3].

Sabe-se que muitas funções tanto do RNA, quanto da proteína são dependentes da interação dessas macromoléculas ocorrerem de forma correta. Diversos estudos atuais demonstraram que a falha nessas interações tem correlação direta com algumas doenças, como o câncer, o que torna esses complexos alvos promissores para o desenvolvimento de novos fármacos. E nesse sentido, o estudo estrutural dessas interações é fundamental para o entendimento desses processos biológicos, bem como o desenvolvimento de novas terapias direcionadas [4-5].

Apesar de técnicas modernas como a criomicroscopia nos fornecerem uma visão tridimensional (3D) dessas interações moleculares, os métodos experimentais enfrentam gargalos significativos. A realização de análises experimentais são processos de alto custo e com alta demanda de tempo [6-7]. Além disso, existem dificuldades associadas à natureza desses complexos. Por exemplo, os RNAs são altamente dinâmicos e flexíveis. Eles podem apresentar inúmeros dobramentos alternativos, o que muitas vezes dificulta a sua resolução por métodos experimentais. Ademais, complexos proteína-RNA são sensíveis à degradação por RNases (ribonucleases), enzimas que hidrolisam RNA e apresentam características como a facilidade de precipitação, o que dificulta a realização de análises experimentais [5-7].

É neste cenário que a bioinformática se torna uma ferramenta de grande utilidade para o entendimento desses complexos. Através da bioinformática estrutural, é possível realizar simulações e modelagens computacionais, que ajudam a prever interações ainda não observadas experimentalmente [8-9].

Além disso, modelos de inteligência artificial têm contribuído significativamente para a área. Esses modelos são capazes de aprender padrões complexos, utilizando grandes volumes de dados, para prever funções e comportamentos moleculares com alta precisão. Logo, essas abordagens multidisciplinares podem ajudar a preencher as lacunas do conhecimento no entendimento de complexos proteína-RNA [8-9].

2. Desenvolvimento

As RBPs são um conjunto de proteínas que regulam processos celulares vitais ao interagir com o RNA. Atualmente, elas formam um grupo de mais de 2.000 proteínas identificadas, que interagem com o RNA através de motivos de ligação presentes na estrutura da proteína [4-6].

O mau funcionamento de sua interação com o RNA mostrou-se diretamente ligado a diversas doenças, como câncer, distúrbios neurodegenerativos e cardiovasculares [4-6]. Nesse contexto, o estudo das interações proteína-RNA torna-se fundamental para o desenvolvimento de novos tratamentos [4-6]. No entanto, as RBPs são consideradas alvos terapêuticos complexos. Isso ocorre devido à dificuldade de bloquear as interações isoladas sem afetar outras vias essenciais à célula, desencadeando um efeito cascata [4-6]. Esse aspecto é fundamental, uma vez que muitas dessas proteínas e complexos atuam em mais de uma via de sinalização e regulação [5,6].

Nesse sentido, diversas estratégias inovadoras vêm sendo pesquisadas para superar esses desafios. Um exemplo de estratégia desenvolvida recentemente é o uso de esponjas moleculares. Em vez de propor metodologias para bloquear a proteína, essa abordagem utiliza RNAs terapêuticos (como os RNAs circulares) para sequestrar a RBP-alvo. Esses RNAs são projetados para capturar e neutralizar uma RBP específica, como já foi demonstrado com sucesso na proteção do coração em modelos animais [10].

Um outro exemplo é a utilização do RNA como um inibidor direto. Nesse caso, RNAs como os aptâmeros ligam-se a uma proteína para neutralizar sua função. Estas moléculas de RNA são projetadas para se dobrarem em estruturas 3D complexas, funcionando como se fossem uma espécie de anticorpos de RNA. Essas moléculas já demonstraram ser capazes de bloquear proteínas patogênicas com alta especificidade [11-13].

Para exemplificar, temos o complexo da Figura 1. Ele foi obtido em um estudo que investigava a estrutura do complexo entre a proteína ribossômica bacteriana S8 e um RNA artificial (aptâmero), utilizando o RNA como um inibidor (uma molécula que impediria o ribossomo de realizar sua função). Neste trabalho, foi observado que o aptâmero, ao se ligar à proteína, reorganiza drasticamente sua própria forma para imitar o sítio de ligação do ligante natural dessa proteína. Esses achados demonstraram a notável flexibilidade estrutural do RNA e o potencial terapêutico dessas estratégias [13].

Figura 1. Complexo entre a proteína S8 e um aptâmero de RNA [13]. Em verde observamos a estrutura do aptâmero e em roxo a estrutura da proteína S8

Nesse cenário, a bioinformática tem se tornado uma aliada essencial para entender como proteínas e RNA se reconhecem e se conectam dentro das células. Ferramentas como o HDOCK [14] e o RnaX [15] permitem realizar o acoplamento molecular (docking) entre proteínas e RNAs, ajudando a simular e visualizar como essas moléculas interagem. Outras ferramentas, como o RBPsuite [16], utilizam inteligência artificial para prever quais trechos do RNA são reconhecidos por proteínas específicas. Além disso, existem recursos como o DSSR [17], projetado para identificar modificações presentes no RNA e predizer as suas possíveis conformações alternativas. Ademais, muitos dos estudos in silico desses complexos se apoiam em bancos de dados, como o PRIDB [18] e o NPIDB [19], que reúnem estruturas e interações já observadas experimentalmente, servindo de base para novas descobertas. Um avanço recente veio com o AlphaFold3 [20], desenvolvido pela DeepMind. A ferramenta demonstrou ser capaz de modelar não apenas proteínas isoladas, mas também complexos formados por proteínas, RNAs, DNAs e pequenas moléculas [21-22].

As interações entre proteínas e RNA são extremamente diversas e dinâmicas. Logo, compreender completamente como elas acontecem e o que ocorre quando falham continua sendo um dos grandes desafios da biologia moderna e da bioinformática estrutural [20-22]. Como dito anteriormente, do ponto de vista experimental, características como alta flexibilidade, facilidade de degradação e precipitação dificultam a cristalização ou a captura desses complexos por técnicas como criomicroscopia eletrônica, cristalografia e ressonância magnética nuclear [6-8].

Quando realizamos análises de complexos proteína-RNA in silico, também observamos inúmeros desafios. A capacidade do RNA de adotar conformações alternativas, sua alta flexibilidade e a presença de modificações são grandes pontos de atenção. Essas características tornam difícil prever com precisão suas conformações possíveis e suas interações com proteínas utilizando ferramentas computacionais [6-8,14-20]. Além disso, a superfície de interação de complexos proteína-RNA costuma ser extensa e altamente dependente do contexto celular. Essas características, somadas à alta flexibilidade do RNA, limitam o desempenho de métodos de docking, por exemplo. As ferramentas de predição de estrutura, por sua vez, enfrentam limitações relacionadas à escassez de dados experimentais de alta qualidade. Ademais, o desequilíbrio entre os diferentes tipos de complexos disponíveis nos bancos de dados, bem como a pouca disponibilidade de informações de afinidade experimental, dificultam a criação de modelos de inteligência artificial [14-20].

Além disso, a eficiência e a reprodutibilidade das análises computacionais são diretamente dependentes da curadoria e padronização dos dados estruturais. Atualmente, a fragmentação da informação e a ausência de anotações consistentes dificultam a construção de modelos preditivos robustos. A criação de bases de dados curadas e voltadas para esses complexos é, portanto, crucial para aumentar a acurácia desses métodos, fortalecer a integração com dados experimentais e viabilizar o desenvolvimento de novas terapias baseadas em RNA [21-23].

3. Conclusão

As interações entre proteínas e RNA são pilares da regulação gênica e de inúmeros processos celulares. A sua desregulação tem se mostrado relacionada a doenças como o câncer, o que as torna alvos terapêuticos de grande potencial. Contudo, o avanço no desenvolvimento de novas terapias, incluindo as baseadas em RNA, é afetado diretamente pelas limitações na realização de experimentos de bancada, pela dificuldade de lidar com a alta flexibilidade do RNA in silico e experimentalmente, bem como pela falta de dados precisos sobre esses complexos [4,6,21-22].

Portanto, investir na geração de dados experimentais por meio de técnicas como a criomicroscopia, aliado ao desenvolvimento de pipelines de bioinformática para curadoria, integração e análise estrutural, é fundamental para o entendimento desses complexos. Da mesma forma, a criação de bases de dados especializadas em complexos proteína–RNA torna-se essencial para consolidar e disponibilizar esse conhecimento. Por fim, o estudo aprofundado dessas interações permite compreender melhor inúmeros mecanismos moleculares e, ao mesmo tempo, impulsiona o desenvolvimento de medicamentos mais precisos, eficazes e seguros [4,6,21-23].

Agradecimentos. Os autores agradecem às agências de fomento à pesquisa: CAPES, CNPq e FAPEMIG.

4. Referências

[1] Alberts, B. et al. Fundamentos da Biologia Celular. 4ª edição. Artmed (2017).

[2] Wuyun, Q. et al. Recent Progress of Protein Tertiary Structure Prediction. Molecules. Vol. 29. p.832 (2024). doi: https://doi.org/10.3390/molecules29040832

[3] Poliseno, L; Lanza, M; Pandolfi, P.P. Coding, or Non-Coding, That Is the Question. Cell Res. Vol. 34. p.609–629 (2024). doi: https://doi.org/10.1038/s41422-024-00975-8

[4] Fierro-Monti, I. RBPs: An RNA Editor’s Choice. Front. Mol. Biosci. Vol. 11 (2024). doi: https://doi.org/10.3389/fmolb.2024.1454241

[5] Lunde, B.M. et al. RNA-Binding Proteins: Modular Design for Efficient Function. Nat. Rev. Mol. Cell Biol. Vol. 8. p.479–490 (2007). doi: https://doi.org/10.1038/nrm2178

[6] Smith, P.R; Campbell, Z.T. RNA-Binding Proteins in Pain. WIREs RNA. Vol. 15. p.e1843 (2024). doi: https://doi.org/10.1002/wrna.1843

[7] Steinmetz, B. et al. Protein–RNA Interactions: From Mass Spectrometry to Drug Discovery. Essays Biochem. Vol. 67. p.175–186 (2023). doi: https://doi.org/10.1042/EBC20220177

[8] Ramanathan, M; Porter, D.F; Khavari, P.A. Methods to Study RNA–Protein Interactions. Nat. Methods. Vol. 16. p.225–234 (2019). doi: https://doi.org/10.1038/s41592-019-0330-1

[9] Krautwurst, S; Lamkiewicz, K. RNA-protein interaction prediction without high-throughput data: An overview and benchmark of in silico tools. Comput. Struct. Biotechnol. J. Vol. 23. p.4036–4046 (2024). doi: https://doi.org/10.1016/j.csbj.2024.11.015

[10] Acharya, P. et al. RNA Binding Proteins as Mediators of Pathological Cardiac Remodeling. Front. Cell Dev. Biol. Vol. 12 (2024). doi: https://doi.org/10.3389/fcell.2024.1368097

[11] Niazi, S. et al. Aptamer Functionalized Gold Nanoclusters as an Emerging Nanoprobe in Biosensing, Diagnostic, Catalysis and Bioimaging. Talanta. Vol. 268. p.125270 (2024). doi: https://doi.org/10.1016/j.talanta.2023.125270

[12] Yan, B. et al. Aptamer-Mediated Therapeutic Strategies Provide a Potential Approach for Cancer. Int. Immunopharmacol. Vol. 136. p.112356 (2024). doi: https://doi.org/10.1016/j.intimp.2024.112356

[13] Davlieva, M. et al. Structure analysis of free and bound states of an RNA aptamer against ribosomal protein S8 from Bacillus anthracis. Nucleic Acids Res. Vol. 42. p.10795-808 (2014). doi: https://doi.org/10.1093/nar/gku743

[14] Yan, Y. et al. HDOCK: a web server for protein–protein and protein–DNA/RNA docking based on a hybrid strategy. Nucleic Acids Research. Vol. 45. p.W365–W373 (2017). doi: https://doi.org/10.1093/nar/gkx407

[15] Blanco, J.D. et al. Protein-assisted RNA fragment docking (RnaX) for modeling RNA-protein interactions using ModelX. Proc Natl Acad Sci U S A. Vol. 116. p.24568-24573 (2019). doi: https://doi.org/10.1073/pnas.1910999116

[16] Pan, X. et al. RBPsuite: RNA-protein binding sites prediction suite based on deep learning. BMC Genomics. Vol. 21. p.884 (2020). doi: https://doi.org/10.1186/s12864-020-07291-6

[17] Lu, X.-J. & Olson, W. K. (2015). DSSR: an integrated software tool for dissecting the spatial structure of RNA. Nucleic Acids Research, 43(21), e142. https://doi.org/10.1093/nar/gkv716.

[18] Lewis, B.A. et al. PRIDB: A Protein–RNA Interface Database. Nucleic Acids Res. Vol. 39. p.D277 (2011). doi: https://doi.org/10.1093/nar/gkq1108

[19] Cook, K.B. et al. RBPDB: A Database of RNA-Binding Specificities. Nucleic Acids Res. Vol. 39. p.D301 (2011). doi: https://doi.org/10.1093/nar/gkq1069

[20] Abramson, J. et al. Accurate structure prediction of biomolecular interactions with AlphaFold 3. Nature. Vol. 630. p.493–500 (2024). doi: https://doi.org/10.1038/s41586-024-07487-w

[21] Treger, M.; Westhof, E. Statistical analysis of atomic contacts at RNA–protein interfaces. J. Mol. Recognit. Vol. 14. p.199 (2001). doi: https://doi.org/10.1002/jmr.534

[22] Zuo, Y. et al. Research Progress on Prediction of RNA-Protein Binding Sites in the Past Five Years. Anal. Biochem. Vol. 691. p.115535 (2024). doi: https://doi.org/10.1016/j.ab.2024.115535

[23] Medina-Munoz, H.C. et al. Expanded Palette of RNA Base Editors for Comprehensive RBP-RNA Interactome Studies. BioRxiv. (2023). doi: https://doi.org/10.1101/2023.09.25.558915