Termodinâmica de Proteínas: como as proteínas se enovelam?

565
2

As proteínas são as biomoléculas mais abundantes dos seres vivos. São compostos orgânicos formados por carbono, oxigênio, nitrogênio, hidrogênio e enxofre, constantemente sintetizados no interior das células [1]. Desempenham diversas funções necessárias à manutenção biológica dos organismos, como transporte e armazenamento de moléculas, regulação da expressão gênica, defesa, regulação do metabolismo, estruturação, dentre outras. Formadas por combinações sequenciais de resíduos de 20 aminoácidos diferentes, as proteínas são polímeros que, naturalmente, apresentam características estruturais, físicas e químicas distintas. Dessa forma, a determinação de suas estruturas tridimensionais é imprescindível para entender suas funcionalidades nos inúmeros processos biológicos que participam [1-2].

Ao serem sintetizadas, as proteínas assumem uma estrutura termodinamicamente estável (estrutura nativa) por meio do enovelamento (ou dobramento) de suas cadeias, que constitui um importante processo iniciado na etapa de tradução, que ocorre no ribossomo. A hierarquização das fases do enovelamento possibilita o entendimento das subestruturas conservadas evolutivamente e das estruturas proteicas em quatro níveis distintos [1-2].

O enovelamento das proteínas é um problema rapidamente solucionado na natureza [1]. Em geral, quanto maior a cadeia polipeptídica, maior será o tempo para a proteína enovelar-se. Entender como o estado nativo é encontrado em pouco tempo instigou Levinthal (1968) a postular que as inúmeras conformações possíveis não são testadas aleatoriamente até que se ache a mais estável. O paradoxo de Levinthal considera a sequência temporal dos eventos intermediários que ocorrem entre os estados desenovelado e nativo [3]. O pressuposto de que aleatoriamente as possíveis conformações vão sendo testadas à medida que a proteína emerge do ribossomo, foi contraposto com o tempo necessário para validar quase todas como não nativas [4]. 

Considerando que se a cada ~10-13 segundos (tempo de uma vibração molecular) uma conformação fosse assumida, para uma proteína formada por 100 resíduos de aminoácidos, seria necessário um período de tempo maior que a idade do universo para que todas as posições fossem testadas [1-3]. Levinthal então sugeriu que o enovelamento das estruturas devia ser acelerado e guiado pela rápida formação de interações locais de curto e longo alcance (ligações iônicas, ligações hidrogênio, interações hidrofóbicas e interações de van der Waals) [1]. Essas interações, com destaque para o efeito das interações hidrofóbicas, submetem a estrutura a vias de enovelamento que limitam o acesso da proteína a determinadas conformações não favoráveis, direcionando assim a cadeia para as posições mais favoráveis e de menor energia livre [4].

A dinâmica do enovelamento pode ser visualizada como um funil (Figura 1) que descreve a tendência termodinâmica da estrutura em assumir uma conformação de menor variação energética [1]. Essa variação energética é expressa em kcal/mol (variação da energia livre de Gibbs, ΔΔG). O início do processo é representado pela área superior do funil, onde a energia livre se encontra em maior grau. A partir da formação dos estados intermediários semi estáveis, depressões ao longo das paredes do funil representam as variações conformacionais e energéticas que ocorrem durante todo o processo. Convergindo para o fundo do funil, o ponto de menor variação de energia livre conformacional é encontrado, e o conjunto de intermediários é reduzido a uma conformação nativa .

Figura 1. Paisagem termodinâmica de energia livre em forma de funil. As estruturas nativas em seu mínimo global guiam cada molécula de um conjunto de cadeias polipeptídicas desenoveladas de alta energia, por meio de diferentes vias de enovelamento até o fundo do funil, onde a estrutura estará condensada em uma forma que apresente a menor variação de energia livre de Gibbs. Fonte: [5].

O ambiente circundante e a sequência de aminoácidos são fatores cruciais para que a proteína assuma uma determinada conformação [1]. Por meio dos experimentos de Anfinser (1973), foi demonstrada a desnaturação e renaturação in vitro de uma proteína de cadeia simples, a Ribonuclease (RNase) bovina [3]. O estado enovelado da enzima RNase pode ser atestado pela mensuração de sua atividade enzimática. Dessa forma, ele preparou amostras enzimáticas usando combinações de dois reagentes diferentes: uréia 8M (CO(NH2)2), como agente desnaturante, e 0.2 M beta-mercaptoetanol (βME), como agente redutor [6]. 

Atestando a perda total de atividade da enzima, Anfinser removeu o βME por diálise, e a ureia em seguida. Quando a ureia e o βME foram removidos, a RNase desnaturada voltou à estrutura nativa correta, de modo que as ligações dissulfeto se restabeleceram nos mesmos lugares [3-6]. Após a renaturação da estrutura, Anfinser atestou que 1% da atividade catalítica da proteína nativa estava retida na proteína renaturada, a partir da comparação das atividades em ambos os estados. No entanto, ao adicionar quantidades catalíticas do βME para que a atividade fosse restaurada, a atividade enzimática da RNase bovina foi restaurada. Dessa forma, ele concluiu que a informação necessária para enovelar uma proteína está contida em sua sequência de aminoácidos. Estudos posteriores demonstraram que o princípio de renaturação não se aplica a diversas proteínas; algumas apresentam seu processo de enovelamento assistido por outras proteínas especializadas, conhecidas como chaperonas, se diferindo então do processo da RNase [1].

Tratando da renaturação de moléculas pequenas, como no experimento de Anfinsen, as alfa-hélices e conformações beta, são as estruturas secundárias formadas primeiramente, devido a uma série de restrições que norteiam seus surgimentos [2]. Em seguida, interações iônicas de grupos carregados e ligações de longo alcance são estabelecidas, além das interações hidrofóbicas que promovem a agregação das partes apolares dos resíduos, conferindo uma estabilidade entrópica a formas enoveladas intermediárias. Por fim, a dinâmica de forças termodinâmicas faz a estrutura assumir uma conformação de menor  variação energética, fundindo os estados intermediários em um estado de maior estabilidade [1].

A estabilidade, como tendência de manter a conformação nativa, depende das forças atuantes nas proteínas para induzir o processo de enovelamento [1]. O efeito hidrofóbico é considerado a principal força indutora, a partir da interação das porções apolares, formadas por aminoácidos hidrofóbicos. Outro tipo de interação observada durante o enovelamento são as ligações dissulfeto, resultantes de processo oxidativo, que permitem a ligação de cisteínas não adjacentes [7-8].

 Diante da complexidade das estruturas proteicas, todo conhecimento acerca dos componentes básicos de seus arranjos mais frequentes não oferece compreensão suficiente acerca dos mecanismos que levam uma cadeia polipeptídica estruturada aleatoriamente no espaço a assumir sua conformação nativa. Então, a determinação das estruturas tridimensionais por metodologias experimentais e in silico tornou-se fundamental para entender como as proteínas se enovelam [8-9].

Técnicas de determinação de estruturas tridimensionais

À medida que o conhecimento avança, novas metodologias são desenvolvidas e atualizadas, visando a predição de estruturas tridimensionais de proteínas a partir de métodos experimentais ou computacionais [1]. A necessidade de ter estruturas proteicas resolvidas (ou elucidadas) deriva da importância que a sua conformação tem em caráter essencial na funcionalidade [8].

Técnicas experimentais

Dentre as técnicas experimentais que vêm sendo aplicadas para a obtenção de informações sobre as estruturas proteicas, destacam-se a difração de raios-X, a Calorimetria de Varredura Diferencial (do inglês Differential Scanning Calorimetry, DSC), a Ressonância Magnética Nuclear (RMN) e o Dicroísmo Circular (CD). O alto custo é a principal desvantagem da aplicação dessas técnicas [1,7,8].

Difração de raios-X

A difração de raios-X permite que a estrutura de proteínas seja determinada em uma escala quase atômica. O ensaio é baseado na geração de cristais contendo proteínas que recebem radiação incidente de um comprimento de onda específico. O raio-X é difratado pelos elétrons que estão distribuídos no cristal, e assim, é possível inferir da posição dos próprios núcleos, que também podem ser determinados por difração com feixe de nêutrons [1-7].

Calorimetria de Varredura Diferencial

A Calorimetria de varredura diferencial (DSC) é uma técnica utilizada para caracterizar a estabilidade de proteínas ou outras biomoléculas diretamente em sua forma nativa. Elas são aquecidas a uma taxa de varredura constante, que causa a absorção de calor a partir do desenovelamento da estrutura, resultando em um gradiente térmico  (ΔT) entre as células. Ainda, os modelos termodinâmicos podem ser ajustados aos dados para obter a energia livre de Gibbs (ΔG), a entalpia calorimétrica (ΔHcal), a entalpia de van’t Hoff (ΔHvH), a entropia (ΔS) e a mudança da capacidade de calor (ΔCp) associada à transição [7].

Ressonância Magnética Nuclear

Ressonância magnética nuclear (RMN) é um ensaio realizado com macromoléculas em solução sob influência de um campo eletromagnético estático potente e baseia-se na liberação de um pulso de energia eletromagnética, em diferentes ângulos na solução. Parte da energia é absorvida à medida que o núcleo das moléculas muda do estado de menor energia, que corresponde à orientação paralela do dipolo magnético gerado pelo momento angular do spin nuclear, para o estado de maior energia, com orientação antiparalela ao campo. O espectro resultante apresenta informações sobre a identidade do núcleo e o ambiente químico das imediações. A RMN torna-se vantajosa por também esclarecer mudanças conformacionais no enovelamento e interações com outras moléculas [7].

Dicroísmo Circular

O Dicroísmo Circular (CD) é utilizado para mensurar a quantidade e tipo de estruturas secundárias presentes em solução, pois tem se mostrado um ensaio sensível, principalmente à estruturas alfa-hélice, folhas-beta e desordenadas, em virtude dos diferentes espectros gerados em uma faixa de comprimentos de onda. O CD é causado por diferenças na absorção  de luz entre os componentes em sentido horário e anti-horário de um feixe de luz polarizada que atravessa uma solução opticamente ativa [7-8].

Métodos computacionais

Os métodos computacionais para predição de estruturas tridimensionais de proteínas podem ser separados em quatro categorias: Modelagem comparativa por homologia, métodos de reconhecimento de padrões de enovelamento, métodos ab initio ou de novo [9-10].

Métodos de modelagem comparativa 

A modelagem comparativa parte do pressuposto que há relação evolutiva entre duas sequências, que  resultam em estruturas tridimensionais similares. Essa abordagem garante alta precisão para os modelos gerados quando se há semelhanças. Como a comparação depende de estruturas já determinadas experimentalmente, diferentes padrões de enovelamento não podem ser determinados por estes métodos (Tabela 1) [8-10]. 

Tabela 1 – Exemplos de Preditores de estrutura por  modelagem comparativa. Fonte: próprio autor.

PREDITOR

DESCRIÇÃO

LINK

Modeller

[11]

Modelagem comparativa de estrutura de proteína por satisfação de restrições espaciais.  O usuário fornece um alinhamento de uma sequência a ser modelada com estruturas relacionadas conhecidas e o MODELLER calcula automaticamente um modelo contendo todos os átomos

https://salilab.org/modeller/

SWISS-

MODEL

[12]

É um serviço web dedicado à modelagem de homologia de estruturas de proteínas. O servidor constrói modelos a partir da (1) identificação do(s) modelo(s) estrutural(is), do (2) alinhamento da sequência alvo e estrutura(s) do modelo, da (3) construção do modelo e avaliação da qualidade.

https://swissmodel.expasy.org/

 

Métodos de reconhecimento de padrões de enovelamento

Também conhecidos como de fold recognition, estes métodos (Tabela 2) consideram a estrutura tridimensional da proteína evolutivamente mais conservada do que sua sequência correspondente [9-10]. Assim, ainda que não haja alta similaridade entre sequências, as estruturas tridimensionais conhecidas podem apresentar semelhanças que permitam inferências na estrutura estudada.

Tabela 2 – Exemplos de preditores de estrutura por reconhecimento de padrões. Fonte: próprio autor

PREDITOR

DESCRIÇÃO

LINK

HHpred

[13]

Utiliza sequências ou alinhamento de sequência múltipla como entrada e procura por homólogos remotos em uma variedade de bancos de dados, como PDB, SMART e Pfam. 

https://toolkit.tuebingen.mpg.de/tools/hhpred

SPARKS-X

 [14]

é um aprimoramento do reconhecimento do enovelamento de proteínas, empregando correspondência baseada em probabilística entre propriedades estruturais nativas e dos modelos gerados.

https://sparks-lab.org/server/sparks-x/

Phyre e Phyre2

 [15]

 

http://www.sbg.bio.ic.ac.uk/phyre2/

 

Métodos ab initio ou de novo

Os métodos ab initio ou de novo (Tabela 3) baseiam-se em informações extraídas das estruturas tridimensionais depositadas em bases de dados, utilizando princípios físicos para gerar modelos de estruturas tridimensionais. A utilização dessas abordagens permite que padrões não recorrentes sejam preditos a partir de comparações realizadas por fragmentos [9-10]. Além disso, os princípios da hipótese de Anfinsen são utilizados na construção dos modelos. 

Tabela 3 – Exemplos de preditores de estrutura de novo . Fonte: próprio autor

PREDITOR

DESCRIÇÃO

LINK

I-TASSER

[16]

É uma abordagem hierárquica para previsão da estrutura de proteínas e anotação de função baseada em estrutura. Ele identifica modelos estruturais do PDB pela abordagem de segmentação múltipla LOMETS, com modelos atômicos completos construídos por simulações interativas de montagem de fragmentos baseadas em modelos.

https://zhanggroup.org/I-TASSER/

ROSETTA

[17]

É um software utilizado para prever e projetar estruturas de proteínas, mecanismos de dobramento de proteínas e interações proteína-proteína, a partir de estruturas depositadas em bases de dados.

https://www.rosettacommons.org/software

AMBER

[18]

é um conjunto de programas de simulação,  que utiliza um conjunto de campos de força mecânico molecular, de domínio público, para a simulação de biomoléculas.

https://ambermd.org/

CHARMM

[19]

É um programa de simulação molecular que  visa, principalmente, sistemas biológicos. Disponibiliza  um conjunto abrangente de funções de energia, uma variedade de métodos de amostragem aprimorados, para análise e construção de modelos.

https://www.charmm.org/

GROMOS

 [20]

É um pacote desenvolvido para a modelagem dinâmica de biomoléculas usando os métodos de dinâmica molecular, dinâmica estocástica e minimização de energia.

https://www.gromos.net/

 

AlphaFold

Quando, em 2018, os resultados da Avaliação Crítica de Predição de Estruturas (CASP) foram anunciados, o DeepMind,  um grupo de pesquisa de aprendizado de máquina do Google, recebeu o primeiro lugar pelo desenvolvimento do AlphaFold. O AlphaFold é um algoritmo baseado em redes neurais profundas, no qual modelos estruturais de proteínas foram gerados por meio do uso de previsões de distância ou contato entre pares de resíduos de aminoácidos [9].

O AlphaFold foi treinado a partir de um conjunto de dados públicos de proteínas com estruturas tridimensionais conhecidas e um banco de dados de sequências sem estruturas conhecidas. Os modelos gerados apresentaram alta precisão, sendo considerado um grande passo para solucionar o problema de entendimento sobre o enovelamento de proteínas [9]. Além de contribuir com pesquisas em andamento, estudos ligados a doenças também foram beneficiados com a publicação dos autores, que disponibilizaram uma base de dados com mais de 350 mil estruturas referentes ao proteoma humano e a outros organismos [21].

Se quiser saber mais detalhes sobre o AlphaFold e como utilizá-lo, leia os artigos sobre o assunto que já estão disponíveis na revista Bioinfo:

Conclusão

As proteínas são as biomoléculas mais atuantes nos seres vivos e dependem da sua estrutura nativa para desempenhar suas funções. O enovelamento, sendo o  processo pelo qual cadeias polipeptídicas assumem a respectiva conformação, é um fenômeno já explorado e que gradualmente está sendo elucidado. As metodologias, experimentais e computacionais, tornaram-se fundamentais para o estudo das estruturas e  mapeamento de diferentes padrões de enovelamento. A exploração das subestruturas secundárias permitiu contribuições de uma perspectiva termodinâmica, que está sendo aplicada para responder questões de estabilidade das estruturas proteicas no ambiente celular, contribuindo para um maior entendimento das forças que atuam na proteína. 

O objetivo deste artigo foi apresentar uma resposta introdutória e panorâmica sobre o enovelamento de proteínas. Nos próximos artigos, discutiremos ainda mais sobre a estrutura tridimensional, estabilidade termodinâmica, mutações e bases de dados associadas a esses conteúdos.

Referências

[1]  Nelson, D. L.; Cox, M. M.  Princípios de bioquímica de Lehninger. 6. Ed. Porto Alegre: Artmed, 2014.

[2] Lemos, R. P.; Santos, P. H.; Rocha, A. Introdução à Biologia Estrutural de Proteínas. Revista BIONFO. Disponível em: https://bioinfo.com.br/introducao-a-biologia-estrutural-de-proteínas. Acesso em 14 de Agosto de 2023. 

[3] Tanouye, F. T. Enovelamento de proteínas e ligações de hidrogênio – estudo de modelos mínimos. 22 Sep. 2017. 

[4] Levinthal, C. Are there pathways for protein folding? Journal of Chimie Physique, vol. 65, pp. 44–45.v. 1968.

[5] Ken A. Dill. (CC-BY 4.0) Obtido em: https://commons.wikimedia.org/wiki/File:Funnel-shaped_energy_landscape.png. Acesso em: 04 de Setembro de 2023.

[6] Anfinsen C. B., Haber E., Sela M., White F. H. Jr. The kinetics of formation of native ribonuclease during oxidation of the reduced polypeptide chain. Proceedings of the National Academy of Sciences of the United States of America, 47:1309–1314, 1961. 

[7] Devlin, T.M.  Manual de Bioquímica com Correlações Clínicas, 7ª ed., Ed. Blucher, 2011.

[8] Verli, H. (Org). Bioinformática : da biologia à flexibilidade molecular. Sociedade Brasileira de Bioquímica e Biologia Molecular. 2014. 

[9] Marques, F. B. Predição da estrutura tridimensional de proteínas utilizando o método CReF com informações de contato. Dissertação (Mestrado) – Programa de Pós-Graduação em Ciências da Computação, PUCRS. Porto Alegre. 2021.

[10] Dorn, Márcio. Uma proposta para a predição computacional da estrutura 3D aproximada de polipeptídeos com redução do espaço conformacional utilizando análise de intervalos. Dissertação (Mestrado em Ciência da Computação) – Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2008.

[11] Sali, A. e Blundell, T. L. Comparative protein modelling by satisfaction of spatial restraints. Journal of Molecular Biology, vol. 234, pp. 779–815. 1993.

[12] Webb, B. e Sali, A. Comparative Protein Structure Modeling Using MODELLER. Current Protocols in Bioinformatics, vol. 54, pp. 5.6.1–5.6.37. 2016.

[13] Arnold, K., Bordoli, L., Kopp, J. e Schwede, T. The SWISS-MODEL workspace: a web-based environment for protein structure homology modelling. Bioinformatics, vol. 22, pp. 195–201. 2006.

[14] Söding, J. Protein homology detection by hmm–hmm comparison. Bioinformatics, vol. 21, pp. 951–960. 2005.

[15] Kelley, L. A., Mezulis, S., Yates, C. M., Wass, M. N. e Sternberg, M. J. (Mai, 2015). The phyre2 web portal for protein modeling, prediction and analysis. Nature Protocols, vol. 10, pp. 845–858. 2015.

[16] Roy, A., Kucukural, A. e Zhang, Y. I-tasser: a unified platform for automated protein structure and function prediction. Nature Protocols, vol. 5, pp. 725–738. 2010.

[17] Rohl, C. A., Strauss, C. E., Misura, K. M. e Baker, D. Protein structure prediction using rosetta. In: Numerical Computer Methods, Part D, vol. 383, pp. 66–93. Academic Press, 1 ed. 2004.

[18] Cornell, W. D., Cieplak, P., Bayly, C. I., Gould, I. R., Merz, K. M., Ferguson, D. M., Spellmeyer, D. C., Fox, T., Caldwell, J. W. e Kollman, P. A. A Second Generation Force Field for the Simulation of Proteins, Nucleic Acids, and Organic Molecules. Journal of the American Chemical Society, vol. 117, pp. 5179–5197. Maio de 1995.

[19] Brooks, B. R., Bruccoleri, R. E., Olafson, B. D., States, D. J., Swaminathan, S. e Karplus, M. CHARMM: A program for macromolecular energy, minimization, and

dynamics calculations. Journal of Computational Chemistry, vol. 4, pp. 187–217. jan de 1983.

[20] Christen, M., Hünenberger, P. H., Bakowies, D., Baron, R., Bürgi, R., Geerke, D. P., Heinz, T. N., Kastenholz, M. A., Kräutler, V., Oostenbrink, C., Peter, C., Trzesniak, D. e Gunsteren, W. F. v. The GROMOS software for biomolecular simulation: GROMOS05. Journal of Computational Chemistry, vol. 26, pp. 1719–1751. 2005.

[21] Mariano, D. AlphaFold e a busca pelo Santo Graal da Biologia Molecular. Disponível em: https://bioinfo.com.br/alphafold-e-a-busca-pelo-santo-graal-da-biologia-molecular/. Acesso em: 5 de Set. 2023.

Autores: Alisson Clementino da Silva https://orcid.org/0000-0003-0622-5561, Bruno Rafael Pereira Nunes https://orcid.org/0000-0002-2665-1616, Joicymara Xavier https://orcid.org/0000-0002-4649-6270

Revisão: Aline Sampaio Cremonesi, Rafael Lemos

Cite este artigo:

Silva, AC; Nunes, BRP; Xavier, J. Termodinâmica de Proteínas: como as proteínas se enovelam? BIOINFO. ISSN: 2764-8273. Vol. 3. p.24 (2023). doi: 10.51780/bioinfo-03-24

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

2 thoughts on “Termodinâmica de Proteínas: como as proteínas se enovelam?

  1. […] Termodinâmica de Proteínas: como as proteínas se enovelam? […]

  2. […] Termodinâmica de Proteínas: como as proteínas se enovelam? […]