A importância da preparação de estruturas na metodologia de docking molecular

1916
0

As etapas de preparação do docking molecular são de extrema importância para obtenção de resultados fidedignos. Esta metodologia pode ser empregada de diversas maneiras, sendo uma delas a triagem virtual de substâncias que tem como finalidade filtrar grandes bibliotecas de compostos. Assim, o ajuste correto de parâmetros, como o provável estado de protonação dos grupamentos funcionais das moléculas, têm impacto na fidelidade do resultado das simulações de docking. Neste artigo, serão apresentados os parâmetros de docking para a preparação do sistema. E também a comparação entre um sistema que obedece aos parâmetros de preparação e outro sem ajustes, com a finalidade de esclarecer a influência de cada etapa.

Autores: Maria Eduarda Alves Esteves https://orcid.org/0000-0002-2029-235X, Tácio Vinício Amorim Fernandes https://orcid.org/0000-0001-5881-9519, Manuela Leal da Silva https://orcid.org/0000-0003-4844-7138

Revisão: Ana Carolina Silva Bullahttps://orcid.org/0000-0003-4118-294X, Débora Soares Brandão https://orcid.org/0000-0002-8050-5652

Introdução

O docking molecular consiste na avaliação da interação entre um alvo e um ligante. Dentre as aplicações possíveis, pode ser realizada a análise em larga escala através do método de triagem virtual baseada em estrutura do receptor, que consiste no docking de compostos organizados em bibliotecas para um determinado alvo biológico. Ou baseada na estrutura do ligante, na qual é avaliada a interação de um ligante com diferentes receptores[1].

A triagem virtual de um grande número de substâncias tornou-se popular durante o período da pandemia, quando as instituições de pesquisas investiram no reposicionamento de fármacos e na busca por substâncias promissoras para o tratamento da COVID-19. Para que a predição de interação entre moléculas seja mais assertiva, a estrutura receptora e os ligantes devem ser preparados ajustando parâmetros para cada sistema. Desta forma, para um docking bem-sucedido, é necessário o estudo sobre o alvo molecular assim como, o ajuste fino das coordenadas atômicas, a análise do provável estado de protonação no pH de atuação e a correta preparação de cargas [2-4].

Neste sentido, este trabalho exemplifica a importância da preparação das moléculas utilizadas na simulação de docking em que o alvo receptor empregado será o homodímero 3CLpro do SARS-CoV-2. Esta enzima atua como cisteíno-protease e está envolvida na clivagem e maturação da poliproteína viral [5,6] das demais proteases que possuem três resíduos catalíticos. Ela, por sua vez, possui uma díade catalítica formada pelos resíduos His41 e Cys145, e uma molécula de água estrutural que faz o papel catalisador do terceiro resíduo de aminoácido. Opostamente as proteases humanas a 3CLpro cliva sequências polipeptídicas após um resíduo de glutamina, sendo um alvo farmacoterapêutico promissor [7].

Seleção e preparação da estrutura do alvo molecular e inibidor

A seleção da estrutura resolvida experimentalmente e depositada no Protein Data Bank (PDB) seguiu os seguintes critérios: método experimental, resolução do experimento de cristalografia e difração de raios-X (em Å), data de depósito mais recente, número de cadeias (visto que a atividade catalítica depende da formação do homodímero), verificação de resíduos faltantes, assim como a presença de ligante complexado.

O estado de protonação dos resíduos de aminoácidos tem influência no padrão de interação com o ligante. Para demonstrar essa influência, dois sistemas foram criados para a 3CLpro de SARS-CoV-2: sistema (i) com ajuste de protonação, e sistema (ii) sem o ajuste dos hidrogênios.

No sistema (i) a estrutura tridimensional (3D) da 3CLpro do SARS-CoV-2 anteriormente selecionada foi submetida ao servidor PDB2PQR (https://server.poissonboltzmann.org/pdb2pqr) para a predição de valores de pKa. Para este processo, foi selecionado o pH 7,4 – pH de atividade da 3Clpro – e foram mantidas as moléculas de água estruturais devido a sua importância na atividade catalítica da enzima [7]. O inibidor cristalizado junto à proteína receptora 3CLpro foi isolado, utilizando o programa PyMOL (https://pymol.org/2/), para a futura recolocação na etapa chamada redocking, sendo preparado em pH 7,4 utilizando o Open Babel (http://openbabel.org/wiki/Main_Page).

No sistema (ii) foi utilizada a mesma estrutura 3D selecionada para o sistema (i). Porém, não foi realizado o ajuste do provável estado de protonação, e as moléculas de água foram retiradas para fins de comparação entre os sistemas.

Preparação dos parâmetros para o docking molecular

A caixa da simulação (grid de busca), para ambos os sistemas, foi construída utilizando o programa Chimera (versão 1.14) [8], por meio da função zone, selecionando resíduos do receptor a um raio de 5 Å do ligante. Essa escolha leva em consideração o conhecimento de que as ligações hidrogênio “fracas” estão em torno de 3,2 Å a 4 Å, as interações fortes de 2,2 Å a 2,5 Å e as moderadas, mais comuns, entre 2,5 Å a 3,2 Å [9].

A estrutura 3D da proteína receptora e o ligante no formato pdb foram submetidos ao programa AutoDock Tools (versão 1.5.6) [10] para conversão do formato pdbqt. Em seguida, foi realizada a simulação de docking para os sistemas (i) e (ii) com Autodock Vina [11] em exaustividades: 8, 16, 32, 64 e 100, visando aumentar o desempenho computacional na busca de melhores resultados de docking.

A Figura 1 apresenta um fluxograma resumido das etapas empregadas neste trabalho.

Figura 1. O esquema ilustrado na figura resume a metodologia empregada neste trabalho. A primeira etapa, em amarelo, envolve orientações de escolha da estrutura, para os sistemas (i) e (ii). Em verde, estão as etapas de realização; a primeira é a predição dos valores de pKa realizada no sistema (i). As demais etapas foram realizadas para ambos os sistemas: adição de cargas e a transformação do formato da extensão da molécula receptora e do ligante; seguida da construção da caixa de docking. Após isso, foi realizado a docking em diferentes exaustividades. As etapas de validação dos parâmetros utilizados estão destacadas em laranja: o RMSD () calculado entre o ligante original e os resultados oriundos das diferentes exaustividades e a interação entre as poses do ligante a proteína receptora.

O RMSD (Root Mean Square Deviation) é a medida da distância média entre os átomos de estruturas sobrepostas, ele foi calculado entre as poses resultantes da etapa anterior e o ligante original do cristal foi calculado com o programa Open Babel [12] a fim de julgar a sobreposição dos átomos dos ligantes.

Comparando sistemas

A estrutura 3D da 3CLpro de SARS-CoV-2 selecionada (PDBid: 6XQT) está complexada com o ligante Narlaprevir (NNA), inibidor de protease do HCV (Hepatitis C Virus). Sua resolução é igual a 2,30 Å, possui cadeias A e B e nenhum resíduo faltante, critério este para contornar a necessidade de construção de um modelo tridimensional complementar às regiões ausentes [4].

No sistema (i) o parâmetro protonação analisado de acordo com o cálculo de estimativa do pKa em pH 7,4, resultou no resíduo His41 monoprotonada no nitrogênio e a Cys145 protonada (Figura 2A). De maneira comparativa o sistema (ii) não ajustado, no pH de atividade da enzima, demonstrou ambos os resíduos na forma desprotonada (Figura 2B).

Diagrama, Forma, Seta

Descrição gerada automaticamente
Figura 2. Representação do estado de protonação dos resíduos His41 e Cys145. A estrutura tridimensional 3CLpro do SARS-CoV-2 (PDBid:6XQT) está colorida em ciano. O resíduo His41 está em laranja e Cys145 em rosa. Os átomos de hidrogênio, nitrogênio e enxofre estão representados pelas cores: branco, azul e amarelo, respectivamente. Em A) é possível avaliar na estrutura preparada em pH 7,4 o próton (em branco) ligado ao N da His41 e a Cys145, também em sua forma protonada. Em B) ambos os resíduos se encontram desprotonados na estrutura não preparada no pH de interesse.

As figuras 2A e 2B exemplificam o fato de que grupamentos ionizáveis protéicos apresentam interação eletrostática diferentes, de acordo com o meio e o pH nos quais estão inseridos. As alterações nesta interação acarretam em mudança do pKa e no estado de carga dos resíduos de aminoácidos [13]; portanto, ressalta a importância desta etapa da preparação do sistema para docking.

Após diferentes avaliações sobre o melhor encaixe dos resíduos selecionados dentro do espaço determinado pela caixa de docking, foram concluídas as coordenadas center_x, y, z: -11, 1, 45 e size_x, y, z: 32, 35, 33. As dimensões englobam os resíduos selecionados na cadeia A do homodímero, incluindo a díade catalítica e a porção complementar da cadeia B, como ilustrado na Figura 3. Tal análise é importante uma vez que a determinação da caixa indica o local em que ocorrerá a simulação da docking, otimizando o custo computacional envolvido no processo e tornando o encaixe mais eficiente. Esse parâmetro foi utilizado nos sistemas (i) e (ii).

A proporção ideal da caixa do grid é essencial para o sucesso das etapas subsequentes. A construção de uma caixa com dimensões excedentes demanda alto custo computacional na fase de posicionamento do ligante, o que se faz desnecessário quando o local de acoplamento já é conhecido, pois há aumento no tempo de simulação do docking. Já o espaço traçado justaposto ao ligante utilizado no redocking pode ser insuficiente para futuras simulações de triagem virtual, quando é testado o docking de compostos químicos com tamanhos variados e muitas vezes maiores do que o ligante já descrito [14].

Figura 3. Dimensões do grid englobando o ligante Narlaprevir (laranja), as cadeias A em rosa e B em azul da 3CLpro do SARS-CoV-2 (PDBid:6XQT).

Como resultado das simulações de redocking do sistema (i) a exaustividade 8 apresentou a melhor classificação (Figura 4), primeiramente, devido ao valor da energia de afinidade igual a -10,4 Kcal/mol calculada pelo Autodock Vina, indicando interação entre o complexo formado pela proteína receptora (PDBid: 6XQT) e o ligante NNA gerado na simulação. Além disso, foi calculado um RMSD de 0,97 Å entre a primeira pose e o ligante original extraído da cadeia A. Quando igual a zero ocorre a total sobreposição e as estruturas são equivalentes, podendo variar até 2 Å para uma predição bem-sucedida [15]. Seguindo esta premissa, as simulações em exaustividade 100 também apresentaram valores satisfatórios, com -8,5 Kcal/mol de energia de afinidade e 1,46 Å de RMSD, conforme ilustrado na Figura 4.

Diagrama, Forma, Seta

Descrição gerada automaticamente
Figura 4. Sobreposição do ligante Narlaprevir e da melhor pose resultante do redocking. Em A) o ligante de referência (carbonos em verde) e da melhor pose resultante da simulação em exaustividade 8 (carbonos em ciano) – RMSD = 0.97 Å. Em B) o resultado referente a exaustividade em 100. Os carbonos do ligante original representados em ciano e a melhor pose em amarelo – RMSD = 1,46 Å.

Quanto às simulações realizadas com o sistema (ii) nenhuma das exaustividades testadas apresentou valores satisfatórios de RMSD (Tabela 1). A sobreposição de ligantes em exaustividade 8, ilustrada na Figura 5A, mostra o menor alinhamento das regiões de extremidade quando comparado à extensão da substância. Dentre os resultados, a exaustividade 16 (Figura 5B) apresentou melhor sobreposição com menor RMSD neste grupo não ajustado quanto ao pH e águas estruturais. As demais exaustividades: 32 (Figura 5C), 64 (Figura 5D) e 100 (Figura 5E) apresentaram resultados semelhantes às simulações em exaustividade 8.

ExaustividadeEnergia de afinidade (Kcal/mol)RMSD (Å)
8 -8,6 2,73 Å
16 -8,5 2,69 Å
32 -8,5 2,75 Å
64 -8,6 2,72 Å
100 -8,5 2,72 Å
Tabela 1. Valores de energia de afinidade e RMSD referente às simulações de docking do complexo 3Clpro/Narlaprevir sem o ajuste do provável estado de protonação.

Figura 5. Sobreposição dos ligantes oriundos de simulações (exaustividades 8, 16, 32, 64 e 100) sem o ajuste do provável estado de protonação. Narlaprevir retirado da cadeia A do cristal representado em cinza claro. Em A) a melhor pose (carbonos em verde) oriunda da simulação em exaustividade 8. As demais exaustividades estão representadas em B) 16 – carbonos do ligante oriundo da simulação em ciano; C) 32 – carbonos em magenta; D) 64 – carbonos em amarelo e E) carbonos do ligante oriundo da simulação em exaustividade 100 em rosa claro.

As análises realizadas mostram que, quando comparados os resultados oriundos de estruturas preparadas em seu pH de atividade – sistema (i) – e não preparadas – sistema (ii) -, há diferença na assertividade. O valor de RMSD acima do esperado para este tipo de simulação é refletido na sobreposição imprecisa, principalmente nas regiões de extremidade do ligante, em que as estruturas ficaram deslocadas.

É essencial avaliar elementos como resolução da estrutura resolvida experimentalmente, que reflete na qualidade da estrutura alvo de estudo, o pH de atividade da proteína receptora e ajustar o provável estado de protonação do complexo, tendo atenção às características de acidez ou basicidade dos aminoácidos. Com isso, o desfecho obtido reforça a importância de etapas de preparação do complexo receptor-ligante antes das realizações de triagem virtual, a fim de obter uma parametrização confiável do sistema.


Referências

  1. Kontoyianni, M. Docking and virtual screening in drug discovery. Methods in Molecular Biology 1647, 255–266 (2017).
  2. Forli, S. et al. Computational protein–ligand docking and virtual drug screening with the AutoDock suite. Nature protocols 11, 905–919 (2016).
  3. Madhavi Sastry, G., Adzhigirey, M., Day, T., Annabhimoju, R. & Sherman, W. Protein and ligand preparation: Parameters, protocols, and influence on virtual screening enrichments. Journal of Computer-Aided Molecular Design 27, 221–234 (2013).
  4. Mothay, D. & Ramesh, K. V. Binding site analysis of potential protease inhibitors of COVID-19 using AutoDock. VirusDisease 31, 194–199 (2020).
  5. Dai, W. et al. Structure-based design of antiviral drug candidates targeting the SARS-CoV-2 main protease. Science 368, 1331–1335 (2020).
  6. Ma, C. et al. Boceprevir, GC-376, and calpain inhibitors II, XII inhibit SARS-CoV-2 viral replication by targeting the viral main protease. Cell Research 30, 678–692 (2020).
  7. Ullrich, S. & Nitsche, C. The SARS-CoV-2 main protease as drug target. Bioorganic and Medicinal Chemistry Letters 30, 127377 (2020).
  8. Pettersen, E. F. et al. UCSF Chimera – A visualization system for exploratory research and analysis. Journal of Computational Chemistry 25, 1605–1612 (2004).
  9. Jeffrey, G. A. An Introduction to Hydrogen Bonding. (Oxford University Press, 1997).
  10. Morris, G. M. et al. Software news and updates AutoDock4 and AutoDockTools4: Automated docking with selective receptor flexibility. Journal of Computational Chemistry 30, 2785–2791 (2009).
  11. Trott, O. & Olson, A. J. AutoDock Vina: Improving the speed and accuracy of docking with a new scoring function, efficient optimization, and multithreading. Journal of Computational Chemistry 31, NA-NA (2009).
  12. Murray-Rust, P., Rzepa, H. S., Williamson, M. J. & Willighagen, E. L. Chemical markup, XML, and the world wide web. 5. Applications of chemical metadata in RSS aggregators. Journal of Chemical Information and Computer Sciences 44, 462–469 (2004).
  13. V. Onufriev, A. & Emil, A. Protonation and pK changes in protein-ligand binding. Physiol Behav 176, 181–209 (2015).
  14. Meng, X. Y., Zhang, H. X., Mezei, M. & Cui, M. Molecular docking: a powerful approach for structure-based drug discovery. Current computer-aided drug design. Current Computer Aided Drug Design 7, 146–157 (2011).
  15. Onodera, K., Satou, K. & Hirota, H. Evaluations of molecular docking programs for virtual screening. Journal of Chemical Information and Modeling 47, 1609–1618 (2007).
Editor-in-chief
WRITTEN BY

Editor-in-chief

Editor-chefe do Portal BIOINFO. Mantido pelo comitê editorial, equipe administrativa e técnica.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *