Alinhamento de estruturas 3D com TM-align

1078
1
TM-align | Image by bioinfo.com.br

TM-align é um algoritmo desenvolvido para identificar o melhor alinhamento possível entre um par de proteínas através de uma matriz de rotação construída com o TM-Score e programação dinâmica [3]. Ele é descrito como mais rápido, com maior precisão e cobertura que algoritmos conceituados como DALI [7] e CE [8].

Figura 26. Logotipo do TM-align. Fonte: https://zhanglab.ccmb.med.umich.edu/TM-align/.

O algoritmo realiza três etapas de alinhamentos iniciais rapidamente calculados. Na primeira etapa, as estruturas secundárias das proteínas são alinhadas usando programação dinâmica. A seguir, o algoritmo constrói uma matriz binária (0 ou 1), que indica se há uma correspondência na estrutura secundária do resíduo em questão [3]. Na segunda etapa, o alinhamento é baseado na correspondência contínua das duas estruturas, a estrutura menor e continuamente posicionada sobre a estrutura maior, e o alinhamento com melhor TM-Score é selecionado. O terceiro alinhamento também é obtido por programação dinâmica, mas a matriz de pontuação é obtida das matrizes de pontuação dos dois alinhamentos anteriores.

O TM-align pode ser utilizado tanto online (webtool) quanto em ambiente desktop (neste caso, a instalação deve ser feita em ambiente Linux por linha de comando). Para utilizar a ferramenta web ou realizar o download do código-fonte para a instalação local, acesse https://zhanglab.ccmb.med.umich.edu/TM-align/.

Executando o TM-align pela Internet

Executar o TM-align pelo servidor web oficial é a forma mais simples de utilização. Na ferramenta web (Figura 27), deve-se utilizar como entrada dois arquivos no formato PDB ou PDBx/mmCIF (pode-se enviar os arquivos separadamente ou apenas colar o texto correspondente dentro das caixas de texto).

Figura 27. Exemplo de entrada de dados na página inicial do TM-align. Fonte: https://zhanglab.ccmb.med.umich.edu/TM-align/.

Opcionalmente, os resultados podem ser enviados para o seu e-mail (nesse caso, você deve preencher o campo Input Email). Por fim, execute o alinhamento clicando em Run TM-align. Quando o processamento for concluído, será exibida uma página com um resumo da execução e os arquivos de resultados disponíveis para download.

A seguir, será apresentado um exemplo de uso. Para este estudo de caso, realizaremos o alinhamento da beta-glicosidase do fungo Humicola insolens (PDB ID: 4MDP) e da beta-glicosidase do cupim Neotermes koshunensis (PDB ID: 3VIK). O primeiro passo foi acessar o site oficial usando um navegador de internet (foi usado o Google Chrome). A seguir, realizamos o upload dos arquivos de entrada no formato PDB (Figura 28).

Figura 28. Executando o TM-align para as entradas 3vik e 4mdp. Os arquivos PDB foram baixados em https://www.rcsb.org/structure/3vik e https://www.rcsb.org/structure/4mdp, respectivamente. Fonte: próprio autor.

A seguir, executamos as análises clicando em Run TM-align. Após o processamento, a ferramenta web retornou um resumo do log de execução com a referência bibliográfica para citação do uso da ferramenta, os dados das estruturas de entrada, como nomes e tamanho de sequências, o valor do TM-score e o alinhamento das sequências (Figura 29)

Figura 29. Resumo do alinhamento de 3vik com 4mdp. Fonte: https://zhanglab.ccmb.med.umich.edu/TM-align/.

Além disso, a ferramenta retornou uma visualização tridimensional das estruturas diretamente no navegador usando a biblioteca Jsmol (Figura 30), além de links para o download dos arquivos de entrada e saída, e os arquivos pdb para visualizar a sobreposição na ferramenta Rasmol (disponível em http://www.openrasmol.org/).

Figura 30. Visualização do alinhamento de 3vik com 4mdp. Um exemplo de resultado similar (mas com outras estruturas de entrada) pode ser encontrado em https://zhanglab.ccmb.med.umich.edu/TM-align/example/873772.html. Fonte: próprio autor.

Execução local do TM-align

Caso não deseje enviar os seus dados para o servidor web, você pode realizar o download do código-fonte do TM-align e instalá-lo em sua máquina. A versão em C++ do TM-align pode ser obtida em https://zhanglab.ccmb.med.umich.edu/TM-align/TMalign.cpp. Entretanto, antes de utilizá-la, você terá que realizar a compilação do código. Para isso, execute no terminal Linux os comandos:

  1. mkdir tm
  2. wget https://zhanglab.ccmb.med.umich.edu/TM-align/TMalign.cpp
  3. g++ TMalign.cpp -o tmalgin
  4. ./tmalign protein1.pdb protein2.pdb

Na linha 1, o comando cria uma pasta para armazenar o arquivo. A linha 2 utiliza o comando wget para fazer o download do arquivo do código-fonte (você pode baixá-lo manualmente). Na linha 3 é feita a compilação do arquivo para gerar um executável chamado tmalign. Na linha 4 é finalmente realizada a execução da ferramenta, em que protein1.pdb e protein2.pdb são as estruturas que serão alinhadas.

O algoritmo irá rotacionar e transladar a primeira proteína para alinhá-la com a segunda (que será a referência). O resultado será mostrado na saída do terminal. A execução padrão do programa pode ser alterada usando certos parâmetros, como por exemplo, o parâmetro -o, que gera arquivos que podem ser visualizados em ferramentas como Rasmol e no PyMOL. Outro parâmetro interessante é o -fast, que gera um alinhamento mais rápido. Entretanto, isso gera uma redução na precisão do resultado. Existem outros parâmetros que podem ser aplicados. Para obtê-los, consulte a documentação do programa ou execute no terminal o comando:

./tmalign -h

Para ilustrar o uso local do TM-align, vamos reproduzir o estudo de caso apresentado anteriormente. Neste caso, os arquivos PDB foram adicionados ao mesmo diretório do arquivo executável tmalign. A seguir foi executado o comando:

./tmalign 3vik.pdb 4mdp.pdb -o 3VIK_x_4MDP/Out

Isso fará com que o TM-align alinhe as duas proteínas de exemplo e escreva o resultado dentro da pasta 3VIK_x_4MDP. Além disso, os arquivos de saída serão iniciados com a palavra “Out” (Figura 31), sendo “Out.pdb” o arquivo correspondente à proteína rotacionada escrita em formato PDB.

Figura 31. Arquivos resultantes da execução do TM-align. Fonte: próprio autor.

Como vantagem do uso do TM-align por linha de comando, podemos destacar que a realização de alinhamentos pode ser automatizada através de qualquer linguagem de programação que tenha acesso aos comandos do sistema. Por exemplo, a linguagem Python possui a biblioteca “os” que fornece métodos de acesso a funcionalidades do sistema operacional. Para executar o TM-align seria possível usar a função os.system( ) da seguinte forma:

import os

os.system("./tmalign protein1.pdb protein2.pdb")

Clique aqui para acessar a próxima seção do capítulo.


Sumário

Este texto foi retirado do capítulo “Alinhamento estrutural” de Santos e colaboradores (ainda não publicado). Para um melhor entendimento, dividimos o capítulo em sete partes:

Sumário
1. Introdução
2. Alinhamento de estruturas 3D com PyMOL
3. Alinhando estruturas por linha de comando com PyMOL
4. Alinhamento de estruturas 3D com TM-align
5. Alinhamento de estruturas 3D com Multiprot
6. Alinhamento de estruturas 3D com Mustang
7. Alinhamentos híbridos com PROMALS3D
Referências bibliográficas
Boa leitura!
Laboratório de Bioinformática e Sistemas
WRITTEN BY

Laboratório de Bioinformática e Sistemas

Somos um grupo de pesquisa com interesse na formação de pesquisadores de alto desempenho para atuação no campo da bioinformática e ciência da computação. Estamos hospedados no Departamento de Ciência da Computação da Universidade Federal de Minas Gerais.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

One thought on “Alinhamento de estruturas 3D com TM-align