TM-align é um algoritmo desenvolvido para identificar o melhor alinhamento possível entre um par de proteínas através de uma matriz de rotação construída com o TM-Score e programação dinâmica [3]. Ele é descrito como mais rápido, com maior precisão e cobertura que algoritmos conceituados como DALI [7] e CE [8].
O algoritmo realiza três etapas de alinhamentos iniciais rapidamente calculados. Na primeira etapa, as estruturas secundárias das proteínas são alinhadas usando programação dinâmica. A seguir, o algoritmo constrói uma matriz binária (0 ou 1), que indica se há uma correspondência na estrutura secundária do resíduo em questão [3]. Na segunda etapa, o alinhamento é baseado na correspondência contínua das duas estruturas, a estrutura menor e continuamente posicionada sobre a estrutura maior, e o alinhamento com melhor TM-Score é selecionado. O terceiro alinhamento também é obtido por programação dinâmica, mas a matriz de pontuação é obtida das matrizes de pontuação dos dois alinhamentos anteriores.
O TM-align pode ser utilizado tanto online (webtool) quanto em ambiente desktop (neste caso, a instalação deve ser feita em ambiente Linux por linha de comando). Para utilizar a ferramenta web ou realizar o download do código-fonte para a instalação local, acesse https://zhanglab.ccmb.med.umich.edu/TM-align/.
Executando o TM-align pela Internet
Executar o TM-align pelo servidor web oficial é a forma mais simples de utilização. Na ferramenta web (Figura 27), deve-se utilizar como entrada dois arquivos no formato PDB ou PDBx/mmCIF (pode-se enviar os arquivos separadamente ou apenas colar o texto correspondente dentro das caixas de texto).
Opcionalmente, os resultados podem ser enviados para o seu e-mail (nesse caso, você deve preencher o campo Input Email). Por fim, execute o alinhamento clicando em Run TM-align. Quando o processamento for concluído, será exibida uma página com um resumo da execução e os arquivos de resultados disponíveis para download.
A seguir, será apresentado um exemplo de uso. Para este estudo de caso, realizaremos o alinhamento da beta-glicosidase do fungo Humicola insolens (PDB ID: 4MDP) e da beta-glicosidase do cupim Neotermes koshunensis (PDB ID: 3VIK). O primeiro passo foi acessar o site oficial usando um navegador de internet (foi usado o Google Chrome). A seguir, realizamos o upload dos arquivos de entrada no formato PDB (Figura 28).
A seguir, executamos as análises clicando em Run TM-align. Após o processamento, a ferramenta web retornou um resumo do log de execução com a referência bibliográfica para citação do uso da ferramenta, os dados das estruturas de entrada, como nomes e tamanho de sequências, o valor do TM-score e o alinhamento das sequências (Figura 29)
Além disso, a ferramenta retornou uma visualização tridimensional das estruturas diretamente no navegador usando a biblioteca Jsmol (Figura 30), além de links para o download dos arquivos de entrada e saída, e os arquivos pdb para visualizar a sobreposição na ferramenta Rasmol (disponível em http://www.openrasmol.org/).
Execução local do TM-align
Caso não deseje enviar os seus dados para o servidor web, você pode realizar o download do código-fonte do TM-align e instalá-lo em sua máquina. A versão em C++ do TM-align pode ser obtida em https://zhanglab.ccmb.med.umich.edu/TM-align/TMalign.cpp. Entretanto, antes de utilizá-la, você terá que realizar a compilação do código. Para isso, execute no terminal Linux os comandos:
|
Na linha 1, o comando cria uma pasta para armazenar o arquivo. A linha 2 utiliza o comando wget para fazer o download do arquivo do código-fonte (você pode baixá-lo manualmente). Na linha 3 é feita a compilação do arquivo para gerar um executável chamado tmalign. Na linha 4 é finalmente realizada a execução da ferramenta, em que protein1.pdb e protein2.pdb são as estruturas que serão alinhadas.
O algoritmo irá rotacionar e transladar a primeira proteína para alinhá-la com a segunda (que será a referência). O resultado será mostrado na saída do terminal. A execução padrão do programa pode ser alterada usando certos parâmetros, como por exemplo, o parâmetro -o, que gera arquivos que podem ser visualizados em ferramentas como Rasmol e no PyMOL. Outro parâmetro interessante é o -fast, que gera um alinhamento mais rápido. Entretanto, isso gera uma redução na precisão do resultado. Existem outros parâmetros que podem ser aplicados. Para obtê-los, consulte a documentação do programa ou execute no terminal o comando:
./tmalign -h |
Para ilustrar o uso local do TM-align, vamos reproduzir o estudo de caso apresentado anteriormente. Neste caso, os arquivos PDB foram adicionados ao mesmo diretório do arquivo executável tmalign. A seguir foi executado o comando:
./tmalign 3vik.pdb 4mdp.pdb -o 3VIK_x_4MDP/Out |
Isso fará com que o TM-align alinhe as duas proteínas de exemplo e escreva o resultado dentro da pasta 3VIK_x_4MDP. Além disso, os arquivos de saída serão iniciados com a palavra “Out” (Figura 31), sendo “Out.pdb” o arquivo correspondente à proteína rotacionada escrita em formato PDB.
Como vantagem do uso do TM-align por linha de comando, podemos destacar que a realização de alinhamentos pode ser automatizada através de qualquer linguagem de programação que tenha acesso aos comandos do sistema. Por exemplo, a linguagem Python possui a biblioteca “os” que fornece métodos de acesso a funcionalidades do sistema operacional. Para executar o TM-align seria possível usar a função os.system( ) da seguinte forma:
import os
|
Clique aqui para acessar a próxima seção do capítulo.
Sumário
Este texto foi retirado do capítulo “Alinhamento estrutural” de Santos e colaboradores (ainda não publicado). Para um melhor entendimento, dividimos o capítulo em sete partes:
[…] 4. Alinhamento de estruturas 3D com TM-align […]