Revista Brasileira de Bioinformática

Revista Brasileira de Bioinformática

0
Artigos

0
Autores

Alinhamento de estruturas 3D com TM-align

Leia também

TM-align é um algoritmo desenvolvido para identificar o melhor alinhamento possível entre um par de proteínas através de uma matriz de rotação construída com o TM-Score e programação dinâmica [3]. Ele é descrito como mais rápido, com maior precisão e cobertura que algoritmos conceituados como DALI [7] e CE [8].

Figura 26. Logotipo do TM-align. Disponível em https://zhanglab.ccmb.med.umich.edu/TM-align/.

O algoritmo realiza três etapas de alinhamentos iniciais rapidamente calculados. Na primeira etapa, as estruturas secundárias das proteínas são alinhadas usando programação dinâmica. A seguir, o algoritmo constrói uma matriz binária (0 ou 1), que indica se há uma correspondência na estrutura secundária do resíduo em questão [3]. Na segunda etapa, o alinhamento é baseado na correspondência contínua das duas estruturas, a estrutura menor e continuamente posicionada sobre a estrutura maior, e o alinhamento com melhor TM-Score é selecionado. O terceiro alinhamento também é obtido por programação dinâmica, mas a matriz de pontuação é obtida das matrizes de pontuação dos dois alinhamentos anteriores.

O TM-align pode ser utilizado tanto online (webtool) quanto em ambiente desktop (neste caso, a instalação deve ser feita em ambiente Linux por linha de comando). Para utilizar a ferramenta web ou realizar o download do código-fonte para a instalação local, acesse https://zhanglab.ccmb.med.umich.edu/TM-align/.

Executando o TM-align pela Internet

Executar o TM-align pelo servidor web oficial é a forma mais simples de utilização. Para isso, deve-se acessar o site oficial, disponível em https://zhanglab.ccmb.med.umich.edu/TM-align/. Na ferramenta web (Figura 27), deve-se utilizar como entrada dois arquivos no formato PDB ou PDBx/mmCIF (pode-se enviar os arquivos separadamente ou apenas colar o texto correspondente dentro das caixas de texto).

Figura 27. Exemplo de entrada de dados na página inicial do TM-align. Fonte: https://zhanglab.ccmb.med.umich.edu/TM-align/.

Opcionalmente, os resultados podem ser enviados para o seu e-mail (nesse caso, você deve preencher o campo Input Email). Por fim, execute o alinhamento clicando em Run TM-align. Quando o processamento for concluído, será exibida uma página com um resumo da execução e os arquivos de resultados disponíveis para download.

A seguir, será apresentado um exemplo de uso. Para este estudo de caso, realizaremos o alinhamento da beta-glicosidase do fungo Humicola insolens (PDB ID: 4MDP) e da beta-glicosidase do cupim Neotermes koshunensis (PDB ID: 3VIK). O primeiro passo foi acessar o site oficial usando um navegador de internet (foi usado o Google Chrome). A seguir, realizamos o upload dos arquivos de entrada no formato PDB (Figura 28).

Figura 28. Executando o TM-align para as entradas 3vik e 4mdp. Os arquivos PDB foram baixados em https://www.rcsb.org/structure/3vik e https://www.rcsb.org/structure/4mdp, respectivamente.

A seguir, executamos as análises clicando em Run TM-align. Após o processamento, a ferramenta web retornou um resumo do log de execução com a referência bibliográfica para citação do uso da ferramenta, os dados das estruturas de entrada, como nomes e tamanho de sequências, o valor do TM-score e o alinhamento das sequências (Figura 29)

Figura 29. Resumo do alinhamento de 3vik com 4mdp. Fonte: https://zhanglab.ccmb.med.umich.edu/TM-align/.

Além disso, a ferramenta retornou uma visualização tridimensional das estruturas diretamente no navegador usando a biblioteca Jsmol (Figura 30), além de links para o download dos arquivos de entrada e saída, e os arquivos pdb para visualizar a sobreposição na ferramenta Rasmol (disponível em http://www.openrasmol.org/).

Figura 30. Visualização do alinhamento de 3vik com 4mdp. Um exemplo de resultado similar (mas com outras estruturas de entrada) pode ser encontrado em https://zhanglab.ccmb.med.umich.edu/TM-align/example/873772.html.

Execução local do TM-align

Caso não deseje enviar os seus dados para o servidor web, você pode realizar o download do código-fonte do TM-align e instalá-lo em sua máquina. A versão em C++ do TM-align pode ser obtida em https://zhanglab.ccmb.med.umich.edu/TM-align/TMalign.cpp. Entretanto, antes de utilizá-la, você terá que realizar a compilação do código. Para isso, execute no terminal Linux os comandos:

  1. mkdir tm
  2. wget https://zhanglab.ccmb.med.umich.edu/TM-align/TMalign.cpp
  3. g++ TMalign.cpp -o tmalgin
  4. ./tmalign protein1.pdb protein2.pdb

Na linha 1, o comando cria uma pasta para armazenar o arquivo. A linha 2 utiliza o comando wget para fazer o download do arquivo do código-fonte (você pode baixá-lo manualmente). Na linha 3 é feita a compilação do arquivo para gerar um executável chamado tmalign. Na linha 4 é finalmente realizada a execução da ferramenta, em que protein1.pdb e protein2.pdb são as estruturas que serão alinhadas.

O algoritmo irá rotacionar e transladar a primeira proteína para alinhá-la com a segunda (que será a referência). O resultado será mostrado na saída do terminal. A execução padrão do programa pode ser alterada usando certos parâmetros, como por exemplo, o parâmetro -o, que gera arquivos que podem ser visualizados em ferramentas como Rasmol e no PyMOL. Outro parâmetro interessante é o -fast, que gera um alinhamento mais rápido. Entretanto, isso gera uma redução na precisão do resultado. Existem outros parâmetros que podem ser aplicados. Para obtê-los, consulte a documentação do programa ou execute no terminal o comando:

./tmalign -h

Para ilustrar o uso local do TM-align, vamos reproduzir o estudo de caso apresentado anteriormente. Neste caso, os arquivos PDB foram adicionados ao mesmo diretório do arquivo executável tmalign. A seguir foi executado o comando:

./tmalign 3vik.pdb 4mdp.pdb -o 3VIK_x_4MDP/Out

Isso fará com que o TM-align alinhe as duas proteínas de exemplo e escreva o resultado dentro da pasta 3VIK_x_4MDP. Além disso, os arquivos de saída serão iniciados com a palavra “Out” (Figura 31), sendo “Out.pdb” o arquivo correspondente à proteína rotacionada escrita em formato PDB.

Figura 31. Arquivos resultantes da execução do TM-align. Fonte: próprio autor.

Como vantagem do uso do TM-align por linha de comando, podemos destacar que a realização de alinhamentos pode ser automatizada através de qualquer linguagem de programação que tenha acesso aos comandos do sistema. Por exemplo, a linguagem Python possui a biblioteca “os” que fornece métodos de acesso a funcionalidades do sistema operacional. Para executar o TM-align seria possível usar a função os.system( ) da seguinte forma:

import os

os.system("./tmalign protein1.pdb protein2.pdb")

Clique aqui para acessar a próxima seção do capítulo.


Sumário

Este texto foi retirado do capítulo “Alinhamento estrutural” de Santos e colaboradores (ainda não publicado). Para um melhor entendimento, dividimos o capítulo em sete partes:

Sumário
1. Introdução
2. Alinhamento de estruturas 3D com PyMOL
3. Alinhando estruturas por linha de comando com PyMOL
4. Alinhamento de estruturas 3D com TM-align
5. Alinhamento de estruturas 3D com Multiprot
6. Alinhamento de estruturas 3D com Mustang
7. Alinhamentos híbridos com PROMALS3D
Referências bibliográficas
Boa leitura!

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui

spot_img
Laboratório de Bioinformática e Sistemashttp://bioinfo.dcc.ufmg.br
Somos um grupo de pesquisa com interesse na formação de pesquisadores de alto desempenho para atuação no campo da bioinformática e ciência da computação. Estamos hospedados no Departamento de Ciência da Computação da Universidade Federal de Minas Gerais.

Artigos relacionados