Download PDF
ads:
Tácio Vinício Amorim Fernandes
Estudo do Enovelamento de
Peptídeos e Proteínas por Métodos
Estocásticos e Dinâmica Molecular
DISSERTAÇÃO DE MESTRADO SUBMETIDA À
UNIVERSIDADE FEDERAL DO RIO DE JANEIRO
VISANDO A OBTENÇÃO DO GRAU DE MESTRE EM
CIÊNCIAS BIOLÓGICAS (BIOFÍSICA)
Universidade Federal do Rio de Janeiro
Centro de Ciências da Saúde
Instituto de Biofísica Carlos Chagas Filho
2009
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
Tácio Vinício Amorim Fernandes
Estudo do Enovelamento de Peptídeos e Proteínas por
Métodos Estocásticos e Dinâmica Molecular
Dissertação de Mestrado apresentada ao
Programa de Pós-Graduação em Ciências
Biológicas (Biofísica), Instituto de Biofísica
Carlos Chagas Filho, Universidade Federal do
Rio de Janeiro, como parte dos requisitos
necessários à obtenção do título de Mestre em
Ciências (Biofísica).
Orientador:
Prof. Dr. Pedro Geraldo Pascutti
IBCCF UFRJ
Rio de Janeiro
2009
ads:
XXXX Fernandes, Tácio Vinício Amorim
Estudo do Enovelamento de Peptídeos e Proteínas por Métodos
Estocásticos e Dinâmica Molecular / Tácio Vinício Amorim Fernandes. - Rio
de Janeiro: Universidade Federal do Rio de Janeiro / Instituto de Biofísica
Carlos Chagas Filho, 2009.
XXII, 155 f. : il.; 31 cm
Orientador: Prof. Dr. Pedro Geraldo Pascutti
Dissertação (mestrado) Universidade Federal do Rio de Janeiro, Instituto de Biofísica Carlos Chagas Filho, 2009.
1. Enovelamento de proteínas. 2. Dinâmica Molecular. 3. Generalized
Simulated Annealing -- Dissertação. I. Pascutti, Pedro Geraldo. II.
Universidade Federal do Rio de Janeiro, Instituto de Biofísica Carlos Chagas
Filho
CDU - XXX:XXX
IV
V
AGRADECIMENTOS
Agradeço à todos que acreditaram e de alguma forma contribuíram para a minha
formação, ajudando a realizar este trabalho.
À minha família pelo apoio incondicional, carinho e paciência, que me permitiram
chegar até aqui.
Ao Duke e a Kika, pelos momentos de alegria.
À Roberta Schneider, pelo amor e carinho e por acreditar em mim mais do que eu
mesmo.
Ao professor, orientador e amigo Pedro Pascutti pelo incentivo e por ter acreditado em
mim e ter me dado as condições necessárias para realizar este trabalho.
À Flávia Agostini e ao Marcelo Melo, por terem compartilhado seus conhecimentos para
a elaboração deste trabalho.
Ao Rafael Bernandi e ao Gabriel Limaverde pelas discussões sobre meu trabalho e por
compartilhar comigo seus interesses por hardware, software e cluster.
Ao Samuel Pita, pelos preciosos artigos, sempre fresquinhos, e pelo apoio em vários
trabalhos.
Ao Arlan Goncalves, Paulo Ricardo Batista, Diego Enry e Mauricio Garcia, pelo apoio
de todas as horas e pelos bons momentos compartilhados.
À todos novos membros no Laboratório de Modelagem e Dinâmica Molecular (LMDM).
Aos professores e funcionários da UFRJ que contribuíram para a realização desta
dissertação de alguma forma.
Ao CNPq pelo apoio financeiro.
VI
"Não deve haver nenhuma
barreira para a liberdade do
inquérito. Não nenhum
lugar para o dogma na
ciência. O cientista está livre,
e deve estar livre para fazer
toda pergunta, duvidar de
qualquer afirmação, para
procurar toda a evidência,
para corrigir quaisquer
erros."
Robert Oppenheimer.
VII
RESUMO
A determinação experimental das estruturas de proteínas ainda é muito
lenta se comparada com a taxa de acúmulo de dados das seqüências de
aminoácidos. Isto torna o enovelamento de proteínas um problema
central para o desenvolvimento da biologia pós-genômica. Atualmente, a
determinação das estruturas protéicas é realizada por duas técnicas
experimentais principais: a Cristalografia e Difração de Raios-X e a
Ressonância Magnética Nuclear (RMN). Entretanto, devido às limitações
destas técnicas, vários métodos de predição in silico foram desenvolvidos
nos últimos anos com o objetivo de ajudar a resolver o problema do
enovelamento de proteínas. Neste trabalho, usamos a combinação de
duas técnicas computacionais, o Generalized Simulated Annealing (GSA)
baseado na termodinâmica generalizada proposta por Tsallis e a
Dinâmica Molecular (DM), para estudar o problema do enovelamento de
proteínas. Inicialmente, aplicamos a metodologia do GSA a um modelo
ideal, constituído de polialaninas, para a escolha dos melhores
parâmetros do programa. Após estes ajustes, tivemos como objetivo
estudar o desempenho do GSA em estruturas mais complexas. Com isso,
houve a necessidade da inclusão de um termo de energia potencial que
descrevesse o solvente de forma eficiente. Além disso, usamos o todo
de DM para refinar as estruturas finais de menor energia de cada
modelo proposto pelo GSA. O primeiro modelo realista estudado foi o
mastoparano-X, um peptídeo extraído do veneno de vespas, de
considerável importância no estudo de antibióticos. Além deste peptídeo,
investigamos outros dois modelos que são comumente usados para o
estudo do enovelamento de proteínas por métodos experimentais e
computacionais, as pequenas proteínas Trp-cage e Villin Headpiece. Os
resultados mostraram que a otimização da estrutura estendida do
mastoparano-X por GSA e subseqüente refinamento por DM foi uma
excelente estratégia para o estudo do enovelamento. Além disso, foi
observado que uma boa alternativa é o uso da técnica do recozimento
(annealing) no próprio método de DM.
VIII
ABSTRACT
The rate of experimental determination of protein structures is still very
slow when compared with the rate of accumulation data of the amino
acids sequences. This makes protein folding a central problem for the
development of post genome biology. Nowadays, the determination of
protein structures is achieved through two main experimental
techniques: X-ray Crystallography and Nuclear Magnetic Resonance
(NMR). However, due to limitations in these techniques, several methods
of in silico prediction of protein folding were developed in the last few
years. In this work, we used the combination of two computational
methods, Generalized Simulated Annealing (GSA) - based in the
generalized thermodynamics proposed by Tsallis - and Molecular
Dynamics (MD), to investigate the protein folding problem. Initially, we
used the GSA methodology on an idealized model, based in polialanine
polymers, to find the optimal GSA parameters. After these adjustments,
we studied the GSA performance in complex structures. Therefore, the
need for potential energy term to describe the solvent in a more efficient
way was observed. Furthermore, we used the MD method to refine the
low energy final structures of each model proposed with the GSA method.
The first realistic model studied was the mastoparan-X, a peptide
extracted from wasp venom, that is very important for the study of new
antibiotics. In addition, we studied two models commonly used in
protein folding studies by experimental and computational methods, the
small proteins Trp-cage and Villin Headpiece. The results showed that
the optimization of the extended mastoparan-X structure with the GSA
method and subsequent refinement with MD was an excellent strategy
for protein folding studies. Besides, it was observed that a good
alternative is the use of the annealing technique in the MD method.
IX
Lista de Ilustrações
Figura Página
Formação de um dipeptídeo a partir de dois aminoácidos com a perda de
uma molécula de água.
2
Ressonância dos elétrons pi entre o oxigênio da carbonila e o nitrogênio da
amida dando o caráter de dupla-ligação à ligação peptídica [NELSON, D. L. &
COX, M. M. (2004)].
3
Representação das ligações químicas com liberdade de rotações (N—Cα),
(Cα—C) e (CN) do esqueleto peptídico e seus respectivos ângulos de torção,
φ, Ψ e ω respectivamente.
3
(A) Representação de uma série de planos sucessivos da unidade planar da
ligação peptídica de um esqueleto polipeptídico. (B) Quando as duas ligações
peptídicas que rodeiam um carbono alfa estão no mesmo plano os ângulos φ e
ψ são ambos definidos como 0°. Em uma proteína esta conformação é
dificultada pela sobreposição estérica entre um oxigênio carbonila e um átomo
de hidrogênio α-amino [adaptada de NELSON, D. L. & COX, M. M. (2004)].
4
Devido às colisões estéricas entre os átomos de cada aminoácidos, muitos
pares de ângulos φ e Ψ não ocorrem. Neste gráfico, denominado
Ramachandran, estão mostradas as regiões teoricamente permitidas (hélice-α,
folha-β e hélice para a esquerda) dos peptídeos, definidas pelos valores de φ e
Ψ. Portanto, em um gráfico dos valores de φ e Ψ é possível identificar não as
regiões das estruturas secundárias como também as estruturas não permitidas
[adaptada de NELSON, D. L. & COX, M. M. (2004)].
5
Exemplos da nomenclatura dos átomos das cadeias laterais de dois
aminoácidos: Lisina e Tirosina. Os átomos de hidrogênio foram omitidos para
melhor visualização.
6
Representação dos ângulos de torção da Arginina [adaptado de LESK, A. M.
(2001)].
6
Esquema da estrutura primária da Ribonuclease A Pancreática Bovina. Os 124
resíduos de aminoácidos estão representados na forma de bolinhas e na forma
de bastões amarelos estão representadas as ligações dissulfeto (S-S) ente os
resíduos Cys26:Cys84, Cys40:Cys95, Cys58:Cys110, Cys65:Cys72 [adaptada de
NELSON, D. L. & COX, M. M. (2004)].
7
Representação gráfica da hélice-alfa. Cada volta simples da hélice (passo)
possui o comprimento de 5,4 Å (3,6 resíduos de aminoácidos). As linhas
tracejadas representam as ligações hidrogênio entre o oxigênio da carbonila
de cada aminoácido (n) e o hidrogênio da amida de outro aminoácido que
está situado a quatro unidades adiante na seqüência linear (n+4) [adaptada de
NELSON, D. L. & COX, M. M. (2004)].
9
Representação gráfica da folha-beta. As linhas tracejadas representam as
ligações hidrogênio. (A) Representação de folha-beta formada por fitas
paralelas. (B) Representação da folha-beta anti-paralela. Note que a
disposição das ligações hidrogênio são diferentes entre as folhas-beta paralela
e anti-paralela [adaptada de NELSON, D. L. & COX, M. M. (2004)].
10
Estrutura terciária da Ribonuclease A Pancreática Bovina (RNase A, código PDB:
7RSA).
11
X
Representação esquemática da solvatação de uma proteína. As moléculas de
água são representadas pelas esferas azuis e a proteína pelas estruturas
retangulares. Em (A) está representada a solvatação da estrutura
desenovelada, e em (B) está representada a solvatação da estrutura
enovelada. No estado desenovelado (A), por ter uma maior área acessível ao
solvente, a cadeia polipeptídica tem um maior mero de moléculas de água
ao seu redor, formando a camada de hidratação. a estrutura enovelada,
por ter uma menor área acessível ao solvente, tem um menor mero de
moléculas de água formando a camada de hidratação [adaptado de
GRUEBELE, M. (1999)].
13
A estrutura nativa das proteínas é mantida por um delicado balanço de forças.
A energia livre negativa do enovelamento é resultado do balanço entre o
efeito hidrofóbico (entropia do solvente), as interações intramoleculares
(entalpia conformacional) e a entropia conformacional. Onde o efeito
hidrofóbico e as interações intramoleculares favorecem o enovelamento, a
entropia da conformação desfavorece. O resultado de todos esses
componentes é uma energia livre negativa entre -5 e -20 kcal/mol [adaptado
de Biochemistry, 3rd Edition, Mathews, Van Holde, Ahern].
14
Estrutura quaternária do tetrâmero da Catalase Humana (cód. PDB: 1DGF).
15
A seqüência primária das proteínas determina a sua estrutura tridimensional.
17
Representação esquemática tridimensional da hipersuperfície de energia
potencial de uma dada molécula. O eixo vertical representa a energia, e os
outros dois representam os ângulos de torção, ou seja, a mudança
conformacional. A sucessão de picos (pontos de máxima energia da molécula)
e poços (pontos de energia baixa) revelam as barreiras de energia decorrentes
das variações entre os diferentes estados da molécula [adaptada de Nolting, B.
(1999)].
20
A hipersuperfície de enovelamento teria a forma de um funil. A largura (eixo
horizontal) do funil representa a entropia da cadeia. A energia livre está
representada pela profundidade do funil (eixo vertical). A rugosidade revela os
mínimos locais de energia, onde geralmente ficam presas as conformações do
estado de Molten Globule, ou estrutura intermediárias. A estrutura nativa
encontra-se no final do funil, no mínimo global de energia livre [adaptada de
ONUCHIC, J. N (2000)].
21
Funil de enovelamento de uma proteína real evidenciando cinco caminhos de
enovelamento alternativos [adaptada de TUNNICLIFFE, R. B. et al. (2005)].
22
Diagrama esquemático da conformação de uma proteína em relação a sua
semelhança com a estrutura nativa. No eixo vertical está representada a
coordenada de enovelamento. A estrutura nativa está representada no topo
do esquema. As conformações que mais se assemelham com a ela são as que
estão mais próximas (mais próxima do topo). A medida que se afasta da
estrutura nativa o aumento do número de conformações. Os caminhos de
enovelamento vão diminuindo na medida em que as conformações vão se
enovelando [adaptada de BRYNGELSON, J. D. et al. (1994)].
23
(A) Representação do Potencial de Ligação para um par n qualquer, onde b
representa o comprimento da ligação química. (B) Representação do Potencial
Angular para um termo de átomos ligados n qualquer cujo ângulo entre eles
varia harmonicamente em torno do ângulo de equilíbrio, onde θ é o ângulo
entre duas ligações consecutivas; (C) Potencial Diedro Impróprio, onde ξ e o
ângulo entre os planos. Este potencial mantém a planaridade dos átomos de
hidrogênio em relação ao anel benzênico, por exemplo. (D) Potencial Torcional
Próprio, onde φ é o ângulo com liberdade de torção.
34
Representação atômica usando-se os raios de van der Waals [adaptado de da
SILVA, A. W. S. (2003)].
35
XI
Energia potencial de Coulomb entre dois átomos de cargas unitárias e opostas.
O tom de cor indica a intensidade do potencial. Verde indica valores positivos
(átomo amarelo) e vermelho indica valores negativos (átomo azul). As setas
representam o campo elétrico, que saem do átomo positivo para o átomo
negativo. As linhas brancas são as eqüipotenciais.
36
Fluxograma do GSA. Nota-se que existe uma alternativa para se movimentar
para regiões onde a função E(x
t+1
) é maior do que E(x
t
). A probabilidade para
se aceitar a conformação com a nova energia se deve ao critério Pq
A
(critério
de aceitação generalizado proposto por Tsallis [TSALLIS, C. & STARIOLO, D. A.
(1988)]). É valido lembrar que, quando q
A
= 1 assumimos o critério de Metropolis
[METROPOLIS, N. et al. (1953)] para a probabilidade de aceitação.
42
Gráfico de T(t), onde T
0
= 100.
44
Gráfico de gqV (Δφ), para A) T0 = 0,1; B) T0 = 0,05; C) T0 = 0,01; D) T0 = 0,005.
45
Gráficos de PqA. Em A) T0 = 100 e B) T0 = 10.
46
Fluxograma simplificado do algoritmo da simulação de Dinâmica Molecular.
Neste fluxograma, muitos passos adicionais foram omitidos para maior
simplificação, como, por exemplo, os algoritmos que controlam a temperatura
e a pressão.
48
Foto do "Cluster" LMDM utilizado para executar as ferramentas para o
desenvolvimento deste trabalho.
50
Esquema básico da arquitetura de um cluster mostrando a distribuição das
máquinas “clientes” interligadas ao servidor via um switch.
51
Variação dos parâmetros do GSA. qT vs qA e qT vs qV [Reproduzido de
AGOSTINI, F. P. et al. (2006)].
57
Modelo de homo-peptídeo contendo 22 resíduos de alaninas na conformação
de fita-beta.
58
Modelo da 22-Ala obtido pelo algoritmo do GSA, com DRMQ de 0,07 nm e
energia de -68,46 kcal/mol, usando os parâmetros qA = 2,1; qV = 1,9 e qT = 1,7,
função dielétrica ε = 2, temperatura inicial T0 = 100 e 5.000.000 de passos. Para o
cálculo do DRMQ foi usada uma estrutura de 22 alaninas em hélice-alfa.
Estrutura com valores a baixo de 0,1 nm são consideradas excelentes (muito
próximas da estrutura de referência)
.
59
Variação de qV e qA com qT para o polímero 22-ala.
60
-DRMQ das estruturas obtidas pelo GSA em relação a estrutura de referência
(22-ala em hélice-alfa), utilizando os melhores parâmetros obtidos com a
varredura do homo-peptídeo de 22 -Ala (qA = 2.1; qV = 1.9 e qT = 1.7), 5000000
de passos, T
0
= 100.
61
Representação do FGF com os principais resíduos carregados do tio de
ligação da heparina (Lys111, Lys120, Arg121, Lys126, Gln124). Na forma de sticks,
estão representadas conformações da molécula de heparina. Em preto, a
conformação da heparina que apresentou menor energia quando ancorada
no FGF (qT = 1,7; qA = 1,3; qV 1,7). Em marrom, a conformação da molécula da
heparina que apresentou o segundo melhor ancoramento com o FGF (qT = 1,5;
qA= 1,3; qV 1,5). Os resultados obtidos pelo GSA são comparados com o
complexo FGF-heparina (estrutura colorida para a heparina), determinada
experimentalmente (código do PDB: 1BFB).
65
Modelo em bastão-e-bola da estrutura do TFE.
67
Estrutura do MP-X determinada por RMN (código do PDB: 1A13 [KUSUNOKI, H. et
al. (1998)]. A carga total do MP-X é de +4 devido aos resíduos carregados (Lys4,
Lys11, Lys12) e ao N-terminal. As cadeias laterais do MP-X estão representadas
na forma de bastão (sticks).
67
Estrutura estendida do MP-X (Ile-Asn-Trp-Lys-Gly-Ile-Ala-Ala-Met-Ala-Lys-Lys-Leu-
Leu-NH2).
71
XII
Resultados do THOR/GSA para o MP-X. (A) Gráfico relacionando o -DRMQ
das estruturas encontradas pelo THOR/GSA em relação à estrutura de
referência (estrutura do MP-X depositada no PDB [cód. PDB 1A13]). Em
vermelho estão representadas as 50 estruturas encontradas com o THOR/GSA
sem o termo de energia de solvatação (SEM SAS), e em preto estão
representadas as 50 estruturas encontradas através do THOR/GSA com o termo
de energia de solvatação (COM SAS). (B) Sobreposição da estrutura de menor
energia (-32,95 kcal/Mol) encontrada e que também apresenta o menor -
DRMQ (0,34 nm) (estrutura verde) em relação à estrutura depositada no PDB,
1A13 (estrutura azul). Em destaque (na forma de sticks) a cadeia lateral do
resíduo de Asn2 em ambas as estruturas.
72
Padrões de estrutura secundária por resíduo, ao longo da simulação, para o
MP-X. Em branco, os resíduos sem estrutura (random coil); em verde, resíduos
em curvas (bend); em amarelo, resíduos em voltas (turn); em roxo, resíduos em
hélice-5 ou também denominado de hélice-π; em azul, resíduos em hélice-alfa;
em cinza, resíduos em hélice-3 ou também denominado de hélice-3
10
.
77
(A) Gráfico de -DRMQ do MP-X obtido ao longo dos 300 ns de simulção em
relação a estrutura de referência (estrutura do PBD, 1A13). (B) Gráfico do
número de ligações hidrogênio entre os átomos do esqueleto peptídico. Em
vermelho, destacamos a "suavização" através da média dos resultados a cada
300 pontos.
78
Padrões de estrutura secundária por resíduo, ao longo da simulação, para o
MP-X. Em branco, os resíduos sem estrutura (random coil); em vermelho, os
resíduos em folha-beta; em preto, os resíduos em ponte-beta (beta-bridge) ou
também denominado alça-beta; em verde, os resíduos em curvas (bend); em
amarelo, os resíduos em voltas (turn); em roxo, resíduos em hélice-5 ou também
denominado de hélice-π; em cinza, os resíduos em hélice-3 ou também
denominado de hélice-3
10
; em azul, resíduos em hélice-alfa.
79
(A) Gráfico de -DRMQ do MP-X obtido ao longo dos 300 ns de simulação em
relação a estrutura de referência (estrutura do PBD, 1A13). (B) Gráfico do
número de ligações hidrogênio entre os átomos do esqueleto peptídico. Em
vermelho, destacamos a "suavização" através da média dos resultados a cada
300 pontos.
80
Sobreposição da estrutura, em verde, de menor -DRMQ (0,06 nm)
selecionada da simulação por DM com a estrutura, em azul, resolvida
experimentalmente por RMN e depositada no PDB (cód. 1A13). Em destaque,
na forma de CPK, as cadeias laterais das duas estruturas (em azul a cadeia
lateral da estrutura do PDB e em verde da estrutura de menor desvio
selecionada da trajetória da simulação).
80
Padrões de estrutura secundária por resíduo, ao longo da dinâmica, para o MP-
X. Em branco, os resíduos sem estrutura (random coil); em vermelho, os resíduos
em folha-beta; em preto, os resíduos em ponte-beta (beta-bridge); em verde,
os resíduos em curvas (bend); em amarelo, os resíduos em voltas (turn); em
cinza, os resíduos em hélice-3 ou também denominado de hélice-3
10
; em azul,
os resíduos em hélice-alfa.
81
(A) Gráfico de -DRMQ do MP-X obtido, ao longo dos 300 ns de simulação,
em relação a estrutura de referência (estrutura do PBD, 1A13). (B) Gráfico do
número de ligações hidrogênio entre os átomos do esqueleto peptídico. Em
vermelho, destacamos a "suavização" através da média dos resultados a cada
300 pontos.
82
Padrões de estrutura secundária por resíduo, ao longo da simulação, para o
MP-X. Em branco, os resíduos sem estrutura (random coil); em preto, os resíduos
em ponte-beta (beta-bridge); em verde, os resíduos em curvas (bend); em
amarelo, os resíduos em voltas (turn); em roxo, resíduos em hélice-5 ou também
denominado de hélice-π; em cinza, os resíduos em hélice-3 ou também
denominado de hélice-3
10
; em azul, resíduos em hélice-alfa.
84
XIII
(A) Gráfico de -DRMQ do MP-X obtido ao longo dos 300 ns de simulação, em
relação a estrutura de referência (estrutura do PBD, 1A13). (B) Gráfico do
número de ligações hidrogênio entre os átomos do esqueleto peptídico. Em
vermelho, destacamos a "suavização" através da média dos resultados a cada
300 pontos.
85
Sobreposição da estrutura, em verde, de menor -DRMQ (0,13 nm)
selecionada da simulação por DM com a estrutura, em azul, resolvida
experimentalmente (estrutura depositada no PDB, 1A13). Em destaque, na
forma de CPK, as cadeias laterais das duas estruturas.
86
Padrões de estrutura secundária por resíduo, ao longo da simulação, para o
MP-X. Em branco, os resíduos sem estrutura (random coil); em vermelho, os
resíduos em folha-beta; em preto, os resíduos em ponte-beta (beta-bridge); em
verde, os resíduos em curvas (bend); em amarelo, os resíduos em voltas (turn);
em roxo, resíduos em hélice-5 ou também denominado de hélice-π; em cinza,
os resíduos em hélice-3 ou também denominado de hélice-3
10
; em azul, resíduos
em hélice-alfa.
88
(A) Gráfico de -DRMQ do MP-X obtido ao longo dos 300 ns de simulação em
relação a estrutura de referência (estrutura do PBD, 1A13). (B) Gráfico do
número de ligações hidrogênio entre os átomos do esqueleto peptídico. Em
vermelho, destacamos a "suavização" através da média dos resultados a cada
300 pontos.
89
Padrões de estrutura secundária por resíduo, ao longo da simulação, para o
MP-X. Em branco, os resíduos sem estrutura (random coil); em vermelho, os
resíduos em folha-beta; em preto, os resíduos em ponte-beta (beta-bridge); em
verde, os resíduos em curvas (bend); em amarelo, os resíduos em voltas (turn);
em roxo, resíduos em hélice-5 ou também denominado de hélice-π; em cinza,
os resíduos em hélice-3 ou também denominado de hélice-3
10
; em azul, resíduos
em hélice-alfa.
90
(A) Gráfico de -DRMQ do MP-X obtido ao longo dos 300 ns de simulação em
relação a estrutura de referência (estrutura do PBD, 1A13). (B) Gráfico do
número de ligações hidrogênio entre os átomos do esqueleto peptídico. Em
vermelho, destacamos a "suavização" através da média dos resultados a cada
300 pontos.
91
Estrutura do peptídeo MP-X em quatro momentos da DM do sistema 4. (A)
Momento antes da DM com restrição de posição dos átomos pesado do
peptídeo. (B) Momento de partida da simulação de 300 ns. (C) Momento no
meio da DM e (D) momento final dos 300 ns da simulação.
93
Representação, na forma de New Cartoon, da estrutura do Trp-Cage. (Código
PDB: 1L2Y [NEIDIGH, J. W. et al. (2002)]. Em destaque, na forma de CPK, a cadeia
lateral do Trp6. Em vermelho esta destacado a hélice-alfa (Leu2 até Lys8) e em
azul está destacado a hélice-3
10
(Gly11 até Ser14). A carga +1 do Trp-cage é
devido ao balanço de cargas dos resíduos de aminoácidos carregados (Lys8,
Asp9 e Arg16).
96
Conformação estendida do Trp-cage (Asn-Leu-Tyr-Ile-Gln-Trp-Leu-Lys-Asp-Gly-
Gly-Pro-Ser-Ser-Gln-Arg-Pro-Pro-Pro-Ser).
97
Resultados do THOR/GSA para o Trp-cage. (A) Gráfico relacionando o Cα-
DRMQ das estruturas geradas pelo THOR/GSA em relação à estrutura de
referência (estrutura do Trp-cage depositada no PDB [cód. PDB 1L2Y]). Em
vermelho estão representadas as 50 estruturas encontradas com o THOR/GSA
sem o termo de energia de solvatação (SEM SAS), e em preto estão
representadas as 50 estruturas encontradas pelo THOR/GSA com o termo de
energia de solvatação (COM SAS). (B) Sobreposição da estrutura de menor
energia (26,18 kcal/Mol) encontrada e que também apresenta o menor -
DRMQ (0,32 nm) (estrutura verde) em relação à estrutura depositada no PDB,
1L2Y (estrutura azul). Em destaque (na forma de sticks) a cadeia lateral do
resíduo de Trp6 em ambas as estruturas.
98
XIV
Padrões de estrutura secundária por resíduo, ao longo da simulação, para o
Trp-cage. Em branco, os resíduos sem estrutura (random coil); em vermelho, os
resíduos em folha-beta; em preto, os resíduos em ponte-beta (beta-bridge) ou
também denominado alça-beta; em verde, os resíduos em curvas (bend); em
amarelo, os resíduos em voltas (turn); em roxo, resíduos em hélice-5 ou também
denominado de hélice-π; em cinza, os resíduos em hélice-3 ou também
denominado de hélice-3
10
; em azul, resíduos em hélice-alfa.
102
(A) Gráfico de -DRMQ do Trp-Cage obtido ao longo dos 300 ns de simulação
em relação a estrutura de referência (estrutura do PBD, 1L2Y). (B) Gráfico do
número de ligações hidrogênio entre os átomos do esqueleto peptídico. Em
vermelho, destacamos a "suavização" através da média dos resultados a cada
300 pontos.
103
Padrões de estrutura secundária por resíduo, ao longo da simulação, para o
Trp-cage. Em branco, os resíduos sem estrutura (random coil); em preto, os
resíduos em ponte-beta (beta-bridge); em verde, os resíduos em curvas (bend);
em amarelo, os resíduos em voltas (turn); em cinza, os resíduos em hélice-3 ou
também denominado de hélice-3
10
.
104
(A) Gráfico de -DRMQ do Trp-cage obtido ao longo dos 300 ns da dinâmica
em relação a estrutura de referência (estrutura do PBD, 1L2Y). (B) Gráfico do
número de ligações hidrogênio entre os átomos do esqueleto peptídico. Em
vermelho, destacamos a "suavização" através da média dos resultados a cada
300 pontos.
105
Padrões de estrutura secundária por resíduo, ao longo da simulação, para o
Trp-cage. Em branco, os resíduos sem estrutura (random coil); em vermelho, os
resíduos em folha-beta; em preto, os resíduos em ponte-beta (beta-bridge); em
verde, os resíduos em curvas (bend); em amarelo, os resíduos em voltas (turn);
em cinza, os resíduos em hélice-3 ou também denominado de hélice-3
10
.
106
(A) Gráfico de -DRMQ do Trp-cage obtido ao longo dos 300 ns da dinâmica
em relação a estrutura de referência (estrutura do PBD, 1L2Y). (B) Gráfico do
número de ligações hidrogênio entre os átomos do esqueleto peptídico. Em
vermelho, destacamos a "suavização" através da média dos resultados a cada
300 pontos.
107
Representação, na forma de New Cartoon, da estrutura da Villin Headpiece.
(Código PDB: 1VII [McKNIGHT, C. J. et al. (1997)]. Cada hélice-alfa possui uma volta
estabilizada por ligações hidrogênio (Ala9, Ala19, Lys33). Em destaque os
resíduos do núcleo hidrofóbico da Hp-36, Leu2, Phe7, Val10, Phe11, Phe18, Lys25,
Gln26 e Leu29. Mais de 70% da superfície desses resíduos estão inacessíveis ao
solvente.
110
Estrutura primária estendida da Villin Headpiece (Met-Leu-Ser-Asp-Glu-Asp-Phe-
Lys-Ala-Val-Phe-Gly-Met-Thr-Arg-Ser-Ala-Phe-Ala-Asn-Leu-Pro-Leu-Trp-Lys-Gln-Gln-
Asn-Leu-Lys-Lys-Glu-Lys-Gly-Leu-Phe).
111
Villin Headpiece. (A) Gráfico relacionando o desvio dos átomos de carbono-α
do esqueleto peptídico (Cα-DRMQ) das estruturas geradas pelo GSA em
relação à estrutura de referência (estrutura da HP-36 determinada por RMN
[cód. PDB 1VII]). Em vermelho estão representadas as 50 estruturas encontradas
pelo algoritmo do GSA sem o termo de energia de solvatação (SEM SAS), e em
preto estão representadas as 50 estruturas encontradas pelo algoritmo do GSA
com o termo de energia de solvatação (COM SAS). (B) Sobreposição da
estrutura de menor energia encontrada, que também apresenta o menor -
DRMQ (0,70 nm) (estrutura verde), em relação à estrutura depositada no PDB,
1A13 (estrutura azul).
113
Padrões de estrutura secundária por resíduo, ao longo da simulação, para o
Villin Headpiece. Em branco, os resíduos sem estrutura (random coil); em preto,
os resíduos em ponte-beta (beta-bridge); em verde, os resíduos em curvas
(bend); em amarelo, os resíduos em voltas (turn); em roxo, resíduos em hélice-5
ou também chamada de hélice-π; em cinza, os resíduos em hélice-3 ou
também chamada de hélice-3
10
; em azul, resíduos em hélice-alfa.
117
XV
(A) Gráfico de -DRMQ da Villin Headpiece obtido ao longo dos 300 ns da
dinâmica em relação a estrutura de referência (estrutura do PBD, 1VII). (B)
Gráfico do número de ligações hidrogênio entre os átomos do esqueleto
peptídico.
118
Padrões de estrutura secundária por resíduo, ao longo da simulação, para o
Villin Headpiece. Em branco, os resíduos sem estrutura (random coil); em
vermelho, os resíduos em folha-beta; em preto, os resíduos em ponte-beta
(beta-bridge); em verde, os resíduos em curvas (bend); em amarelo, os resíduos
em voltas (turn); em cinza, os resíduos em hélice-3 ou também denominado de
hélice-3
10
.
119
Gráfico de -DRMQ da Villin Headpiece obtido ao longo dos 300 ns da
simulação em relação a estrutura de referência (estrutura do PBD, 1VII). (B)
Gráfico do número de ligações hidrogênio entre os átomos do esqueleto
peptídico.
120
XVI
Lista de Tabelas
Tabela 1
Número de passos ou tempo para cada etapa da otimização.
49
Tabela 2
Valores dos parâmetros de tensão superficial obtidos experimentalmente por
Eisenberg e McLanchlan [EISENBERG, D. & McLANCHLAN, A. D. (1986)].
69
XVII
LISTA DE SÍMBOLOS, SIGLAS E ABREVIATURAS
DM
Dinâmica Molecular
PDB
Protein Data Bank
DRMQ
Desvio da Raiz Média Quadrática
RMSD
Root Mean Square Deviation
RMN
Ressonância Magnética Nuclear
GROMACS
GROningen Machine for Chemical Simulation
GROMOS
GROningen Molecular Simulation
GSA
Generalized Simulated Annealing
q
A
Parâmetro de Aceitação do GSA
q
T
Parâmetros de Temperatura do GSA
q
V
Parâmetro de Visitação do GSA
SASA
Area Solvente Accessible Surface
SAS
Solvente Accessible Surface
MP-X
Mastoparano-X
HP-36
Villin Headpiece
PME
Particle Mesh Ewald
TIP4P
Transferable Intermolecular Potentials -4 Points
SPC
Single Point Charge
22-ala
22 alaninas
18-ala
18 alaninas
13-ala
13 alaninas
FGF
Fibroblast Growth Factor
CD
Dichroism Circular
TFE
2,2,2-trifluoretanol
KD
Kilodalton
SA
Simulated Annealing
FSA
Fast Simulated Annealing
MC
Monte Carlo
CASP
Cristical Assessment of Techniques for Protein Structure Prediction
CSA
Classical Simulated Annealing
UTP
Unshielded Twisted Pair
DHCP
Dynamic Host Configuration Protocol
LAM/MPICH
Local Area Multicomputer/Message Passing Interface
XVIII
CPC
Condições Periódicas de Contorno
CHARMM
Chemistry at HARvard Macromolecular Mechanics
AMBER
Assisted Model Building with Energy Refinement
LINCS
LINear Constraint Solver
OPLS/AA
Optimised Potentials for Liquid Simulations / All Atoms
DSSP
Database of Secondary Structure in Proteins
REMD
Replica Exchange Molecular Dynamics
CPU
Central Processing Unit
XIX
LETRAS LATINAS E GREGAS
A
Área acessível ao solvente
atm
Atmosfera
E
Energia Potencial Total
E
b
Energia Potencial de Ligação
E
el
Energia Potencial Eletrostática
E
vdW
Energia de van der Waals (Potencial de Lennard-Jones)
E
φ
Energia Potencial Diedro Angular
E
θ
Energia Potencial Angular
E
ω
Energia Potencial Torcional Impróprio
F
i
Força no átomo i
fs
Femtosegundo
K
Kelvin
K
B
Constante de Boltzmann
Kcal
Quilocaloria (Termoquímica)
m
i
Massa do Átomo i
nm
Nanômetros
ns
Nanosegundo
P
el
Potencial Eletrostático
ps
Picosegundo
r
i
Vetor Posição
T
Temparatura
V
i
Velocidade
ΔE
Diferença de Energia Potencial
ε
Constante Dielétrica
ε
0
Permissividade Dielétrica no Vácuo
σ
Parâmetro de tensão superficial
Å
Angstron
µs
Microsegundos
XX
CÓDIGO EM UMA E TRÊS LETRAS PARA OS AMINOÁCIDOS
Ala
A
Alanina
Cys
C
Cisteína
Asp
D
Ácido Aspártico ou Aspartato
Glu
E
Ácido Glutâmico ou Glutamato
Phe
F
Fenilalanina
Gly
G
Glicina
His
H
Histitina
Ile
I
Isoleucina
Lys
K
Lisina
Leu
L
Leucina
Met
M
Metionina
Asn
N
Asparagina
Pro
P
Prolina
Gln
Q
Glutamina
Arg
R
Arginina
Ser
S
Serina
Thr
T
Treonina
Val
V
Valina
Trp
W
Triptofano
Tyr
Y
Tirosina
XXI
SUMÁRIO
1
Introdução
1
1.1
Possíveis Estruturas das Proteínas
1
1.1.1
Ligação Peptídica
1
1.1.2
Esqueleto Peptídico
2
1.1.2.1
Gráfico de Ramachandran
4
1.1.3
Conformação das Cadeias Laterais
5
1.2
Níveis de Organização Estrutural em Proteínas
7
1.2.1
Estrutura Primária - A Cadeia Polipeptídica
7
1.2.2
Estrutura Secundária - Hélice-alfa e Folha-beta
8
1.2.2.1
Hélice-alfa (α-hélice)
8
1.2.2.2
Folhas-beta (folhas-β)
9
1.2.2.3
Outras Estruturas
10
1.2.3
Estrutura Terciária - Junção das Estruturas Secundárias
11
1.2.3.1
Estabilidade da Estrutura Terciária
12
1.2.4
Estrutura Quaternária - Interações de Estruturas Terciárias
14
1.3
O Enovelamento das Proteínas
15
1.3.1
O Problema do Enovelamento Protéico
15
1.3.1.1
Enovelamento de Proteínas Segundo Christian Anfinsen
16
1.3.1.2
O Paradoxo de Cyrus Levinthal
18
1.3.1.3
O Funil do Enovelamento
19
1.4
Determinação da Estrutura Tridimensional
24
1.4.1
Predição in silico da Estrutura Tridimensional de Proteínas
25
1.4.1.1
Dinâmica Molecular (DM)
27
1.4.1.2
Métodos Estocásticos
28
2
Objetivos
31
3
Métodos Teóricos
32
3.1
Campo de Forças
32
3.1.1
Otimização da Geometria Molecular
36
3.2
Generalized Simulated Annealing (GSA)
37
3.2.1
Parâmetros do GSA
43
3.2.1.1
Sensibilidade do Algoritmo GSA aos Parâmetros q
A
, q
V
e q
T
44
3.3
Dinâmica Molecular (DM)
46
3.3.1
Condições e Parâmetros das Simulações por DM
48
3.4
"Cluster" de Computadores
49
XXII
3.4.1
Metodologia para a Montagem do Cluster
50
4
Resultados e Discussão
54
4.1
Modelo de Polialaninas
56
4.1.1
Análise Estatística
61
4.1.2
Conclusões Parciais dos Estudos com a 22-ala
62
4.1.3
Ancoramento Molecular utilizando o GSA
63
4.2
Mastoparano-X
66
4.2.1
Resultados do GSA para o MP-X
68
4.2.2
Resultados da Dinâmica Molecular para o MP-X
73
4.2.2.1
Estudo da Estabilidade do MP-X em Água
87
4.2.3
Conclusões Parciais para o MP-X
91
4.3
Trp-cage
95
4.3.1
Resultados do GSA para o Trp-cage
97
4.3.2
Resultados da Dinâmica Molecular para o Trp-cage
99
4.3.3
Conclusões Parciais para o Trp-cage
107
4.4
Villin Headpiece
109
4.4.1
Resultados do GSA para a HP-36
111
4.4.2
Resultados da Dinâmica Molecular para a HP-36
114
4.4.3
Conclusões Parciais para a HP-36
120
5
Conclusões e Perspectivas
122
6
Referências Bibliográficas
126
7
Andice
139
7.1
Apêndice A - Arquivos de entrada para simulação do GSA
139
7.2
Apêndice B - Parâmetros para a simulação de Dinâmica Molecular
152
8
Anexo
155
Introdução
1
1 Introdução
Quando observamos uma célula ao microscópio ou analisamos sua atividade
elétrica ou bioquímica, estamos observando, majoritariamente, proteínas. As
proteínas constituem a maior parte da massa celular seca. Não são meramente os
blocos que constroem as células, elas também executam praticamente todas as
funções celulares [NELSON, D. L. & COX, M. M. (2004)].
Do ponto de vista químico, as proteínas são, sem dúvida, as moléculas
estruturalmente mais complexas e, funcionalmente, as mais sofisticadas que
conhecemos. Isso talvez não seja surpreendente, uma vez que se compreenda que a
estrutura e a química de cada proteína foram desenvolvidas e ajustadas por
milhões de anos de história evolucionária [ALBERTS, B. et al. (2004)].
1.1 Possíveis Estruturas das Proteínas
Levando-se em conta que existem 20 diferentes aminoácidos na natureza que
podem ser combinados a fim de formar uma diversidade de proteínas, a predição de
estrutura se torna um problema de difícil solução. Além disso, cada proteína possui
uma estrutura tridimensional única, seguido de funções específicas. Por isso, para
tentar compreender melhor o problema, não se pode deixar de considerar algumas
características importantes reveladas pela geometria da cadeia destas
macromoléculas.
1.1.1 Ligação Peptídica
Os aminoácidos podem ligar-se entre si por uma ligação amida, que em
Bioquímica é denominada de ligação peptídica. A ligação ocorre entre o átomo de
carbono do grupo carboxilato de um aminoácido e o grupo amina do outro
aminoácido, como mostrado na Figura 1. Assim, uma cadeia polipeptídica, ou seja,
uma cadeia formada por diversos aminoácidos, ligados desta forma, teum grupo
amina livre numa extremidade (denominada N-terminal) e um grupo carboxilato
livre na extremidade oposta (denominada C-terminal). Essa cadeia polipeptídica
Introdução
2
sempre vai possuir um determinado sentido, porque seus componentes sempre
terão extremidades diferentes, isto é, os grupamentos amina (N-terminal) e
carboxilato (C-terminal). Convencionou-se escrever as cadeias peptídicas da
esquerda para a direita, partindo do N-terminal em direção ao C-terminal, pois é
esta a seqüência em que os ribossomos as sintetizam.
Como os aminoácidos perdem alguns átomos na formação da ligação
peptídica, é usual denominar estes de resíduos de aminoácidos (ou simplesmente
resíduos) desde o momento em que fazem parte de uma cadeia polipeptídica.
As proteínas são moléculas que podem ser formadas por milhares de
aminoácidos unidos por ligações peptídicas.
H
3
N
+
C
α
H
R
1
C
O
O
_
O
_
N C
α
H
R
2
C
O
+
H
H
H
H
3
N
+
C
α
H
R
1
C
O
O
_
N C
α
H
R
2
C
O
H
Ligação pepdica
Figura 1 Formação de um dipeptídeo a partir de dois aminoácidos com a perda de uma
molécula de água.
1.1.2 Esqueleto Peptídico
Pauling e Corey [PAULING, L. et al. (1951)] concluíram em seus estudos de
Cristalografia e Difração de Raios-X da estrutura precisa de peptídeos, que a ligação
peptídica possui uma restrição para girar livremente devido à existência de
ressonância entre os elétrons da ligação π da carbonila e o par de elétrons livres do
átomo de nitrogênio da amida (isso acontece por causa do arranjo assimétrico de
átomos com diferentes eletronegatividades, induzindo à formação de um momento
de dipolo), fazendo com que a ligação CN (ligação peptídica) tenha um caráter
parcial de dupla ligação (Figura 2). Esta característica restringe que haja rotação
Introdução
3
em torno da ligação CN, mantendo o oxigênio da carbonila 99,95% na forma trans
(oposta) em relação ao hidrogênio da amida [STEWART, D. E. et al. (1990)]. O
comprimento da ligação amida CN é de 1,32 Å [PAULING, L. et al. (1951)] e está entre
o de uma ligação simples CN (1,49 Å) e o de uma ligação dupla C=N (1,27 Å). Por
outro lado, a ligação entre o carbono alfa e o carbono do grupo carbonila e a ligação
entre o carbono alfa e o nitrogênio do grupo amida ambas possuem apenas
características de ligações simples.
Figura 2 Ressonância dos elétrons pi entre o oxigênio da carbonila e o nitrogênio da amida
dando o caráter de dupla-ligação à ligação peptídica [adaptada de NELSON, D. L. & COX, M. M. (2004)].
O ângulo de torção referente a ligação entre o carbono alfa e o carbono da
carbonila (C
α
−C’) é chamado de psi (ψ). O ângulo de torção referente a ligação entre
o carbono alfa e o nitrogênio do grupo amida (C
α
N) é chamado de phi (φ). O ângulo
de torção da ligação peptídica é denominado omega (ω) que, para manter o arranjo
planar, assume valores próximos de (cis) ou 180° (trans), mas nas proteínas
aparece este último, como visto na Figura 3.
R
2
R
1
ψ
φ
ω
Figura 3 Representação das ligações químicas com liberdade de rotações (NC
α
), (C
α
C) e
(CN) do esqueleto peptídico e seus respectivos ângulos de torção, φ, Ψ e ω respectivamente.
Pode-se pensar no esqueleto da cadeia peptídica como uma série de unidades
peptídicas planares encadeadas que podem girar em torno dos ângulos φ e ψ
(Figura 4a). Quando a cadeia está totalmente estendida, φ e ψ possuem valores
próximos de 180°. Quando φ e ψ são iguais a as duas ligações peptídicas que
rodeiam os carbonos alfa estão no mesmo plano (Figura 4b). Esta conformação é
proibitiva porque o oxigênio da carbonila de um plano está sobreposto com o
Introdução
4
hidrogênio do grupo amida do outro plano. Isso impõe restrições importantes no
número de conformações que uma proteína pode adotar.
A análise da rotação desses ângulos levou à identificação de regiões
permitidas, nas quais não choques entre os átomos, e regiões não-permitidas,
nas quais há choque entre os átomos.
Figura 4 (A) Representação de uma série de planos
sucessivos da unidade planar da ligação peptídica de um
esqueleto polipeptídico. (B) Quando as duas ligações
peptídicas que rodeiam um carbono alfa estão no mesmo
plano os ângulos φ e ψ são ambos definidos como 0°. Em
uma proteína esta conformação é dificultada pela
sobreposição estérica entre um oxigênio carbonila e um
átomo de hidrogênio α-amino [adaptada de NELSON, D. L. &
COX, M. M. (2004)].
1.1.2.1 Gráfico de Ramachandran
Durante a década de 60, o biofísico indiano, Gopalasamudram Narayana
Ramachandran, estudava com o uso de modelos de esferas rígidas, regiões de
valores para o par de ângulos psi (ψ) e phi (φ) que fossem estericamente permitidas
[RAMACHANDRAN, G. N. et al. (1963)]. Sabendo que a princípio os ângulos ψ e φ
podem ter valor entre 180° e +180°, Ramachandran demonstrou que muitos
valores de ψ e φ são proibidos devido a interferências estéricas entre átomos
vizinhos no esqueleto polipeptídico e entre cadeias laterais dos aminoácidos. Os
valores permitidos para ψ e φ podem ser demonstrados por um gráfico de
φ contra ψ conhecido como gráfico ou diagrama de Ramachandran (Figura 5).
Portanto, construindo-se um gráfico dos valores de ψ contra φ, de acordo
com Ramachandran, é possível identificar não as regi0ões das estruturas
(A)
(B)
Introdução
5
secundárias permitidas (hélice-alfa, folha-beta e hélice para a esquerda), mas
também as estruturas não permitidas.
Através do gráfico, observa-se que as regiões no interior das áreas
demarcadas no gráfico são regiões permitidas. Dessa forma, a região "restante" do
gráfico mostra a área proibitiva, que é bem maior que a permitida.
Os aminoácidos glicina e prolina apresentam um comportamento atípico no
diagrama de Ramachandran. A glicina pode exibir valores de ψ e φ em regiões
proibidas para os outros aminoácidos porque a sua cadeia lateral é muito pequena
(apenas um átomo de hidrogênio). A prolina pode adotar conformações em uma
região mais restrita do diagrama porque a sua cadeia lateral é ligada ao nitrogênio
da amida, assim, o ângulo φ fica restrito a valores em torno de 72°.
Figura 5 Devido às colisões estéricas entre os átomos de cada aminoácidos, muitos pares de
ângulos φ e Ψ não ocorrem. Neste gráfico, denominado Ramachandran, estão mostradas as regiões
teoricamente permitidas (hélice-α, folha-β e hélice para a esquerda) dos peptídeos, definidas pelos
valores de φ e Ψ. Portanto, em um gráfico dos valores de φ e Ψ é possível identificar não as regiões
das estruturas secundárias como também as estruturas não permitidas [adaptada de NELSON, D. L. &
COX, M. M. (2004)].
1.1.3 Conformação das Cadeias Laterais
,A fim de facilitar a identificação, cada átomo dos resíduos de aminoácidos é
nomeado, isso inclui os átomos da cadeia lateral. O carbono central do esqueleto
peptídico é denominado de carbono alfa. Um dos grupos ligados a ele é a cadeia
lateral. Os átomos de carbono da cadeia lateral, assim como o carbono alfa,
também são identificados. Eles são chamados de carbono β, γ, δ, ε, e ζ, de acordo
com a ordem de distância do carbono alfa. A Figura 6 mostra um esquema de como
Introdução
6
ficaria a ordem dos átomos de carbono de um resíduo de Lisina e Tirosina. No caso
do resíduo de lisina, por exemplo, o carbono alfa é o primeiro na parte inferior do
desenho, sendo seguido pelo carbono beta (β), carbono gama (γ), carbono delta (δ)
carbono epsilon (ε) e por último, o nitrogênio zeta (ζ).
C
alfa
C
gamma
C
delta
C
beta
C
epsilon
N
zeta
C
alfa
C
beta
C
gamma
C
epsilon 2
O
eta
Lisina Tirosina
Figura 6 Exemplos da nomenclatura dos átomos das cadeias laterais de dois aminoácidos:
Lisina e Tirosina. Os átomos de hidrogênio foram omitidos para melhor visualização.
Assim como o esqueleto peptídico, as cadeias laterais possuem ligações com
liberdade de rotação. No caso das cadeias laterais, os ângulos de torção são
chamados de chi 1(χ
1
), chi 2 (χ
2
), chi 3 (χ
3
), etc, como exemplificado para a
arginina na Figura 7. Cada resíduo possui cadeias laterais diferentes e, com isso, a
quantidade de graus de liberdade também será diferente. Por exemplo, a cadeia
lateral de uma arginina tem o número de ângulos de torção diferente do resíduo
Tirosina; e os aminoácidos glicina e alanina não têm nenhum ângulo de torção
relevante [LESK, A. M. (2001)].
N
C
O
C
α
C
β
C
γ
C
δ
N
ε
C
ζ
N
η
1
N
η
2
φ
ψ
χ
4
χ
1
χ
2
χ
3
Figura 7 Representação dos ângulos de torção da Arginina [adaptado de LESK, A. M. (2001)].
Introdução
7
1.2 Níveis de Organização Estrutural em Proteínas
O pesquisador dinamarquês K. Linderstrøm-Lang defendeu, com grande
perspicácia, que de forma semelhante às demais moléculas poliméricas, as
proteínas deveriam ser descritas em termos de níveis de organização. Para ele havia
pelo menos quatro níveis de organização estrutural presente na estrutura protéica.
Na hierarquia da estrutura das proteínas [LINDERSTRØM-LANG, K. (1952);
LINDERSTRØM-LANG, K. & SCHELLMAN, J. A. (1959)] cada nível foi caracterizado por
um tipo específico de organização de forças e os níveis de organização mais elevados
foram compostos por elementos descritos pelo nível anterior. As definições de
hierarquia estrutural, tal como proposto por Linderstrøm-Lang, são as seguintes:
1.2.1 Estrutura Primária - A Cadeia Polipeptídica
A estrutura primária das proteínas é dada pela seqüência linear dos
aminoácidos que constituem sua cadeia polipeptídica (Figura 8).
Como dito antes, estes aminoácidos são numerados a partir do resíduo N-
terminal, o que reflete a forma como os polipeptídios são sintetizados na célula
(igualmente a partir do N-terminal).
Figura 8 Esquema da estrutura primária da Ribonuclease A Pancreática Bovina. Os 124
resíduos de aminoácidos estão representados na forma de bolinhas e na forma de bastões amarelos
estão representadas as ligações dissulfeto (S-S) ente os resíduos Cys26:Cys84, Cys40:Cys95,
Cys58:Cys110, Cys65:Cys72 [adaptada de NELSON, D. L. & COX, M. M. (2004)].
A estrutura primária é o nível estrutural mais simples e mais importante,
que dele deriva todo o arranjo espacial da molécula. Cada proteína tem sua
seqüência de aminoácidos específica.
Introdução
8
1.2.2 Estrutura Secundária - Hélice-alfa e Folha-beta
Pauling e Corey, em 1951 [PAULING, L. & COREY, R. B. (1951)], fizeram um
estudo com base na natureza planar das ligações peptídicas e nas estruturas dos
peptídeos, em que mantinham os valores das distâncias das ligações e dos ângulos.
Observando as estruturas dos peptídeos próximos, avaliaram várias possíveis
conformações de uma estrutura primária, construindo, assim, modelos moleculares
precisos. Através destes modelos, eles propuseram a estrutura secundária das
proteínas. Sugeriram duas estruturas secundárias periódicas nos polipeptídios: a
hélice-alfa e a folha beta pregueada (folha-beta).
1.2.2.1 Hélice-alfa (α-hélice)
A hélice-alfa é uma estrutura em forma de bastão. Nesta estrutura, o
esqueleto polipeptídico (cadeia principal) é fortemente retorcido em torno de um
eixo imaginário longitudinal que passa pelo centro da hélice, com as cadeias
laterais dos aminoácidos projetando-se para fora, em um arranjo helicoidal
(Figura 9).
Em uma conformação helicoidal, os ângulos phi (φ) e psi (Ψ) variam em torno
de um valor ideal (para a hélice-alfa ideal estes valores são φ = -57,8° e Ψ = -47,0°).
Essa faixa de valores localiza-se no quadrante inferior esquerdo do gráfico de
Ramachandran. Uma volta simples da hélice (passo) possui o comprimento de
5,4 Å, que compreende a 3,6 resíduos de aminoácidos, como mostrado na Figura 9.
As hélices são as formas mais abundantes de estrutura secundária, contendo
aproximadamente 32-38% dos resíduos em uma proteína globular [KABSCH, W. &
SANDER, C. (1983); CREIGHTON, T. E. (1993)]. Essa abundância, possivelmente é
devida a estabilização por interações locais, isto é, por ligações hidrogênio entre os
grupos carbonia (C=O) e grupos amida (N-H) (do esqueleto peptídico) de resíduos
relativamente próximos na seqüência. Em estruturas de lice, todos os grupos
C=O e amida N-H da cadeia principal do peptídeo são ligados por ligações
hidrogênio, exceto pelo primeiro grupo N-H e pelo último C=O nas extremidades da
hélice. O oxigênio da carbonila de cada aminoácido (n) forma uma ligação
hidrogênio com o hidrogênio da amida de outro aminoácido que está situado a
quatro unidades adiante na seqüência linear (n+4), como mostrado na Figura 9.
Assim, todos os grupamentos N-H e C=O da cadeia principal formam ligações
hidrogênio paralelas ao eixo imaginário.
Introdução
9
Figura 9 Representação gráfica da hélice-alfa. Cada volta simples da hélice (passo) possui o
comprimento de 5,4 Å (3,6 resíduos de aminoácidos). As linhas tracejadas representam as ligações
hidrogênio entre o oxigênio da carbonila de cada aminoácido (n) e o hidrogênio da amida de outro
aminoácido que está situado a quatro unidades adiante na seqüência linear (n+4) [adaptada de
NELSON, D. L. & COX, M. M. (2004)].
O sentido do giro de uma hélice-alfa pode ser para a direita (hélice dextrorsa)
ou para a esquerda (hélice sinistrorsa). As hélices-alfa encontradas nas proteínas
são dextrorsas porque as restrições estéricas favorecem esse arranjo, que os
aminoácidos encontrados nas proteínas (exceto a glicina) são L-aminoácidos.
1.2.2.2 Folhas-beta (folhas-β)
Pauling e Corey, também predisseram outro tema estrutural periódico, a fita-
beta. Assim como as estruturas de hélice-alfa, a folha-beta foi confirmada por
estudos de Difração de Raios-X. A conformação de fita-beta é muito diferente da
conformação da hélice-alfa. Na estrutura da fita-beta, a cadeia polipeptídica é quase
totalmente distendida em vez de fortemente retorcida como na hélice-alfa. Além
disso, a fita-beta pode gerar um arranjo em folha-beta bidimensional e envolver
uma ou mais cadeias polipeptídicas.
Na conformação de folha-beta, a cadeia polipeptídica estende-se em uma
estrutura em ziguezague ao invés de helicoidal, como visto na Figura 10. Essas
cadeias podem ser dispostas lado a lado, para formar uma estrutura que se
assemelha a uma série de pregas.
A folha-beta é estabilizada por ligações hidrogênio entre grupamentos N-H e
Introdução
10
C=O em segmentos diferentes da cadeia polipeptídica, ao passo que, na hélice-alfa,
as ligações hidrogênio entre grupamentos N-H e C=O estão no mesmo segmento da
cadeia polipeptídica. Os segmentos individuais que formam uma folha-beta,
geralmente, estão próximos entre si na cadeia, mas podem também estar bem
distantes uns dos outros na seqüência linear do polipeptídio; podem até mesmo
serem segmentos em cadeias polipeptídicas distintas.
Cadeias adjacentes em uma folha-beta podem se estender no mesmo sentido
(folha-beta paralela) ou em sentidos opostos (folha-beta antiparalela), como
mostrado na Figura 10.
Nas fitas-beta os ângulos φ e Ψ estão quase que totalmente em sua forma
mais aberta (ângulos próximos de 180° - região estruturalmente permitida) o que
coloca os aminoácidos no quadrante superior esquerdo do gráfico de
Ramachandran.
A B
Figura 10 Representação gráfica da folha-beta. As linhas tracejadas representam as ligações
hidrogênio. (A) Representação de folha-beta formada por fitas paralelas. (B) Representação da folha-
beta formada por fitas antiparalela. Note que as disposições das ligações hidrogênio são diferentes
entre as folhas-beta paralela e antiparalela [adaptada de NELSON, D. L. & COX, M. M. (2004)].
1.2.2.3 Outras Estruturas
Além das estruturas secundárias regulares (hélice-alfa e folha-beta) existem
estruturas secundárias irregulares denominadas curvas ou dobras (bend), voltas
(turn).
As curvas e as voltas são encontradas, geralmente, após uma estrutura
secundária regular (hélice-alfa ou folha-beta). Ou seja, as curvas e as voltas são
estruturas secundárias irregulares que unem sucessivas estruturas secundárias
regulares.
Além disso, na superfície das proteínas encontram-se, freqüentemente,
estruturas irregulares denominadas alças [BRANDEN, C. & TOOZE, J. (1991)]. Essas
regiões contêm, normalmente, aminoácidos polares e carregados, que são capazes
de interagir e formar ligações hidrogênio com o solvente ou com os ligantes, no caso
Introdução
11
de sítios ativos de enzimas ou receptores.
Sabe-se que a estrutura em hélice é favorecida pela presença de resíduos de
metionina, alalina, leucina, ácido glutâmico, glutamina e lisinas. A estrutura em
folha-beta é favorecida pela presença de resíduos de treonina, isoleucina, valina,
fenilalanina, tirosina e triptofano. Os resíduos de glicina, serina, prolina,
asparagina e ácido aspártico predominam em regiões sem estrutura regular
definida. Enquanto que resíduos de cisteína, histidina e arginina não possuem
preferências [KABSCH, W. & SANDER, C. (1983)].
1.2.3 Estrutura Terciária - Junção das Estruturas
Secundárias
O arranjo tridimensional de todos os átomos de uma cadeia polipeptídica é
denominado estrutura terciária.
Na estrutura terciária, a cadeia de uma determinada proteína tem a
tendência de enovelar-se, formando uma estrutura complexa tridimensional, que
seria um arranjo espacial das estruturas secundárias (Figura 11).
Normalmente, as cadeias polipeptídicas são mantidas em sua organização
terciária devido às interações fracas entre resíduos de aminoácidos relativamente
distantes na seqüência peptídica e ao efeito hidrofóbico. Ou seja, a estabilização
desta estrutura é atribuída às diferentes propriedades físico-químicas das cadeias
laterais dos aminoácidos.
Figura 11 Estrutura terciária da Ribonuclease A Pancreática Bovina (RNase A, código
PDB: 7RSA).
Introdução
12
1.2.3.1 Estabilidade da Estrutura Terciária
A estabilidade da estrutura terciária advém, principalmente, das ligações
dissulfeto entre resíduos de cisteína ao longo da cadeia polipeptídica, e de
interações fracas (não covalentes) entre várias partes da cadeia polipeptídica, em
função da disposição e orientação dos grupos funcionais das cadeias laterais.
As ligações fracas são do tipo: ligações hidrogênio, forças de van der Waals,
contatos hidrofóbicos e as interações eletrostáticas (iônicas). É válido lembrar que
estas interações são aproximadamente 100 vezes mais fracas do que as ligações
covalentes. No entanto, um grande número de tais ligações fracas pode estabilizar a
estrutura terciária. Em geral, a conformação com o maior número dessas interações
fracas é a conformação de menor energia livre [PETSKO, G. A. & RINGE, D. (2004)].
A estabilidade da estrutura terciária não envolve apenas a soma das energias
de interações fracas intramoleculares, mas também da sua interação com as
moléculas de água e das interações entre moléculas de água entre si. Em outras
palavras, a estabilidade estrutural das proteínas depende de contribuições
entálpicas e entrópicas, intramoleculares na macromolécula, intermoleculares desta
com o solvente, e intermoleculares solvente-solvente.
Uma cadeia polipeptídica no estado desnaturado pode assumir um número
de conformações muito grande e isso lhe garante uma entropia conformacional
muito alta [TANFORD, C. (1962); NOZAKI, Y. & TANFORD C. (1963)]. Sabendo disso,
surge a pergunta: porque o estado desnaturado não predomina sobre o estado
nativo das proteínas? A resposta para esta pergunta vem da interação da cadeia
polipeptídica com as moléculas de água.
Em meio aquoso, as conformações desenoveladas e enoveladas estão
rodeadas por moléculas de água, organizadas em camadas de solvatação ao redor
da cadeia polipeptídica (Figura 12). Quanto maior a camada de solvatação, maior
será o número de interações da cadeia com a água (ligações hidrogênio), tendo
como resultado uma maior quantidade de energia livre envolvida na solvatação. A
conformação desenovelada, então, requer uma maior energia livre envolvida com a
solvatação, que tem uma maior área de superfície acessível às moléculas de
água, se comparada com a conformação enovelada.
Introdução
13
Figura 12 Representação esquemática da solvatação de uma proteína. As moléculas de água
são representadas pelas esferas azuis e a proteína pelas estruturas retangulares. Em (A) está
representada a solvatação da estrutura desenovelada, e em (B) está representada a solvatação da
estrutura enovelada. No estado desenovelado (A), por ter uma maior área acessível ao solvente, a
cadeia polipeptídica tem um maior número de moléculas de água ao seu redor, formando a camada de
hidratação. a estrutura enovelada, por ter uma menor área acessível ao solvente, tem um menor
número de moléculas de água formando a camada de hidratação [adaptado de GRUEBELE, M. (1999)].
Embora o estado desenovelado apresente uma entropia conformacional maior
do que o estado enovelado, ele precisa de uma quantidade de energia livre de
solvatação mais elevada do que o estado enovelado.
Em solução aquosa, a alta energia livre necessária para a solvatação do
estado desenovelado não é compensada pela sua entropia conformacional.
Apesar da conformação nativa apresentar uma entropia conformacional mais
baixa do que a conformação desenovelada, a energia livre de solvatação também é
mais baixa e facilmente obtida pelo efeito hidrofóbico, que compele os grupos
apolares da cadeia polipeptídica a ficarem juntos no interior da estrutura, formando
o chamado "núcleo hidrofóbico", com baixa entropia conformacional [GRUEBELE, M.
(1999)]. Dessa forma, a baixa entropia conformacional do estado enovelado é
compensada pela energia livre de enovelamento da proteína, que também atende à
demanda de energia envolvida na formação de sua camada de solvatação.
Portanto, é a formação do núcleo hidrofóbico que ajuda a formação das
interações fracas (interações intramoleculares) e, conseqüentemente, a estabilização
do estado enovelado (Figura 13). É lido lembrar que a formação do núcleo
hidrofóbico faz a entropia na solução aquosa aumentar e isto supera a grande
perda entrópica que a cadeia polipeptídica tem ao assumir a conformação nativa.
Introdução
14
Figura 13 A estrutura nativa das proteínas é mantida por um delicado balanço de forças. A
energia livre negativa do enovelamento é resultado do balanço entre o efeito hidrofóbico (entropia do
solvente), as interações intramoleculares (entalpia conformacional) e a entropia conformacional. Onde
o efeito hidrofóbico e as interações intramoleculares favorecem o enovelamento, a entropia da
conformação desfavorece. O resultado de todos esses componentes é uma energia livre negativa entre -
5 e -20 kcal/mol [adaptado de Biochemistry, 3rd Edition, Mathews, Van Holde, Ahern].
1.2.4 Estrutura Quaternária - Interações de Estruturas
Terciárias
A estrutura quaternária corresponde ao resultante de interações entre
unidades polipeptídicas isoladas de uma proteína (estruturas terciárias) contendo
mais de uma subunidade, formando uma estrutura super protéica. A maioria das
proteínas, particularmente as com massas moleculares maiores que 100 kDa, é
constituída por mais de uma cadeia polipeptídica. As subunidades polipeptídicas
associam-se com uma geometria específica. O arranjo espacial dessas subunidades
é conhecido como estrutura quaternária da proteína [BRANDEN, C. & TOOZE, J.
(1991)] (Figura15).
Introdução
15
Figura 14 Estrutura quaternária do tetrâmero da Catalase Humana (cód. PDB: 1DFG).
1.3 O Enovelamento das Proteínas
Um dos principais paradigmas da Biologia Molecular Estrutural traz a idéia
de que a estrutura tridimensional de uma proteína, ou estrutura nativa, está
diretamente relacionada à sua função biológica [DILL, A. K. et al. (1995); ONUCHIC,
J. N. (1997); BROOKS III, C. L. et al. (1998); KLIMOV, D. K. & THIRUMALAI D. (1996);
FETROW, J. S. & SKOLNICK, J. (1998)]. Como a vida depende diretamente da
existência e do funcionamento correto das proteínas, é importante que se
compreenda como as seqüências primárias das proteínas se reorientam para formar
as estruturas terciárias (estrutura tridimensional nativa), num processo que
envolve o enovelamento (folding, em ingês) da cadeia polipeptídica.
Este dogma despertou a atenção de bioquímicos e especialistas em genética
no início da metade do séc. XX. Hoje em dia, ele é um problema totalmente
interdisciplinar, que requer a utilização de ferramentas desenvolvidas em
disciplinas como: química, biologia celular, biofísica, fisiologia, medicina e física.
Nos últimos anos, além de todas essas disciplinas, a ciência da computação tem
contribuído significativamente para a compreensão do problema do enovelamento
protéico.
1.3.1 O Problema do Enovelamento Protéico
De acordo com a biologia estrutural, por exemplo, para conhecer a causa de
uma doença genética, após ter sido localizado o gene responsável, é essencial
conhecer a estrutura da proteína codificada por ele, que o conhecimento da
Introdução
16
estrutura tridimensional da proteína é um pré-requisito para a compreensão de sua
função. Isto torna o enovelamento de proteínas um problema central para o rápido
progresso da biologia pós-genômica.
O problema do enovelamento consiste em predizer a conformação nativa das
proteínas (conformação de menor energia livre) fornecendo somente a sua
seqüência de aminoácidos (estrutura primária) [DILL, A. K. et al. (1995); SOCCI, N. D.
& ONUCHIC, J.N. (1994); MUÑOZ, V. & EATON, W. A. (1999); BROOKS III, C. L. et al.
(1998); GRUEBELE, M. (1999)].
Então, a questão é descobrir como a informação contida na seqüência de
aminoácidos, bem como as condições fisiológicas adequadas, determinam a única
conformação final das proteínas.
1.3.1.1 Enovelamento de Proteínas Segundo Christian
Anfinsen
Durante a década de 1950, Christian Anfinsen (bioquímico americano
nascido na Noruega) procurava responder a três questões fundamentais sobre o
enovelamento das proteínas.
A pesquisa que conduziu e que trouxe as respostas para estas perguntas
rendeu ao Anfinsen o Prêmio Nobel de Química em 1972 [ANFINSEN, C. B. (1972)]. A
experiência consistia nas seguintes etapas [ANFINSEN, C. B. (1961)]:
1. Num tubo de ensaio, adicionou-se uréia em solução com a enzima
Ribonuclease A. A uréia é um potente agente desnaturante que promove a
desestruturação da estrutura nativa das proteínas;
2. Após a desnaturação da proteína, o que se manifestou pela perda total de
atividade biológica, retirou-se a uréia de modo a restaurar o ambiente
químico para condições intracelulares normais;
3. Observou-se, então, o re-enovelamento espontâneo da proteína
acompanhado pela recuperação total de sua atividade enzimática.
A termodinâmica é um processo espontâneo que é acompanhado pela
liberação de energia livre, muitas vezes, mas nem sempre, sob a forma de calor,
Introdução
17
passando a ocupar um estado de menor energia e, portanto mais estável. Sabendo
disto, Anfinsen concluiu à partir de seus resultados de re-enovelamento
espontâneo, que o estado nativo da proteína é o estado termodinamicamente mais
estável, ou seja, o estado de mais baixa energia [HONIG, B. (1999)]. Assim, Anfinsen
conseguiu responder as duas primeiras perguntas.
A proteína se enovela para a estrutura nativa porque é a forma que
corresponde ao estado termodinâmico mais estável (de menor energia livre); e é pelo
fato da proteína encontrar espontaneamente o estado mais estável que nos faz
concluir que nenhuma outra molécula seja capaz de intervir nesta "busca".
Portanto, esta é a hipótese termodinâmica do enovelamento protéico [HONIG, B.
(1999)].
De acordo com essa hipótese sugerida por Christian Anfinsen, toda a
informação necessária para encontrar o estado nativo está contida na seqüência de
aminoácidos que constitui a estrutura primária da proteína (Figura 15).
KGWAAAKFERQHMDSSWSAAS
SSBWCBQNNKSRNLWKDRCKP
VNWFVHESLADVQAVCSQKNV
ACKNGQKNCNQSWSWMSIWDC
REWGSSKWPNCAWKWWQANK
HIIVACEGNPWVPVHFDASV
?
Figura 15 A seqüência primária das proteínas determina a sua estrutura tridimensional.
Anfinsen concluiu que é a cooperação do conjunto de interações fracas entre
os aminoácidos (ligações hidrogênio, interações eletrostática, contatos hidrofóbicos,
forças de van der Waals) que constituem a estrutura primária que determina a
estrutura nativa das proteínas.
A terceira e última pergunta de Anfinsen torna-se fácil de responder. O
estado nativo de cada proteína é único porque é determinado por uma seqüência
única de aminoácidos.
Introdução
18
A partir dos resultados de Anfinsen podemos concluir que o processo de
enovelamento protéico é espontâneo e que apenas uma estrutura nativa é
encontrada para cada cadeia polipeptídica.
Portanto, foi a partir dos resultados de Anfinsen que surgiu a pergunta para
o fenômeno que até hoje é problema para as ciências atuais:
De acordo com Anfinsen, a estrutura tridimensional nativa das proteínas é
determinada apenas pelas interações fracas entre os aminoácidos que constituem a
estrutura primária das proteínas. Mas será que o fenômeno do enovelamento
protéico pode ser explicado com apenas essa hipótese?
1.3.1.2 O Paradoxo de Cyrus Levinthal
Em 1968, Cyrus Levinthal, físico e professor de Ciências Biológicas da
Universidade da Columbia, mostrou que a hipótese de Anfinsen não resolvia todas
as questões do enovelamento protéico [LEVINTHAL, C. (1968)].
Levinthal levantou a hipótese de que o processo do enovelamento das
proteínas ocorre de forma direcionada. O argumento era simples e eficaz se
supuséssemos uma pequena proteína com 100 aminoácidos, e que cada
aminoácido pudesse assumir, pelo menos, uma das três diferentes conformações
energeticamente favoráveis no gráfico de Ramachandran (hélice-alfa, hélice para
esquerda e fita-beta). Nestas condições, a proteína teria acesso a um total de
3
100
conformações, total este que inclui obviamente a estrutura nativa. Com isso, se
a proteína visitasse cada conformação possível para cada aminoácido durante o
processo de enovelamento e fosse atribuído 1 picossegundo (tempo de uma vibração
térmica) para cada transição entre os estados de conformação, o tempo necessário
para explorar exaustivamente todo o espaço conformacional e encontrar a
conformação correspondente ao estado nativo (apenas um) seria de
3
100
picossegundos (ps), ou seja, 1,63 x 10
28
anos, no mínimo. Esse tempo é muito
maior do que a idade do universo, que é de aproximadamente 1,37 x 10
10
anos.
Portanto, o tempo necessário para uma proteína explorar todas as
conformações possíveis é completamente absurdo, pois várias proteínas se
enovelam em poucos milissegundos [LEVINTHAL, C. (1968)]. Com isso, Levinthal
conclui que somente a hipótese de Anfinsen não seria suficiente para explicar o
Introdução
19
processo de enovelamento protéico, já que ela não explicava a escala de tempo do
fenômeno. E assim, surgia o paradoxo de Levinthal [LEVINTHAL, C. (1968)].
Para resolver esse problema, o próprio Levinthal (1968) [LEVINTHAL, C. (1968)]
propôs uma solução para o paradoxo. Ele teorizou que, ao contrario de uma busca
exaustiva de todas as conformações, a proteína percorreria um "caminho" de
enovelamento específico (folding pathway), composto por vários intermediários, que,
ao final do caminho, chegaria ao estado nativo. No entanto, ao contrário da hipótese
de Anfinsen, o estado nativo não corresponde necessariamente ao mínimo global de
energia (estado termodinamicamente mais estável), mas sim ao estado mais
acessível do ponto de vista cinético.
A o início da década de 1990, as pesquisas sobre enovelamento de
proteínas eram, em grande parte, voltadas à procura de intermediários
suficientemente estáveis que pudessem ser isolados e estudados experimentalmente
[ONUCHIC, J. N. (1997); ENGLANDER, S. W. & MAYNE, L. (1992); KIM, P. S. &
BALDWIN, R. L. (1990); BRYNGELSON, J. D. & WOLYNES, P. G. (1987)]. Entretanto,
ainda no início da década de 1990, foi estudada uma pequena proteína de
enovelamento rápido que não possuía intermediários estáveis [SKOURTIS, S. S. &
ONUCHIC, J. N. (1993)]. Com essas informações, pôde-se verificar que nem a hipótese
sugerida por Levinthal e nem a de Anfinsen eram suficientes para solucionar o
problema do enovelamento de proteínas. Com isso, nesta mesma década, surge
uma nova teoria, denominada unificada, que reconcilia tanto as perspectivas de
Anfinsen quanto as de Levinthal, baseada na natureza estatística do processo
[WOLYNES, P. G. et al. (1995); DILL, K. A. & CHAN, H. S. (1997)].
1.3.1.3 O Funil do Enovelamento
A teoria unificada se baseia nas características da hipersuperfície de energia
de uma cadeia polipeptídica, que apresenta centenas ou milhares de graus de
liberdade (Figura 16). Esta hipersuperfície é representada pela variação de energia
livre, devido às interações entre os resíduos de aminoácidos. Os vales (zonas de
mais baixa energia) encontram-se separados uns dos outros por barreiras de
energia. A hipersuperfície é uma função de energia potencial complexa e
multidimensional [HONIG, B. (1999)].
Introdução
20
Figura 16 Representação esquemática tridimensional da hipersuperfície de energia potencial
de uma dada molécula. O eixo vertical representa a energia, e os outros dois representam os ângulos
de torção, ou seja, a mudança conformacional. A sucessão de picos (pontos de máxima energia da
molécula) e poços (pontos de energia baixa) revelam as barreiras de energia decorrentes das variações
entre os diferentes estados da molécula [adaptada de NÖLTING, B. (1999)].
Se esta superfície tender a ser plana, com muitos mínimos locais
equivalentes, a cadeia polipeptídica pode ficar em busca de seu estado nativo
indefinidamente. No entanto, se a superfície for muito acidentada, a cadeia pode
encontrar muitas barreiras de energia intransponíveis à temperatura fisiológica.
Uma teoria do enovelamento de proteínas evoluiu durante os últimos anos,
tanto experimentalmente quanto teoricamente, através de simulações
computacionais, sendo ilustrada pelo conceito de um funil de enovelamento,
introduzido por Wolynes, Onuchic e colaboradores [WOLYNES, P. G. et al. (1995)].
O modelo do funil (folding funnels) de enovelamento é um dos modelos mais
bem aceitos pela comunidade científica [ONUCHIC, J. N. et al. (2000)]. Nele, a
superfície de energia de uma proteína pode ser vista como um "funil" de energia
livre (protein folding energy landscape) (Figura 17), em que a largura do topo do
funil corresponde ao conjunto de todas as conformações desenoveladas acessíveis
no início do enovelamento. Estas conformações são caracterizadas por uma alta
entropia conformacional, pois, em teoria, ela pode assumir uma grande variedade
de conformações devido ao elevado número de graus de liberdade de rotação em
torno das ligações químicas com liberdade de torção.
Introdução
21
Energia
Livre
Entropia
Δ
E
Mínimo local
Mínimo Global
Figura 17 A hipersuperfície de enovelamento teria a forma de um funil. A largura (eixo
horizontal) do funil representa a entropia da cadeia. A energia livre está representada pela
profundidade do funil (eixo vertical). A rugosidade revela os mínimos locais de energia, onde
geralmente ficam presas as conformações do estado de Molten Globule, ou estruturas intermediárias. A
estrutura nativa encontra-se no final do funil, no mínimo global de energia livre [adaptada de
ONUCHIC, J. N (2000)].
É possível alcançar a conformação nativa partindo de qualquer uma das
conformações iniciais (menos estáveis), percorrendo um dos muitos caminhos
alternativos. Cada um desses caminhos corresponde a um conjunto de
conformações diferentes, pelas quais a cadeia polipeptídica passa até chegar à
conformação nativa (Figura 18) [ONUCHIC, J. N. et al. (2000); BROOKS III, C. L. et al.
(1998)].
Introdução
22
Figura 18 Funil de enovelamento de uma proteína real evidenciando cinco caminhos de
enovelamento alternativos [adaptada de TUNNICLIFFE, R. B. et al. (2005)].
Na medida em que o enovelamento progride, o funil vai se estreitando e a
energia das conformações vai diminuindo até encontrar a conformação de menor
energia (conformação nativa ou a um pequeno conjunto delas).
Mas, não a energia das conformações e a entropia vão diminuindo, como
também os próprios números de conformações acessíveis diminuem até chegar a
apenas uma, a conformação nativa (Figura 19) [ONUCHIC, J. N. (2000) et al.;
BROOKS III, C. L. et al. (1998)]. Na realidade, a partir de certo ponto, todas as
trajetórias se juntam num único caminho de enovelamento, no qual a conformação
nativa é finalmente atingida [SOCCI, N. D. et al. (1996)].
Introdução
23
Figura 19 Diagrama esquemático da conformação de uma proteína em relação a sua
semelhança com a estrutura nativa. No eixo vertical está representada a coordenada de enovelamento.
A estrutura nativa es representada no topo do esquema. As conformações que mais se assemelham
com a ela são as que estão mais próximas (mais próxima do topo). À medida que se afasta da
estrutura nativa há o aumento do número de conformações. Os caminhos de enovelamento vão
diminuindo na medida em que as conformações vão se enovelando [adaptada de BRYNGELSON, J. D.
et al. (1994)].
As bases da teoria da hipersuperfície de energia livre e o conceito do funil de
enovelamento conduziram às "novas perspectivas do enovelamento de proteínas"
[PANDE, V. et al. (1998)]. Estas novas perspectivas reconciliam o ponto de vista de
Anfinsen e o de Levinthal. O estado nativo pode ser o estado termodinamicamente
mais estável (o mínimo global da hipersuperfície de energia), e a procura da
conformação nativa não é aleatória, uma vez que existem vários caminhos de
enovelamento possíveis [PANDE, V. et al. (1998)].
Durante os últimos dez anos essas idéias "neoclássicas" revolucionaram a
nossa maneira de pensar no mecanismo do enovelamento. Atualmente, a hipótese
de que a conformação nativa da maioria das proteínas encontra-se sob controle
termodinâmico é amplamente aceita. Ou seja, das numerosas conformações que,
teoricamente, uma proteína pode assumir, uma ou poucas predominam sobre
condições biológicas e essas conformações predominantes são aquelas
termodinamicamente mais estáveis, apresentado a menor energia livre [AGOSTINI, F.
P. et al. (2008)].
Introdução
24
1.4 Determinação da Estrutura Tridimensional
Com o sucesso do seqüenciamento do genoma, um grande volume de genes
são conhecidos e a taxa de novas seqüências de proteínas cresce exponencialmente
em relação à taxa de estruturas de proteínas que são resolvidas por métodos
experimentais [GIBAS, C. & JAMBECK, P. (2001)]. Atualmente, são conhecidas mais de
106.000.000 seqüências primárias de proteínas (http://www.ncbi.nlm.nih.gov/
Genbank/genbankstats.html, atualizado no dia 26 de agosto de 2009). No entanto,
as informações estruturais sobre essas seqüências não acompanharam esse
progresso, pois, apenas cerca de 56.000 das seqüências têm sua estrutura
tridimensional determinada, principalmente, pelos métodos de Cristalografia e
Difração de Raios-X ou Ressonância Magnética Nuclear (RMN)
(http://www.rcsb.org/pdb/statistics/holdings.do, atualizado no dia 26 de agosto de
2009). As informações estruturais podem ser coletadas na base de dados do Protein
Data Bank (PDB), acessível em www.pdb.org.
Atualmente, o único modo para determinar a estrutura terciária das
proteínas é por técnicas experimentais. A Cristalografia e Difração de Raios-X e a
Ressonância Magnética Nuclear (NMR) são os métodos tradicionais para se
determinar a estrutura terciária das proteínas. Porém, essas técnicas possuem
algumas limitações que tornam lenta a sua determinação estrutural.
1. A Cristalografia é uma técnica muito cara e demorada
[SHMYGELSKA, A. & HOOS, H. H. (2005)], pois o grande desafio é obter
um cristal da proteína alvo, o que nem sempre é possível. Muitas
estruturas protéicas simplesmente não são acessíveis à cristalização
[GIBAS, C. & JAMBECK, P. (2002)];
2. A Ressonância Magnética Nuclear (RMN) [RUMBLEY, J. (2001);
BHUYAN, A. K. & UDGAONKAR, J. B. (1999)] possui a vantagem de que os
experimentos podem ser realizados em solução. Ainda assim, os
princípios que tornam esta técnica possível limitam sua aplicação a
moléculas de pequeno a médio porte. Além de ser uma técnica,
também, considerada cara.
Foram essas limitações dos métodos experimentais que motivaram cientistas
da computação, biólogos, físicos, químicos e matemáticos a trabalharem no
desenvolvimento de novas ferramentas computacionais, que além de dar suporte
Introdução
25
aos métodos experimentais podem predizer de forma correta a estrutura
tridimensional das proteínas e, assim, processar a grande quantidade de
informação depositada nos bancos de dados.
Outra motivação para o desenvolvimento destas metodologias foi a de
possibilitar o melhor entendimento do processo físico do enovelamento. Segundo
Pande [PANDE, V. et al. (1998)], a natureza dos caminhos de enovelamento pode, em
princípio, ser completamente compreendia por simulações computacionais (também
chamadas de experimentos in silico), nas quais todos os detalhes atômicos são
acessíveis. Na simulação computacional um dos resultados extraídos é a trajetória
de enovelamento, de onde podemos fazer vários tipos de análises. Isto se torna uma
grande vantagem sobre os estudos experimentais.
1.4.1 Predição in silico da Estrutura Tridimensional de
Proteínas
Um dos maiores desafios da Biologia Molecular Computacional é a predição
da estrutura tridimensional de proteínas. Sendo, o principal problema a
compreensão de como a informação codificada na seqüência linear dos aminoácidos
conduz a uma determinada estrutura tridimensional.
Nos últimos anos, o CASP (Critical Assessment of Techniques for Protein
Structure Prediction) tem monitorado o estado da arte em relação à predição da
estrutura de proteínas a partir de sua seqüência de aminoácidos. O CASP é uma
competição, que reúne vários grupos de pesquisa que estudam o desenvolvimento
de métodos para a predição das estruturas [SCHONBRUN, J et al. (2002)]. O objetivo
da competição é a avaliação dos métodos desenvolvidos.
Devido ao CASP, várias metodologias computacionais foram desenvolvidas
nos últimos anos com o intuito de ajudar a solucionar este complexo problema
[TRAMONTANO, A. & LESK, A. M. (2006); OSGUTHORPE, D. J. (2000)]. O CASP divide a
competição em três áreas:
1- Modelagem comparativa por homologia;
2- Métodos de Threading (baseados em reconhecimento de enovelamento);
3- Predição Ab initio (ou também chamada de predição por primeiros
princípios).
A técnica da modelagem comparativa por homologia baseia-se no
conhecimento de que a conformação estrutural de uma proteína é mais conservada
Introdução
26
do que a seqüência de aminoácidos durante o processo evolutivo [NAYEEM, A.
(2006)]. Assim, seqüências homólogas com estruturas resolvidas podem ser
utilizadas como molde na construção de modelos de seqüências alvo, em que o grau
de confiabilidade do processo é altamente dependente do grau de similaridade entre
as seqüências.
O processo de obtenção de um modelo por modelagem comparativa pode ser
dividido em quatro etapas principais [HILLISCH, A. (2004)]:
1. Busca de seqüências homólogas (seqüências de referência);
2. Alinhamento da seqüência alvo com as seqüências de referência;
3. Construção e otimização dos modelos;
4. Validação dos modelos.
Acredita-se que o principal obstáculo para a modelagem comparativa seja a
realização de um bom alinhamento, que essa técnica é totalmente dependente de
bancos de dados, os quais podem limitar os estudos da seqüência alvo [ZHANG, Y. &
SKOLNICK, J (2005)].
Os métodos de Threading compartilham características comuns com a
modelagem comparativa. Em ambos, a realização de alinhamentos e a utilização
de informações sobre estruturas resolvidas. No entanto, os métodos de
reconhecimento de enovelamento não necessitam de uma alta similaridade entre as
seqüências alvo e de referência. A idéia principal dos métodos de Threading baseia-
se no alinhamento do esqueleto peptídico da conformação alvo a uma coleção de
padrões de enovelamento encontrados nos bancos de dados (biblioteca de
enovelamentos), ou seja, na avaliação da compatibilidade entre os esqueletos
peptídicos da cadeia alvo e da cadeia molde. A avaliação seqüência/estrutura é
geralmente calculada por uma função de energia empírica derivada de um banco de
dados de contatos de resíduos observados em estruturas resolvidas. Entretanto,
esses métodos ainda são muito pouco precisos, mas poderão se tornar uma
ferramenta muito útil para a seleção de moldes [ROST, B. & SANDER, C. (1996)].
Por último, os métodos ab initio, ao contrário dos outros dois métodos,
tentam predizer a conformação nativa sem a utilização de qualquer tipo de
referência. A estrutura nativa que a cadeia polipeptídica adota em condições
fisiológicas corresponde à conformação que está associada ao mínimo global de
energia [TRAMONTANO, A. & LESK, A. M. (2006)]. Por isso, sua característica
fundamental é a de não utilizar informações estruturais de proteínas resolvidas
experimentalmente para tentar predizer a estrutura nativa, utilizando apenas a
Introdução
27
seqüência de aminoácidos [DILL, A. K. et al. (1995); SOCCI, N. D. & ONUCHIC, J.N.
(1994); MUÑOZ, V. & EATON, W. A. (1999); BROOKS III, C. L. et al. (1998); GRUEBELE, M.
(1999)].
Estes métodos utilizam funções de energia potencial para varrerem os
espaços conformacionais das cadeias polipeptídicas. Estas funções calculam a
energia conformacional da cadeia polipeptídica e a energia das interações da cadeia
com o solvente (energia de solvatação). Dessa forma, estes métodos buscam
encontrar o mínimo global de energia da cadeia [ZHANG, Y. et al. (2003); MORET, M. A.
et al. (1998); AGOSTINI, F. P. et al. (2006); TRAMONTANO, A. & LESK, A. M. (2006);
OSGUTHORPE, D. J. (2000)].
Nos últimos eventos promovidos pelo CASP, os métodos de predição ab initio
apresentaram-se uma ótima classificação, tornando-se a metodologia,
provavelmente, mais promissora [MOULT, J. (2005)].
Atualmente, as principais técnicas de predição ab initio são [AGOSTINI, F. P.
et al. (2006)]:
Métodos determinísticos, baseados na simulação por Dinâmica Molecular
e;
Métodos estocásticos, baseados no método de Monte Carlo.
1.4.1.1 Dinâmica Molecular (DM)
A Dinâmica Molecular é uma das principais ferramentas para o estudo
teórico de moléculas biológicas. A primeira aplicação desta técnica foi feita por
Alder e Wainwright na cada de 50 [ALDER, B. J. & WAINWRIGHT, T. E. (1957)],
quando eles usaram um modelo de esferas rígidas com choques perfeitamente
elásticos para representar as interações atômicas.
Neste método, pode-se observar o comportamento temporal dos átomos em
um sistema. A metodologia, em princípio, utiliza as leis da Física Clássica (leis de
Newton, potencial de Hooke e eletromagnetismo clássico). Os cálculos do
movimento são realizados em pequenos intervalos discretos de tempo.
Apesar da Dinâmica Molecular permitir que o sistema molecular ultrapasse
as barreiras de energia e visite outros mínimos de energia, as escalas de tempo
acessíveis até o momento ainda são muito custosas computacionalmente e acabam
limitando a aplicabilidade da técnica no cálculo do mínimo global. Mesmo com os
avanços no poder computacional e a representação física por uma função potencial
relativamente simples, a dinâmica molecular ainda possui a limitação do elevado
Introdução
28
custo de recursos computacionais.
Dessa forma, o procedimento usual para a DM pode não ser a melhor forma
de mapear os pontos de mínimos locais e globais na hipersuperfície de energia.
Neste contexto, um dos métodos mais utilizados para se percorrer o espaço
conformacional na busca do mínimo global, são os métodos estocásticos tais como,
os baseados no método de Monte Carlo [MUNDIM, K. C. (2000)].
1.4.1.2 Métodos Estocásticos
Os métodos estocásticos baseados no método de Monte Carlo (MC) m sido
de extrema importância em muitas áreas científicas como medicina, economia,
física, química, matemática e biologia [PASCUTTI, P. G. (2002); MUNDIM, K. C. (2000)].
O MC é um método estatístico que tem ajudado a elucidar questões fundamentais
do problema do enovelamento de proteínas. As simulações baseadas em MC
envolvem o cálculo de populações a partir de uma função de custo; a geração de
números aleatórios; e a probabilidade de aceitar-se as novas configurações obtidas
[METROPOLIS, N. et al. (1953)].
No estudo do enovelamento de proteínas, as simulações de Monte Carlo
utilizam a geração aleatória de conformações do sistema a fim de explorar o espaço
de conformações e analisar as hipersuperfícies de energia dessas moléculas. Estas
hipersuperfícies, não-convexas (com vários mínimos de energia), apresentam uma
quantidade de conformações estáveis (mínimos locais da hipersuperfície) que
crescem com o número de graus de liberdade do sistema. Os melhores métodos
para tratar esse problema são justamente os métodos estocásticos.
Durante algumas décadas de estudos, vários métodos foram propostos,
baseados no método estocástico de Monte Carlo. Dentre os vários métodos
dispostos na literatura, o Simulated Annealing (SA) tem recebido um grande
destaque [KIRKPATRICK, S. et al. (1983)]. A idéia central é simular a mudança de
conformação de uma cadeia polipeptídica conforme o decréscimo da temperatura
até que a cadeia atinja o mínimo de sua energia potencial. Este método baseia-se
no procedimento de annealing ("recozimento"), empregado na metalurgia para o
crescimento de um cristal. Ou seja, inicia-se a simulação a uma temperatura
suficientemente alta, na qual todos os estados são acessíveis e, subseqüentemente
resfria-se lentamente o sistema até se alcançar uma temperatura baixa o suficiente
para que se atinja a conformação de menor energia (mínimo global). O problema
Introdução
29
desse método é que se a temperatura decrescer muito rapidamente, a cadeia
polipeptídica, geralmente, fica aprisionada em um mínimo local da hipersuperfície
de energia. No método de SA, o sorteio das "novas conformações" obedece a uma
distribuição gaussiana (busca local) [DA SILVA, D. M. (2005); AGOSTINI, F. P. (2008)].
Várias propostas foram feitas no intuito de aumentar a eficiência do SA. Em
uma delas, no lugar da distribuição gaussiana, utiliza-se uma distribuição do tipo
Cauchy-Lorentz [SZU, H. & HARTLEY, R. (1987)]. Este novo método é chamado de
Simulated Annealing Rápido, ou FSA (Fast Simulated Annealing). Neste caso, tem-se
uma distribuição semi-local, pois admite-se que ocorra, ocasionalmente, uma maior
variação na conformação. Além disso, o resfriamento pode ser mais rápido,
tornando o método mais eficiente [DA SILVA, D. M. (2005)].
No entanto, no início da década de 90, Tsallis e Stariollo [TSALLIS, C. &
STARIOLO, D. A. (1996); STARIOLO, D. A. & TSALLIS, C. (1995)] propuseram um novo
método, chamado Generalized Simulated Annealing (GSA), que se baseava na
generalização do Simulated Annealing, tanto do método clássico (a palavra clássico
passou a ser usada para se referir ao primeiro método do Simulated Annealing com
o uso da distribuição gaussiana), quanto do método de Simulated Annealing Rápido
(com o uso da distribuição de Cauchy-Lorentz). Foram introduzidos: um parâmetro
que controla o espaço da geração de novas conformações (q
V
) e outro responsável
pelo controle da aceitação de novas estruturas (q
A
). Esta idéia de generalização
surgiu a partir de uma proposta feita por Tsallis, anteriormente, da generalização
da termo-estatística de Gibbs - Boltzmann [TSALLIS, C. & BRIGATTI, E. (2004);
TSALLIS, C. (1988)]. Este novo método ganhou notoriedade rapidamente na
comunidade cientifica [MUNDIM, K. C. & TSALLIS, C. (1996); MORET, M. A. et al. (1998);
MORET, M. A. et al. (2005); AGOSTINI, F. P. et al. (2006); JUNIOR, A. D. et al. (2004);
PENNA, T. J. P. (1995); ANDRICIOAEI, I. & STRANB, J. E. (1996); XIANG, Y. et al. (1997);
SERRA, P. et al. (1997); XIANG, Y. & GONG, G. (2000); MORET, M. A. et al. (2002)].
Atualmente, existem várias aplicações do GSA no estudo do enovelamento de
proteínas [MORET, M. A. et al. (1998); HANSMANN, U. H. E. (1997); ANDRICIOAEI, I. &
STRAUB, J. E. (1996); AGOSTINI, F. P. et al. (2006); MORET, M. A. et al. (2002)].
Uma análise quantitativa da eficiência de várias técnicas [HAMACHER, K. &
WENZEL, W. (1999); MEIROVITCH, H. & VASQUEZ, M. (1997); WESTHEAD, D. R. et al.
(1997)] mostrou que o Simulated Annealing é mais eficiente do que os algoritmos
genéticos e outros métodos estocásticos. Outros exemplos indicam que técnicas de
annealing com as propostas de Tsallis mostram-se superiores ao Simulated
Introdução
30
Annealing clássico [HANSMANN, U. H. E. & OKAMOTO, Y. (1997)]. Com a técnica GSA
no estudo do enovelamento de proteínas, pode-se alcançar o mínimo global de
energia de um sistema, utilizando um número de passos muito menor do que em
métodos determinísticos, evolutivos ou até mesmo estocásticos convencionais, como
por exemplo, o método de Monte Carlo, que se baseia na estatística de Boltzmann.
O GSA garante, portanto, um menor custo computacional comparado aos outros
métodos [AGOSTINI, F. P. et al. (2006)]. Apesar da superioridade deste método, vale
ressaltar que uma vantagem óbvia da Dinâmica Molecular sobre os métodos
derivados de Monte Carlo, incluindo o GSA, consiste no fato da simulação por
Dinâmica Molecular (por ser um método determinístico) fornecer uma noção
temporal do processo, pois disponibiliza a trajetória clássica do sistema; enquanto
que as simulações dos métodos derivados de Monte Carlo não oferecem uma
trajetória temporal do sistema.
É importante ressaltar que na proposta original do GSA, o processo de
decaimento da temperatura (o annealing) era controlado ou pelo parâmetro q
V
ou q
A
,
como citado anteriormente. No entanto, nosso grupo, ao estudar o enovelamento de
proteínas através da busca conformacional de polipeptídios [AGOSTINI, F. P. et al.
(2006)], verificou a necessidade da inclusão de um novo parâmetro para controlar o
annealing do programa. Com este novo parâmetro, chamado de parâmetro de
temperatura (q
T
), garantimos uma maior independência do processo de annealing,
além de melhores resultados [AGOSTINI, F. P. (2008)].
Embora o GSA seja um excelente método estocástico de busca geral, seu
sucesso é extremamente sensível aos valores dos parâmetros que controlam a
busca conformacional (q
V
), o resfriamento (q
T
) e a aceitação de novas conformações
(q
A
); além das características topológicas da hipersuperfície de energia gerada pelo
cálculo da energia potencial total sobre todos os graus de liberdade do sistema
(Figura 16). O formato da hipersuperfície pode ajudar na escolha prévia dos
parâmetros q
A
, q
V
e q
T
.
Assim, no estudo do enovelamento, dependendo do sistema a ser estudado,
os valores de q
A
, q
V
e q
T
mudam, não apresentando sempre um mesmo valor fixo.
Objetivos
31
2 Objetivos
O objetivo geral deste trabalho é o desenvolvimento de metodologias e
protocolos para a predição ab initio da estrutura de proteínas.
2.1 Objetivos Específicos
Estudar o enovelamento de polialaninas para calibração dos parâmetros q
A
, q
V
e q
T
do método estocástico GSA e construir protocolos para estudar o
desempenho do programa THOR/GSA em estruturas mais complexas;
Inclusão do termo de energia de solvatação dependente do cálculo da área
acessível ao solvente;
Utilização de modelos realistas para estudar a eficiência do GSA;
Utilização do método de Dinâmica Molecular para refinar as estruturas
obtidas por GSA.
Métodos Teóricos
32
3 Métodos Teóricos
Neste capítulo, serão abordados os aspectos gerais das técnicas aplicadas.
Os átomos, constituintes das moléculas, são considerados como partículas
pontuais com massa e carga elétrica definidas. As interações entre estas partículas
são representadas por uma função de energia potencial empírica, como descrito na
seção 3.1. A seção 3.2 abordará a técnica do GSA (do inglês, Generalized Simulated
Annealing) e a seção 3.3 a técnica de Dinâmica Molecular (DM).
3.1 Campo de Forças
A representação de um sistema molecular complexo seria descrito mais
precisamente, pela mecânica quântica, por esta considerar todas as interações
entre as partículas subatômicas (prótons e elétrons). Porém, o grande número de
átomos das macromoléculas e as atuais limitações computacionais tornam o
tratamento do sistema molecular inviável por métodos baseados em mecânica
quântica. Por isso, uma alternativa é a representação das interações moleculares
por funções potenciais "clássicas" (são chamadas de clássicas por se valerem de
potenciais da física clássica para representar ligações químicas, como potenciais
harmônicos e diedrais, e interações entre átomos não ligados diretamente, como o
potencial de Coulomb e Lennard-Jones). Essas funções permitem que o cálculo da
energia do sistema seja dependente, apenas, das posições dos núcleos atômicos.
O conjunto de funções que calcula a energia potencial, juntamente com as
suas respectivas parametrizações, é chamada de Campo de Forças molecular
[BROOKS III, C. L. et al. (1988); VAN GUNSTEREN, W. F. & BERENDSEN, H. J. C. (1990)].
Existem vários campos de forças propostos na literatura, tais como: CHARMM
[BROOKS, B. R. et al. (1983)], AMBER [WEINER, S. J. et al. (1986)], GROMOS [VAN
GUNSTEREN, W. F. & BERENDSEN, H. J. C. (1987)], OPLS/AA [JORGENSEN, W. L. et al.
(1996)], entre outros. O Campo de Forças é calibrado por funções potenciais
empíricas obtidas por dados experimentais e cálculos quânticos sobre pequenas
moléculas, devido à impossibilidade computacional da representação quântica de
Métodos Teóricos
33
todo o sistema [BROOKS III, C. L. et al. (1988); VAN GUNSTEREN, W. F. & BERENDSEN,
H. J. C. (1990); MUNDIM, K. C. (2002); PASCUTTI, P. G. (2002)]. Como fatores em
comum, os campos de forças apresentam termos harmônicos, que descrevem as
ligações covalentes entre pares de átomos e ângulos entre ligações químicas
vizinhas; um termo torcional, que descreve as rotações em torno de ligações; e dois
termos que descrevem interações entre átomos não ligados (a partir do terceiro
vizinho), que levam em conta a impenetrabilidade das nuvens eletrônicas, as forças
de dispersão e indução dipolar, assim como atrações e repulsões eletrostáticas.
A função clássica, proposta pelo grupo de Groningen [VAN GUNSTEREN, W. F.
& BERENDSEN, H. J. C. (1987)], que descreve a energia potencial total para um
sistema molecular, é dada pela soma dos termos que representam as interações
entre os átomos ligados e não ligados. Para um sistema molecular constituído de
N átomos com vetores posição r
i
(i= 1,2, ...,N
átomos
), esta função pode assumir a
forma dada na Equação (1).
(1)
Na Equação (1), os três primeiros termos, após a igualdade, correspondem a
potenciais harmônicos dados pela lei de Hooke. O primeiro termo modela a
interação entre dois átomos, reproduzindo as pequenas vibrações nas ligações em
torno do comprimento de equilíbrio (Figura 20a). Nesta equação, N
b
é o número
total de pares de átomos ligados e, para cada par, são definidos os valores
específicos, onde K
bn
é a constante de força que determina a flexibilidade de uma
ligação; b
n
é o comprimento da ligação em um instante de tempo qualquer; e b
0n
é o
parâmetro que define o comprimento de equilíbrio da ligação. Da mesma forma, o
segundo termo da equação modela pequenas oscilações nos ângulos entre as
ligações em relação ao ângulo de equilíbrio (Figura 20b). Esse termo responde pela
variação angular composta por três átomos ligados em sequência. Na Equação (1),
=
1
,
2
, ,

=
1
2

=1
2
+
1
2

=1
2
+
1
2

=1
2
+

[1 + cos(

=1
)]
+
12
,

12
6
,

6

<
+
4
0


<
Métodos Teóricos
34
N
θ
é o número total de trios de átomos; K
θ
n
é a constante de Hooke para a
restituição ao ângulo de equilíbrio θ
0n
; e θ
n
representa a variação angular. O terceiro
termo envolve quatro átomos ligados, sendo um central ligados aos outros três,
sobre os quais se pode imaginar planos que compõem um ângulo diedro, que varia
harmonicamente (Figura 20c). Esse termo é responsável por manter, por exemplo, a
planaridade dos anéis aromáticos. Na Equação (1), N
ξ
é o número total de quartetos
de átomos envolvidos em diedrais impróprios; K
ξ
n
é a constante de força angular
para a restituição ao ângulo de equilíbrio; ξ
0n
é o ângulo diedro de equilíbrio; e ξ
n
representa a variação angular.
O quarto termo define a função potencial de torção e é utilizado para
representar as rotações em torno das ligações com liberdade de torção (Figura 20d).
O potencial de torção é descrito por uma função periódica simples, conhecida como
diedro próprio. Para garantir a periodicidade, a energia torsional é modelada como
uma soma de funções de cosseno. Na Equação (1), K
φn
representa a altura da
barreira de rotação; m é a periodicidade; φ
n
é o ângulo diedro para a ligação central
em uma seqüência de quatro átomos; e δ
n
é a defasagem no ângulo diedral.
Figura 20 (A) Representação do Potencial de Ligação para um par n qualquer, onde b
representa o comprimento da ligação química. (B) Representação do Potencial Angular para um termo
de átomos ligados n qualquer cujo ângulo entre eles varia harmonicamente em torno do ângulo de
equilíbrio, onde θ é o ângulo entre duas ligações consecutivas; (C) Potencial Diedro Impróprio, onde ξ é
o ângulo entre os planos. Este potencial mantém a planaridade dos átomos de hidrogênio em relação
ao anel benzênico, por exemplo. (D) Potencial Torcional Próprio, onde φ é o ângulo com liberdade de
torção.
Os dois últimos termos representam a contribuição das interações entre
átomos não ligados, onde, o penúltimo termo representa as interações de van der
Waals e o último a energia eletrostática. Esta contribuição é descrita pela soma das
energias, entre todos os possíveis pares de átomos, i e j, distantes entre si por três
ou mais ligações. O cálculo destes termos demanda um tempo computacional
Métodos Teóricos
35
elevado, pois incluem muito mais interações por partícula.
O termo de van der Waals é calculado pelo potencial de Lennard-Jones, que
possui um mínimo quando a separação interatômica é igual à soma dos raios de
van der Waals entre os átomos (Figura 21). A parte repulsiva é representada pelo
termo r
-12
, que descreve a impenetrabilidade das nuvens eletrônicas; e a parte
atrativa pelo termo r
-6
, que descreve as interações de curto alcance do tipo dipolo
instantâneo/dipolo-induzido ou dispersão. Todos estes potenciais atuam de forma
independente um dos outros e sobre todos os átomos do sistema. Na Equação (1),
os parâmetros C
6
(i,j) e C
12
(i,j) controlam a profundidade e a posição (distância
interatômica) do vale da energia potencial para um dado par de interações entre
átomos não ligados.
r+R
Figura 21 Representação atômica usando-se os raios de van der Waals [adaptado de da
SILVA, A. W. S. (2003)].
O último termo é representado pelo Potencial Eletrostático. As distribuições
internas dos elétrons criam regiões positivas e negativas na molécula (Figura 22). A
contribuição eletrostática é modelada usando-se o potencial de Coulomb. A energia
eletrostática depende da carga atômica. A intensidade desta força varia com o
inverso da distância de separação entre os átomos, sendo, portanto, de longo
alcance. Interações iônicas e ligações hidrogênio são casos especiais de interações
eletrostáticas, tendo grande importância na estabilização da estrutura de proteínas.
Na Equação (1), q
i
e q
j
são as cargas parciais sobre os átomos i e j, cuja distância é
dada por r
ij
; ε
0
é a permissividade do meio; e ε é a constante dielétrica.
Métodos Teóricos
36
Figura 22 Energia potencial de Coulomb entre dois átomos de cargas unitárias e opostas. O
tom de cor indica a intensidade do potencial. Verde indica valores positivos (átomo amarelo) e
vermelho indica valores negativos (átomo azul). As setas representam o campo elétrico, que saem do
átomo positivo para o átomo negativo. As linhas brancas são as eqüipotenciais.
O sistema molecular está sujeito a penalidades de energia a partir do
momento em que as geometrias se afastam dos valores de equilíbrio de referência.
Quanto maior o desvio, maior a penalidade, logo, maior a energia.
3.1.1 Otimização da Geometria Molecular
A otimização da geometria ou minimização da energia de um sistema
molecular é uma etapa preliminar essencial à etapa da Dinâmica Molecular, ou até
mesmo para buscas conformacionais e predição de estruturas.
Os métodos de otimização de geometria trabalham na eliminação de
deformações em um sistema. Em uma estrutura tridimensional inicial, podem
existir forças que implicam em grandes velocidades e, conseqüentemente, em
temperaturas irreais nos primeiros passos da simulação. Dessa forma, é de extrema
importância a minimização da energia do sistema, para que haja a remoção de
qualquer tensão local. O objetivo da execução dos programas de otimização de
geometria é ter uma conformação espacial que tenha relaxada as distorções nas
ligações químicas, nos ângulos de ligação e nas interações de van der Waals.
A hipersuperfície de energia de uma proteína, por exemplo, apresenta
mínimos locais e um mínimo global de energia (o menor valor possível da
hipersuperfície de energia). Estes mínimos locais podem ser numerosos, visto que
estão diretamente relacionados com o grau de liberdade do sistema.
Atualmente, existem vários métodos de minimização de energia capazes de
remover qualquer tensão local, procuram um mínimo local ao varrer apenas uma
parte da hipersuperfície, de forma a encontrar um ponto com a menor energia
potencial local.
Adicionalmente, existem métodos de otimização que varrem completamente a
Métodos Teóricos
37
superfície multidimensional de energia em busca do mínimo global, sendo
chamados, portanto, de métodos de otimização global.
Ao logo dos últimos anos, vários métodos foram propostos na literatura.
Dentre todos estes métodos, o Generalized Simulated Annealing (GSA), baseado na
termo-estatística de Tsallis [TSALLIS, C. (1988)], tem recebido grande destaque.
3.2 Generalized Simulated Annealing (GSA)
O grande consumo de tempo computacional, devido à busca pelo mínimo
global, e a dificuldade de se escapar da armadilha representada por um mínimo
local são objetos de estudo no processo de otimização. Vários algoritmos foram
criados com o intuito de vencer estes dois obstáculos e de se chegar ao mínimo
global de forma bem sucedida. Entretanto, mesmo com uma diversidade de
algoritmos apresentados na literatura, muitos deles, se não levam a um grande
consumo de tempo computacional, prendem-se em um mínimo local [DA SILVA, D.
M. (2005)].
Dentre os vários métodos estocásticos encontrados na literatura, o Simulated
Annealing (SA) tem recebido grande destaque. A primeira versão foi proposta por
Kirkpatrick e colaboradores, em 1983 [KIRKPATRICK, S. et al. (1983)], com o objetivo
de aplicação geral para otimização global de sistemas clássicos. Este método foi
desenvolvido a partir da analogia com um processo da termodinâmica, chamado de
annealing. Este procedimento pode ser visto, na prática, pela obtenção de cristais
na metalurgia, em que um sólido é fundido a altas temperaturas com o
subseqüente resfriamento bastante lento. Dessa forma, os átomos alinham-se
formando uma estrutura de cristal, onde eles estão perfeitamente ordenados,
caracterizando o estado de mínimo absoluto da energia termodinâmica.
O algoritmo SA trabalha sob o formalismo da estatística de Boltzmann-Gibbs
e usa uma distribuição de visita Gaussiana (distribuição de busca local) para novas
conformações. Com isso, a otimização envolve uma busca estocástica, que se inicia
a uma temperatura artificial (ruído) suficientemente alta. Dessa forma, o sistema se
torna capaz de visitar conformações de alta energia e, conseqüentemente, transpor
altas barreiras de energia, possibilitando sair da bacia atratora de um mínimo local
da hipersuperfície de energia. Na medida em que a temperatura é baixada, espera-
se que o sistema seja atraído para a bacia do mínimo absoluto.
Geman e Geman [GEMAN, S. & GEMAN, D. (1984)] demonstraram que a
Métodos Teóricos
38
condição necessária e suficiente para garantir o sucesso na convergência para o
mínimo global, pelo método do SA, é que a temperatura artificial decaia obedecendo
a uma função inversamente proporcional ao logaritmo do tempo, para uma dada
temperatura inicial suficientemente alta. Portanto, um grande desafio do método
consiste em baixar a temperatura no menor tempo possível, mas com o objetivo de
que as conformações não fiquem definitivamente presas em um mínimo local. Ou
seja, se a temperatura decair muito rapidamente, a estrutura pode ficar presa em
uma bacia atratora de mínimo local de energia. Dessa forma, para evitar o
resfriamento rápido, o algoritmo faz uso de um procedimento iterativo proposto
anteriormente por Metropolis e colaboradores [METROPOLIS, N. et al. (1953)] nas
simulações de Metropolis-Monte Carlo, nas quais, em cada etapa, é calculada uma
nova estrutura com um novo valor de energia, que é comparada com a energia da
estrutura anterior. Se o novo valor de energia for menor, a "nova" estrutura do
sistema é aceita, no entanto, se for maior, em vez de ser simplesmente descartada,
pode ser aceita de acordo com uma função de probabilidade de aceitação definida
pela distribuição de Boltzmann.
Szu e Hartley [SZU, H. & HARTLEY, R. (1987)] propuseram uma modificação do
método clássico (clássico porque o algoritmo do SA, primeiramente proposto por
Kirckpatrick e colaboradores, passou a ser chamado de CSA, do inglês Classical
Simulated Annealing ou máquina de Boltzmann), que ao invés do uso da
distribuição gaussiana para gerar os deslocamentos na estrutura, fosse usada uma
distribuição Lorentziana (distribuição de busca semi-local que admite longos saltos
ocasionalmente). A modificação não foi nada mais do que a separação entre os
processos de aceitação e de visitação, sendo que o algoritmo de aceitação continuou
usando a probabilidade de Boltzmann, a mesma do CSA. Eles concluíram que,
dessa forma, a temperatura obedece a uma função inversa a do tempo, o que torna
o método ainda mais rápido que o CSA. Esse novo método foi chamado de FSA, do
inglês Fast Simulated Annealing, ou máquina de Chauchy.
Durante a década de 90, Tsallis e Stariolo [TSALLIS, C. & STARIOLO, D. A.
(1996)] propuseram uma generalização do Simulated Annealing, com o objetivo de
unificar os dois casos, CSA e FSA, de forma a prover um algoritmo ainda mais
pido. A idéia surgiu após a generalização da termo-estatística de Boltzmann-
Gibbs, proposta anteriormente por Tsallis [TSALLIS, C. (1988)]. Esse novo algoritmo,
baseado na mecânica estatística de Tsallis, é chamado de GSA, do inglês
Generalized Simulated Annealing, ou máquina de Tsallis [JÚNIOR, A. D. et al. (2004)].
Métodos Teóricos
39
O GSA unificou os algoritmos CSA e FSA com a introdução de dois
parâmetros: um que define a probabilidade de aceitação, dada pelo critério de
Metropolis generalizado, e outro para a probabilidade de visitação, responsável pela
perturbação nas coordenadas. Estes parâmetros são q
A
e q
V
respectivamente. A
manipulação desses dois parâmetros pode levar o algoritmo para a faixa de valores
do CSA (quando q
A
e q
V
são iguais a 1), para o FSA (quando q
A
é igual a 1 e q
V
é
igual a 2) ou para outros valores em que o resfriamento seja otimizado. A função de
temperatura, nesse primeiro momento, era ajustada pelo parâmetro de visitação, q
V
.
No entanto, nosso grupo propôs a adição, pela primeira vez, de um novo parâmetro
para o controle da temperatura [AGOSTINI, F. P. et al. (2006); NIOR, A. D. et al.
(2004); AGOSTINI, F. P. et al. (2003)] chamado de q
T
. Dessa forma, o algoritmo GSA
passou a englobar três fenômenos independentes visitação, aceitação e
temperatura sendo, cada um deles relacionado a um parâmetro q distinto. Ou
seja, a visitação é controlada pelo parâmetro q
V
, a aceitação pelo parâmetro q
A
, e,
agora, a temperatura é controlada pelo parâmetro q
T
. Para cada tipo de problema,
estes parâmetros podem ser manipulados, objetivando o sucesso da convergência
no menor tempo possível.
De forma a melhorar o desempenho do algoritmo, diminuindo o indesejável
custo computacional, o grupo de Dardenne usou uma versão mais simplificada do
método [JÚNIOR, A. D. et al. (2004)]. Além da introdução do novo parâmetro q
T
, para
controle do decaimento da temperatura, o processo para a obtenção da perturbação
nas coordenadas, antes resolvida numericamente pela inversão de uma série de
potências [MORET, M. A. et al. (1998b)], é agora baseada no uso direto da função
densidade de probabilidade, sem o recurso da integração numérica.
Esta modificação, em especial, foi sugerida porque a distribuição de visitação
generalizada não é integrável para qualquer parâmetro. A expressão integrada do
GSA tinha solução analítica para (q
A
, q
V
) = (1,1) e (q
A
, q
V
) = (1,2), para o caso
geral, era necessário fazer uma integração numérica. É válido ressaltar que o uso
de uma integração numérica, normalmente, gasta muito tempo computacional.
Além disso, a integração numérica pode gerar números compreendidos em um
intervalo que varia de - a +. Uma extensão como essa é desnecessária, pois
valores altos para o incremento (perturbação das coordenadas) implicam em uma
variação energética muito alta entre as conformações comparadas, o que aumenta a
probabilidade do novo salto ser recusado. Este fato indesejável pode acontecer
repetidas vezes, elevando o número de ciclos da simulação sem que o salto seja
Métodos Teóricos
40
aceito, acarretando no indesejado retardamento da convergência do algoritmo.
Foi visto em muitas aplicações, que o uso da função de visitação não
integrada é mais eficiente no processo de minimização do que no caso convencional
[AGOSTINI, F. P. et al. (2006)], pois além de tornar o procedimento vantajoso,
facilitando os cálculos computacionais e reduzindo o espaço conformacional,
permite que a geração de incrementos fique limitada no intervalo de [0,1].
Depois que os valores dos parâmetros q
A
, q
V
e q
T
e da temperatura artificial
inicial, T
0
(1), são escolhidos, o GSA segue os seguintes passos:
1º. A cada passo t uma nova temperatura é calculada, de acordo com a
Equação (2):
(2)
onde q
T
representa o parâmetro que controla a taxa de decaimento da
temperatura [AGOSTINI, F. P. et al. (2006)];
2º. A partir de uma conformação inicial (φ
t
), um novo conjunto de
coordenadas (
t+1
) é obtido a cada passo, por um incremento aleatório
(Δφ
t,i
) adicionado aos ângulos diedros da molécula. Isto permite a
visitação da hipersuperfície de energia potencial de acordo com a
Equação (3),
(3)
onde
t,i
é calculado a partir da função descrita pela Equação (4),
(4)
onde r é o valor de um número aleatório no intervalo de [0,1] e g
qV
é a
função de distribuição de visitação, dada pela Equação (5),
(5)
+1
=
+ 
,
,
=
()
() = (1)
2
1
1
(1 + )
1
1

,
=
1
1
2
1
1
2
1
1
1
1
1
2
1
3
1 +
1

,
2
2
3
1
1
1
2
Métodos Teóricos
41
onde, (x) é uma função gama e q
V
é o índice que controla a visitação
da superfície de energia (busca conformacional). A distribuição torna-
se não normalizável para q
V
3.
3º. A seguir, a energia conformacional E(
t+1
) é calculada com os termos
torsional, de Lennard-Jones e de Coulomb da Equação (1), utilizando o
programa THOR (programa de modelagem e dinâmica molecular
desenvolvido com a participação de pesquisadores do Instituto de
Biofísica Carlos Chagas Filho IBCCF/UFRJ [MORET, M. A. et al.
(1998)]), que emprega o Campo de Forças Molecular GROMOS96 [VAN
GUNSTEREN, W. F. & BERENDSEN, H. J. C. (1997)];
4º. As novas coordenadas o aceitas ou não de acordo com o seguinte
critério:
se E(
t+1
) < E(
t
), as coordenadas
t
são substituídas por
t+1
;
se E(
t+1
) > E(
t
), é sorteado um número n
[0,1]:
se n > P
qA
(a probabilidade de aceitação), as coordenadas
t
são mantidas, se não,
t
é substituída por
t+1
;
A probabilidade de aceitação da nova configuração é dada pela
Equação (6),
(6)
onde q
A
é o índice de aceitação na estatística generalizada de Tsallis.
Se q
A
for igual a 1, P
qA
corresponde a distribuição clássica de
Boltzmann utilizada no critério de Metropolis, no método de Monte
Carlo;
5º. Retornando ao passo, o procedimento é repetido até que o sistema
esteja congelado (T = 0).
O fluxograma da Figura 23 mostra o funcionamento do algoritmo GSA de
forma simplificada.
= 1 + (
1)
+1
(
)
()
1
1
Métodos Teóricos
42
Input: (X
1
); Temperatura Inicial (T
0
);
parâmetros do GSA (q
A
, q
V
, q
T
)
Nova Temperatura
T
(t)
Calculo da nova conformação
φ
t+1
= φ
t
+ φ
Δt
E(X
t+1
) < E(X
t
)
Probabilidade
de Aceitação
(P
qA
)
Gera n
n ε [0,1]
n < P
qA
o
Guarda
estrutura
Sim
Figura 23 Fluxograma do GSA. Nota-se que existe uma alternativa para se movimentar para
regiões onde a função E(x
t+1
) é maior do que E(x
t
). A probabilidade para se aceitar a conformação com a
nova energia se deve ao critério Pq
A
(critério de aceitação generalizado proposto por Tsallis [TSALLIS, C.
& STARIOLO, D. A. (1988)]). É valido lembrar que, quando q
A
= 1, assumimos o critério de Metropolis
[METROPOLIS, N. et al. (1953)] para a probabilidade de aceitação.
Embora o procedimento acima tenha uma validade geral, a eficiência na sua
utilização depende da escolha dos parâmetros envolvidos e da estratégia geral de
sua aplicação. Para se ter uma idéia da sensibilidade destes parâmetros num
cálculo de GSA, um valor não ideal de q
V
pode fazer o número de ciclos para
convergência dos cálculos passar de milhares para milhões, sem convergir
[AGOSTINI, F. P. (2008)]. Portanto, o GSA se torna sensível à escolha prévia dos
valores dos parâmetros q
A
, q
V
, q
T
, além do valor da temperatura inicial (T
0
).
Métodos Teóricos
43
3.2.1 Parâmetros do GSA
Apesar do GSA possuir a vantagem de alcançar o mínimo global de energia
de um sistema, em um número de passos iterativos muito menor do que outras
técnicas estocásticas, como os métodos baseados em Monte Carlo, ele apresenta a
desvantagem da sua eficiência estar altamente relacionada à escolha de parâmetros
para um determinado problema. Na tentativa de tornar o GSA uma ferramenta de
uso geral, nosso grupo realizou o mapeamento dos parâmetros, não apenas para o
problema do enovelamento de proteínas [AGOSTINI, F. P. et al. (2006, 2008);
FERNANDES, T. V. A. (2007)], mas também para outros problemas como o
Ancoramento Molecular (Docking Molecular) [PITA, S. S. R. et al. (2007)].
O algoritmo do GSA foi implementado no programa de modelagem e dinâmica
molecular THOR [MORET, et al. (1998)]. As energias das conformações moleculares
foram calculadas pelo campo de forças clássico implementado no programa THOR.
No estudo de conformações de peptídeos e pequenas proteínas, uma
estratégia que simplifica e torna factível o cálculo é considerar constantes os
tamanhos das ligações covalentes e os ângulos entre duas ligações consecutivas,
mantendo-se seus valores de equilíbrio, onde o único termo a variar são os ângulos
diedros. Logo, uma maneira bastante conveniente de representar a estrutura inicial
do GSA, em um formato aceito pelo THOR, é pelo uso da matriz de coordenadas
internas, representada por uma matriz-Z, que contém o símbolo atômico de cada
elemento, a distância I-J entre dois átomos consecutivos, o ângulo I-J-K e o Diedro
I-J-K-L, além das cargas. Mais especificamente, o programa THOR necessita de três
arquivos de entrada (*.IN, *.MD, *.TOP), que podem ser obtidos pelo programa
PDBTHORBOX (programa desenvolvido no Instituto de Biofísica Carlos Chagas
Filho - IBCCF/UFRJ [DARDENNE, L. E. et al. (1999)]), a partir de uma estrutura de
PDB inicial. No arquivo de entrada *.IN, onde se encontra a matriz de coordenadas
internas, pode-se escolher quais ângulos diedros devem ser otimizados durante a
execução do algoritmo.
Os parâmetros específicos do GSA (q
A
, q
V
, q
T
), o número de iterações e a
temperatura inicial (T
0
) são definidos em um arquivo chamado gsa.par.
No final da execução do algoritmo, o programa gera um arquivo com as
coordenadas cartesianas xyz (no formato PDB) da estrutura de menor energia
obtida, um arquivo texto que mostra o valor da energia durante a execução, a
energia da estrutura final e o tempo total de execução do programa.
Métodos Teóricos
44
Exemplos de arquivos *.IN, e gsa.par, além dos comentários sobre cada termo
destes arquivos, encontram-se no Apêndice A.
3.2.1.1 Sensibilidade do Algoritmo GSA aos Parâmetros
q
A
, q
V
e q
T
O gráfico da Figura 24 mostra como a Eq.(2) se comporta diante da variação
do parâmetro q
T
[1,1; 2,9], na temperatura artificial inicial T
0
= 100. Observa-se
que, com o aumento do valor de q
T
, o decaimento da temperatura é mais brusco.
Logo, valores menores para q
T
, deixam o processo de annealing mais suave.
Figura 24 Gráfico de T(t), onde T
0
= 100.
O Gráfico da Figura 25 mostra o comportamento da função g
qv
(Eq. 5),
mediante à variação de q
V
[1,1; 2,9], em diferentes temperaturas iniciais. É válido
lembrar que, os incrementos estão contidos na faixa de -1(180°) a 1(-180).
Lembramos que, no momento que q
V
= 1, a função g
qV
assume uma distribuição
gaussiana, a mesma da máquina de Boltzmann (CSA), porém quando q
V
= 2, a
função g
qV
assume uma distribuição Lorentziana, a mesma da máquina de Cauchy
(FSA).
Dependendo da temperatura, a variação de q
V
pode alargar ou estreitar a
distribuição. Ou seja, à medida que a temperatura diminui, menor será a chance de
que surjam grandes valores no incremento (Δφ).
Métodos Teóricos
45
-180
-90 0 180 90 -180 -90 0 180 90
A
B
C D
-180 -90 0 180 90 -180 -90 0 180 90
T = 0,1
T = 0,005
T = 0,05
T = 0,01
Figura 25 Gráfico de g
qV
(Δφ), para A) T
0
= 0,1; B) T
0
= 0,05; C) T
0
= 0,01; D) T
0
= 0,005.
O gráfico da Figura 26 mostra o comportamento da função de aceitação, P
qA
(Eq. 6), mediante à variação do parâmetro q
A
[1,1; 2,9], em diferentes temperaturas.
Percebe-se que, numa determinada temperatura, quanto maior o valor de q
A
maior
será o valor de P
qA
, num mesmo valor de ΔE. Isso implica numa maior possibilidade
de um determinado salto ser aceito quando o valor de q
A
é alto.
Nota-se, também, que o valor de ΔE e a probabilidade de aceitação são
inversamente proporcionais (Figuras 26A e 26B). Isto implica em restringir a
permissão a saltos muito altos em energia, entretanto, se a temperatura inicial for
alterada para valores maiores, P
qA
aumenta, conforme o gráfico da Figura 26A.
Como conseqüência, muitos dos passos longos, que na outra situação eram
rejeitados, poderão ser aceitos, ocasionando melhores resultados no processo
iterativo.
Métodos Teóricos
46
A B
T = 100 T = 10
Figura 26 Gráficos de P
qA
. Em A) T
0
= 100 e B) T
0
= 10.
3.3 Dinâmica Molecular (DM)
Por meio da técnica de Dinâmica Molecular (DM), pode-se simular o
movimento temporal de um sistema de partículas, como a simulação da trajetória
de cada átomo de uma macromolécula, fato que não ocorre nos métodos
estocásticos. Com o uso desta técnica, obtêm-se as flutuações das posições
(trajetórias) relativas dos átomos de uma macromolécula em função do tempo. Com
o uso de ferramentas de análise estatísticas, propriedades físicas macroscópicas
podem ser observadas. A partir deste estudo pode-se obter resultados que vão
desde a estrutura tridimensional até a função biológica da molécula [KARPLUS &
PETSKO (1990)].
A DM é um método escolhido quando se quer estudar propriedades
dinâmicas de um sistema molecular em detalhe atômico, observadas dentro de uma
escala de tempo acessível às simulações. A escala de tempo é uma das principais
limitações do método, pois, normalmente, abrange movimentos atômicos na escala
de dezenas até centenas de nanosegundos. As simulações de DM são também úteis
quando o sistema não pode ser estudado pelos métodos experimentais. Por
exemplo, quando não se consegue cristalizar ou solubilizar a proteína para que esta
seja estudada por difração de raios-X ou RMN, respectivamente.
Na DM, cada átomo possui uma energia potencial (Eq. 1) e,
conseqüentemente, sobre ele atua uma força externa. Esta força (F
i
) sobre cada
átomo i, do sistema (i = 1,2,3... até N) estudado é calculada a partir da derivada da
Função de Energia Potencial (Eq. 1) em relação a sua posição (r
i
) no espaço (Eq. 7).
(7)
=



Métodos Teóricos
47
De posse do valor da força e da massa do átomo em questão, utilizamos a
segunda lei de Newton para determinar a aceleração (Eq. 8) a que o átomo está
submetido.
(8)
Em seguida, com a aceleração, extraímos a propagação das posições em cada
incremento de tempo (δt) (curto passos de tempo, 10
-15
s, ordem da vibração das
ligações), pelo algoritmo de Leap-Frog (Eq. 9 e Eq. 10). Neste algoritmo, as
velocidades são calculadas, inicialmente, no instante t+δt/2, e são utilizadas para
calcular as posições r, no instante t+δt.
(9)
(10)
A velocidade obtida pelo algoritmo de Leap-Frog é calculada no intervalo de
meio passo no tempo (t+δt/2) e, desta forma, é utilizada para calcular as posições
r
i
, no instante t+δt. A vantagem deste algoritmo é que as velocidades são calculadas
explicitamente, porém, a desvantagem é que estas não são calculadas no mesmo
instante das posições. As velocidades no instante t podem ser aproximadas pela
relação descrita na Equação (11).
(11)
Desta forma, as simulações por DM utilizam as equações da mecânica
clássica, ou seja, as equações de Newton, para cada átomo e em cada incremento
de tempo. O processo mais dispendioso computacionalmente é, em geral, a
avaliação das forças para obtenção das acelerações. O tempo gasto no cálculo
dessas forças depende da complexidade da função de energia potencial de interação
entre os átomos.
O fluxograma da Figura 27 mostra de maneira simplificada a obtenção da
trajetória. A partir das posições iniciais, obtém-se a energia potencial para cada
átomo. A partir da derivada espacial da energia potencial, obtém-se a força, que
através da mecânica clássica calcula-se a aceleração sobre cada átomo. As
acelerações são inseridas no algoritmo de Leap-Frog (ou similar), para a predição
das novas posições e, em seguida, o processo é repetido [PASCUTTI, P. G. (2002)].
=
+ 
=
+
+
1
2

=
1
2


1
2
+
+
1
2

+
1
2
=

1
2
+
()
Métodos Teóricos
48
Posição dos átomos
Consegue a força
Consegue a aceleração
Nova posição
Novo incremento de tempo
(t+δt)
Energia potencial
=



=
+ 
=
+
+

2



+
1
2
=

1
2
+
()
Figura 27 Fluxograma simplificado do algoritmo da simulação de Dinâmica Molecular. Neste
fluxograma, muitos passos adicionais foram omitidos para maior simplificação, como, por exemplo, os
algoritmos que controlam a temperatura e a pressão.
3.3.1 Condições e Parâmetros das Simulações por DM
Neste trabalho, as simulações por DM foram realizadas no ensemble
Isobárico-Isotérmico (NPT), onde são constantes o número de moléculas, a
temperatura e a pressão, utilizando o pacote computacional GROMACS [LINDAHL, E.
et al. (2001)]. A temperatura e a pressão são controladas por técnicas de
acoplamento [BERENDSEN, H. J. C. et al. (1984)]. A caixa de simulação escolhida
foi a octaédrica, onde, dependendo do sistema estudado, foram adicionadas
moléculas de água, ou moléculas de água e de 2,2,2-trifluoretanol (TFE),
representando uma solução na proporção de 70/30 (v/v). Todos os sistemas estão
sob condições periódicas de contorno (CPC). A escolha do campo de forças depende
do sistema estudado.
O algoritmo LINCS [HESS, B. et al. (1997)] foi empregado para vincular os
comprimentos de ligação e o algoritmo SETTLE [MIYAMOTO, S. & KOLLMAN, P. A.
(1992)] para a geometria das moléculas do solvente.
Todos os sistemas foram previamente otimizados antes da simulação por
Métodos Teóricos
49
DM. Primeiramente, foi realizada uma otimização apenas dos átomos de hidrogênio
do sistema com o método de Máximo Declive (do inglês, Steepest Descent).Em
seguida todo o sistema foi otimizado, utilizado novamente o método de Máximo
Declive. Ainda na otimização, foi utilizando o método de Gradiente Conjugado. Para
finalizar, foi realizada uma simulação por DM com restrição de posição dos átomos
pesados do sistema. Esta etapa é realizada para uma maior acomodação das
moléculas de solvente no sistema. Na Tabela 1 é mostrado o número de passos ou o
tempo para cada etapa da otimização.
Tabela 1 Número de passos ou tempo para cada etapa da otimização.
PARÂMETROS PARA OTIMIZAÇÃO DOS SISTEMAS
MÉTODOS
NÚMERO DE PASSOS OU TEMPO
Máximo Declive (com restrição de
posição dos átomos pesados do sistema)
5000 passos
Máximo Declive (sem restrição de
posição)
5000 passos
Gradiente Conjugado
5000 passos
Dinâmica Molecular (com restrição de
posição dos átomos pesados do sistema)
5 ns
Mais detalhes das condições e parâmetros utilizados serão apresentados no
capítulo de Resultados e Discussão.
3.4 "Cluster" de Computadores
Para conseguir alcançar nosso objetivo, deparamos com a necessidade de
utilizar uma tecnologia de alto desempenho computacional (clusters) capaz de
paralelizar os algoritmos e analisar o grande volume de dados com a rapidez
necessária ao desenvolvimento da pesquisa.
A evolução nos sistemas de hardware e softwares proporcionou o surgimento
do processamento paralelo e as grades (grids) computacionais que permitem
cálculos de grande complexidade e refinamento de modelos e algoritmos.
A computação vem revolucionando a pesquisa científica, exigindo dos
pesquisadores conhecimento tanto de programas como de componentes de
hardware.
Neste tópico, apresentaremos os conceitos básicos, exemplificado com a
montagem e configuração do cluster que construímos no Laboratório de Modelagem
e Dinâmica Molecular (LMDM) (Figura 28).
Métodos Teóricos
50
Figura 28 Foto do "Cluster" LMDM utilizado para executar as ferramentas para o
desenvolvimento deste trabalho.
3.4.1 Metodologia para a Montagem do Cluster
Equipamentos com no mínimo 16 processadores, são uma classe especial de
cluster denominado Beowulf [http://www.beowulf.org/]. Eles têm se tornado muito
populares como uma opção barata e de alto desempenho.
Os componentes de hardware usados na montagem de um cluster de
computadores Beowulf, geralmente, são:
Um servidor: computador que gerencia as áreas dos usuários e os
programas científicos, além de estabelecer o contato entre a rede local
e a rede externa;
Computadores para serem usados como “clientes”;
Um Switch: Aparelho que estabelece a comunicação entre o servidor e
as máquinas “clientes”;
Duas placas ethernet de rede instaladas no servidor;
Placas de rede ethernet instaladas nas máquinas “clientes”;
Métodos Teóricos
51
Cabos de rede entrelaçados. Para a construção do cluster LMDM foi
utilizado o cabo de rede do tipo UTP, categoria 6 (cat6), que possui
velocidade de até 1.000 Mbps.
O cluster construído no LMDM dispõe de 16 máquinas “clientes”
conectadas por rede via um switch (também podem ser conectadas via hub)
com o servidor (Figura 29). As placas de rede do servidor devem ser configuradas
como mostrado na Figura 29. Uma das placas é destinada ao contato direto com a
internet, usando um endereço válido, no nosso caso usamos 146.164.x.x para o
domínio biof.ufrj.br. A segunda placa é destinada à rede interna, que deve ser
reconhecida apenas pela máquina servidora, onde o IP usado é fixo, ou seja, não
roteável (DHCP
1
). No nosso caso configuramos nossa rede interna com
endereçamento (192.168.x.x), e máscara 255.255.255.0.
Servidor
Switch
Cliente 1
Cliente 2
Cliente 3
Cliente 4
Cliente 5
Cliente N
Rede externa 146.164.x.x
Rede interna
192.168.x.x
Figura 29 Esquema básico da arquitetura de um cluster mostrando a distribuição das
máquinas “clientes” interligadas ao servidor via um switch.
1
DHCP, ou Dynamic Host Configuration Protocol, é um protocolo de serviço TCP/IP que oferece
configuração dinâmica de terminais, com concessão de endereços IP de host e outros parâmetros de
configuração para clientes de rede.
Métodos Teóricos
52
As configurações das máquinas e das peças implementadas no cluster
são:
Equipamento
Especificação
Servidor
Placa Mãe
Intel® DG965WHMKR
Processador
Intel® Core2Quad 6600 @ 2.4GHz
Memória RAM
8Gb DDR2 800Mhz Kingston
HD
11.60 Tb
Placa de rede
Encore ENLGA-1320 Gigabit
Máquinas clientes
Placa Mãe
Intel® S5000VSASATAR
Processador
Intel® Xeon®E5420 @ 2.5 GHz
Memória RAM
4Gb DDR2 667MHz ECC KVR667D2D8F5
HD
--
Placa de rede
Dual Gb Ethernet ONBOARD
Switch
DELL Powerconnect 2724 24portas
10/100/1000 BASE-T
Utilizamos o sistema operacional LINUX UBUNTU 8.04LTS Hardy Heron,
kernel 2.6.24-20, para servir de interface para as configurações do cluster. A opção
pelo LINUX [TORVALDS, L. B. & DIAMOND, D. (2001)] foi feita por diversos motivos,
onde os principais são a estabilidade e a robustez, além de possuir licença de uso
livre. Depois desse ponto, passamos a configurar alguns arquivos para o
funcionamento correto do cluster.
O primeiro passo foi configurar a rede nas máquinas do cluster, dispostas em
uma topologia de rede física em estrela
1
, utilizando uma rede Ethernet Gigabits/s,
ligadas com um cabo de rede trançado UTP (conectores RJ45), categoria 6 (cat6).
Para a comunicação entre as máquinas, foram utilizados os pacotes RSH e SSH.
A maioria dos programas científicos possui a implementação paralela
disponível. Eles conseguem trabalhar tanto em ambientes seqüenciais quanto em
paralelo, como por exemplo, o pacote computacional GROMACS [LINDAHL, E. et al.
(2001)]. Estes programas, que são paralelizáveis, utilizam-se de bibliotecas
específicas envolvidas nas trocas de mensagens (envio e gerenciamento) entre os
processadores na rede local, como por exemplo, a biblioteca LAM/MPICH (Local
Area Multicomputer/Message Passing Interface: http://www.lam-mpi.org). Esta
1
Estrela - A topologia estrela é caracterizada por um elemento central que "gerencia" o fluxo de dados
da rede, estando diretamente conectado (ponto-a-ponto) a cada nó, dsurgiu a designação "Estrela".
Toda informação enviada de um para outro deverá, obrigatoriamente, passar pelo ponto central, ou
concentrador, tornando o processo muito mais eficaz, que os dados não irão passar por todas as
estações.
Métodos Teóricos
53
paralelização das execuções dos programas científicos diminui muito o tempo de
processamento das tarefas por permitir serem executados utilizando-se mais de um
processador.
Para o gerenciamento do cluster (como por exemplo, o sistema de fila) e o
controle da distribuição dos processos nas máquinas clientes, utilizamos o conjunto
de programas TORQUE/MAUI
1
.
1
O programa MAUI é um escalonador de tarefas configurável e otimizado para clusters.
Resultados e Discussão
54
4 Resultados e Discussão
Nesse capítulo seo apresentados os resultados e discussão das simulações
estocásticas e de Dinâmica Molecular.
Em primeiro lugar, analisou-se a eficiência do programa THOR/GSA para a
predição de estrutura de polialaninas. Após estudos prévios, no qual foram
utilizados modelos de 13 alaninas (13-ala) e 18 alaninas (18-ala) [AGOSTINI, F. P.
(2008)], demos continuidade, neste trabalho, com o estudo do modelo de
22 alaninas (22-ala). Aumentando a complexidade do sistema, com a adição de
mais dois graus de liberdade a cada novo resíduo de alanina, esperamos obter um
melhor entendimento dos parâmetros que controlam o algoritmo do GSA.
O modelo de polialaninas foi escolhido por ser um modelo ideal, que
apresenta alta estabilidade termodinâmica e o mínimo global bem conhecido. Sabe-
se que cadeias de polialaninas assumem conformação em hélice-alfa em ambientes
com constante dielétrica baixa [AGOSTINI, F. P. et al. (2006)].
Após os ajustes no programa, a calibração dos parâmetros q
A
, q
V
e q
T
do GSA
e a criação de protocolos para o estudo com o modelo de 22-ala, tivemos como
objetivo estudar o desempenho do THOR/GSA em estruturas mais complexas.
Foram escolhidos três modelos reais heterogêneos, o mastoparano-X (código
do PDB: 1A13), por se tratar de um peptídeo pequeno, contendo 14 aminoácidos
(INWKGIAAMAKKIL), que assume uma estrutura em hélice-alfa em ambientes
anfifílicos. Além do mastoparano-X, selecionamos também a mini-proteína Trp-cage
(código PDB 1L2Y) e a proteína Villin Headpiece (código PDB 1VII). O Trp-cage foi
escolhido devido a sua cinética rápida de enovelamento, alta estabilidade
termodinâmica, tamanho pequeno, contendo 20 aminoácidos
(NLYIQWLKDGGPSSGRPPPS), e por ser um dos modelos mais bem estudados
experimentalmente e por simulações computacionais.
A Villin Headpiece foi escolhida por ser uma proteína pequena de 36
aminoácidos (MLSDEDFKAVFGMTRSAFANLPLWKQQNLKKEKGLF), que apresenta
um enovelamento rápido e independente, formando um feixe de três hélices-alfa
estabilizado por contatos hidrofóbicos. Além disso, a Villin Headpiece é comumente
Resultados e Discussão
55
estudada por métodos computacionais de Dinâmica Molecular devido ao seu
pequeno tamanho. Ela foi uma das primeiras proteínas a ter seu enovelamento
simulado, com detalhes atômicos, pelo projeto Folding@Home
1
, utilizando a
computação paralela em larga escala [JAYACHANDRAN, G. et al. (2006)].
1
Folding@home: é um projeto de computação distribuída, baseado na oferta voluntária de recursos
de processamento de pessoas de todo o mundo. Este projeto procura determinar a estrutura
tridimensional das proteínas que podem ser utilizadas na pesquisa de medicamentos que possam
levar à cura de doenças como a AIDS, Malária e Alzheimer. Maiores detalhes podem ser encontrados
em: http://folding.stanford.edu/
Resultados e Discussão
56
4.1 Modelo de Polialaninas
Apesar da glicina ser o aminoácido mais simples dos 20 encontrados na
natureza (apresenta apenas um átomo de hidrogênio como cadeia lateral), o homo-
peptídeo de alanina (resíduo de aminoácido com apenas um grupo metila como
cadeia lateral) é o modelo mais simples a conferir estabilidade na formação de
lices [CHAKRABARTTY, A. et al. (1994); FERSHT, A. (1999)]. A alta capacidade do
homo-peptídeo de alanina formar hélices despertou o interesse de diversos grupos
no seu estudo [POLAND, D. & SCHERAGA, H. A. (1970); OKAMOTO, Y. & HANSMANN, U.
H. E. (1995); KEMP, J. P. & CHEN, Z. Y. (1998); ALVES, N. A. & HANSMANN, U. H. E.
(2000); VAN GIESSEN, A. E. & STRAUB, J. E. (2005); IRETA, J. et al. (2005); MORET, M. A.
et al. (2002); AGOSTINI, F. P. et al. (2006)]. Os peptídeos com estrutura em lice
apresentam um desafio menor aos métodos de predição de estrutura, possivelmente
por se tratar de um elemento de estrutura secundária que é estável por si mesmo,
diferente das estruturas secundárias em fitas-beta, por exemplo, que são estáveis
apenas quando participam de uma folha-beta [NELSON, D. L. & COX, M. M. (2004)].
Os estudos sobre os modelos de polialaninas mostraram uma propriedade
muito importante, na qual, independente do meio em que estejam inseridas,
possuem uma alta capacidade de formar hélices [CHOU, P. Y. & FASMAN, G. D. (1978);
CHAKRABARTTY, A. et al. (1994); O'NEIL, K. & DEGRADO, W. (1990)].
Outra característica importante dos homo-peptídeos de alanina é que o
resíduo de alanina possui uma cadeia lateral simples (sem ângulos de torção, χ), o
que faz com que esses homo-peptídeos apresentem uma baixa complexidade,
quando comparados com outros polipeptídeos. O grupo metila (CH
3
) da cadeia
lateral do resíduo de alanina é caracterizado como apenas uma partícula (modelo
do átomo unido), sem polaridade ou carga, pelo campo de forças que o programa
THOR/GSA (GROMOS96) utiliza. Por ser um hidrocarboneto alifático, que é
baixamente polarizával, o grupo metila não contribui para as interações
eletrostáticas do homo-peptídeo de alanina.
Em função destas características, os homo-peptídeos de alanina são modelos
ideais para testar, calibrar e refinar vários métodos de predição de estrutura de
proteínas [HUMMER, G. et al. (2000); HUO, S. & STRAUB, J. E. (1999); KLEIN, C. T. et al.
(1996); LEVY, Y. et al. (2001); SHI, Z. et al. (2002); WANG, L. et al. (1995)].
Nosso grupo vem estudando os modelos de polialaninas utilizando o
programa THOR/GSA mais de 10 anos [MORET, M. A. (1996); MORET, M. A. et al.
Resultados e Discussão
57
(1998); MORET, M. A. (2000); MORET, M. A. (2002); AGOSTINI, F. P. et al. (2006);
FERNANDES, T. V. A. (2007); AGOSTINI, F. P. (2008)].
Os modelos de polialaninas foram escolhidos como ponto de partida para o
ajuste e refinamento do THOR/GSA pois, a partir desse peptídeo de estrutura
bastante conhecida, é possível avaliar com maior precisão o momento e as
condições em que o programa atinge o resultado esperado.
Depois dos ajustes e calibrações iniciais do algoritmo com os modelos de
polialaninas, nosso grupo aumentou a complexidade dos modelos para refinar o
programa, almejando que, no futuro, possamos garantir que as simulações de
enovelamento de proteínas sejam realizadas com um maior grau de confiabilidade
pelo THOR/GSA.
Nosso grupo, ao estudar o homo-peptídeo contendo 18 resíduos de alanina
(18-ala) [AGOSTINI, F. P. et al. (2006)], varrendo os possíveis valores para os
parâmetros q
A
, q
V
e q
T
, observou uma tenncia inversa dos valores do parâmetro
que controla o decaimento da temperatura (q
T
) em relação aos valores do parâmetro
que controla a visita à superfície de energia (q
V
) para encontrar as estruturas de
menor energia, ou seja, quando o parâmetro da temperatura aumenta, o de
visitação diminui, conforme pode ser observado na Figura 30, disponível no artigo
de Agostini [AGOSTINI, F. P. et al. (2006)]. Apenas os valores de parâmetros que
resultaram em estruturas de hélice-alfa foram plotados no gráfico.
Figura 30 Variação dos parâmetros do GSA. qT vs qA e qT vs qV [Reproduzido de AGOSTINI, F.
P. et al. (2006)].
Resultados e Discussão
58
Entretanto, nesse trabalho não ficou claro o comportamento da relação entre
q
A
e q
T
.
A fim de pesquisar melhor a relação entre os parâmetros q
A
, q
V
e q
T
,
observada por Agostini [AGOSTINI, F. P. et al. (2006)], e ratificar os melhores valores
dos parâmetros para enovelamento do homo-peptídeo de alanina realizamos a
varredura sistemática dos parâmetros do GSA (q
A
, q
V
e q
T
) (variando os valores de
1,1 a 2,9), utilizando o modelo de homo-peptídeo de 22 resíduos de alanina (22-ala).
O intervalo [1,1 a 2,9] foi escolhido cuidadosamente, uma vez que as funções Pq
A
,
gq
V
e Tq
T
podem variar sem nenhum tipo de artifício. Quando q
V
3, a função de
distribuição torna-se não-normalizável [AGOSTINI, F. P. (2008)]. Valores maiores do
que esse intervalo para q
A
e q
T
foram descartados, pois aumentariam a possibilidade
de aceitação de estruturas consideradas “ruins” ou resultariam em um decaimento
da temperatura cada vez mais rápido, o que poderia tornar o algoritmo altamente
ineficiente. E ainda, estudos anteriores mostraram que o uso de valores negativos
para q
A
também tornariam o algoritmo ineficiente [AGOSTINI, F. P. (2008)].
O THOR/GSA foi calibrado para usar uma constante dielétrica (ε) igual a 2
(simulando um ambiente continuo hidrofóbico) para que as interações eletrostáticas
fossem intensificadas, acelerando assim, o processo de enovelamento. A
temperatura (ruído) artificial inicial (T
0
) foi ajustada para 100. Cada simulação
contou com 5.000.000 passos para cada conjunto de parâmetros. A estrutura
inicial da 22-Ala foi ajustada numa conformação da cadeia principal totalmente
estendida da 22-ala (Figura 31), ou seja, os ângulos φ = ψ = 180°. Durante os
cálculos, os ângulos φ e ψ tinham total liberdade de rotação. Os comprimentos e
ângulos de ligação foram fixados em seus valores ideais de equilíbrio, para acelerar
os cálculos. Os detalhes do arquivo de entrada (*.IN) da 22-alanina para o programa
THOR/GSA podem ser vistos no apêndice A.
Figura 31 Modelo de homo-peptídeo contendo 22 resíduos de alanina na conformação de
fita-beta.
Para avaliar a confiabilidade dos modelos encontrados durante a varredura
dos parâmetros do GSA, compara-se a estrutura de menor energia com a de
referência, que pode ser a estrutura determinada por métodos experimentais
Resultados e Discussão
59
(Difração de Raio-X ou RMN). Esta comparação é realizada pelo cálculo do desvio da
raiz média quadrática (DRMQ, ou RMSD, do inglês Root Mean Square Deviation
Equação 12 [SPIEGEL, M. R. (1994)]) entre as duas estruturas (estrutura de
referência e o modelo gerado).
(12)
Na Equação (12), n é o número total de átomos; x
i
, y
i
e z
i
são as coordenadas
cartesianas (x, y e z) de cada átomo i; e x
ref
, y
ref
, z
ref
são as coordenadas cartesianas
do átomo na estrutura de referência.
Dentre as conformações encontradas pelo GSA, no estudo da 22-ala, a
conformação de menor energia (-68,47 kcal/mol) também foi a que apresentou o
menor desvio entre os átomos do carbono-α (Cα) da cadeia peptídica (Cα-DRMQ) da
estrutura de referência e da estrutura encontrada pelo GSA, 0,07 nm (Figura 32). É
válido ressaltar que, estruturas com os desvios (DRMQ) abaixo de 0,25 nm
apresentam um alto grau de similaridade com a estrutura de referência.
Figura 32 Modelo da 22-Ala obtido pelo algoritmo do GSA, com DRMQ de 0,07 nm e energia
de -68,46 kcal/mol, usando os parâmetros qA = 2,1; qV = 1,9 e qT = 1,7, função dielétrica ε = 2,
temperatura inicial T
0
= 100 e 5.000.000 de passos. Para o cálculo do DRMQ foi usada uma estrutura
de 22 alaninas em hélice-alfa. Estrutura com valores a baixo de 0,1 nm são consideradas excelentes
(muito próximas da estrutura de referência).
Os resultados obtidos para o homo-peptídeo 22-Ala mostraram uma relação
inversa entre q
V
e q
T
, como observado por Agostini no estudo com o homo-peptídeo
18-Ala (com o aumento dos valores de q
T
, os valores de q
V
diminuem) [AGOSTINI, F.
P. et al. (2006)]. Porém, encontramos uma relação direta entre o parâmetro de
temperatura e de aceitação das novas estruturas q
A
(com o aumento dos valores de
q
T
os valores de q
A
também aumentaram), que ainda não havia sido observado em
=
1
(
=1

)
2
+ (

)
2
+ (

)
2
Resultados e Discussão
60
trabalhos anteriores, como mostrado na Figura 33. Apenas os parâmetros das
estruturas com energia menor do que -30 kcal/mol foram plotadas no gráfico.
1,7; 2,1
1,7; 1,9
1,7; 2,1
1,7; 1,9
1,7; 2,1
1,7; 1,71,7; 1,7
1,9; 1,5
1,9; 1,7
1,9; 2,1
1,9; 1,31,9; 1,3
1,9; 1,5
2,1; 1,12,1; 1,1
2,1; 1,52,1; 1,5
2,1; 1,1
2,1; 1,3
2,1; 1,5
2,3; 1,12,3; 1,1
1,7; 1,9
1,7; 2,11,7; 2,1
1,7; 2,31,7; 2,3
1,7; 2,5
1,7; 2,7
1,9; 2,1
1,9; 2,51,9; 2,5
1,9; 2,7
1,9; 2,91,9; 2,9
2,1; 2,3
2,1; 2,52,1; 2,5
2,1; 2,7
2,1; 2,92,1; 2,92,1; 2,9
2,3; 2,7
2,3; 2,9
1,1
1,3
1,5
1,7
1,9
2,1
2,3
2,5
2,7
2,9
1,1 1,3 1,5 1,7 1,9 2,1 2,3 2,5 2,7 2,9
Parâmetros de Visitação (qV) e Aceitão (qA) do GSA
Parâmetro de Temperatura (qT) do GSA
qV
qA
Figura 33 Variação de qV e qA com qT para o polímero 22-ala.
Estudando o trabalho de Agostini, verificamos que muitas estruturas foram
aceitas para o estudo da relação entre os parâmetros. Aferimos que, se
aceitássemos apenas as estruturas com os valores de energia próximos a estrutura
de menor energia, observaríamos a mesma relação direta entre os parâmetros q
A
e
q
T
, encontrada no estudo com a 22-ala.
Além disso, os resultados mostraram que as faixas de valores ótimos dos
parâmetros q
A
, q
V
e q
T
para o enovelamento da 22-Ala (q
A
= 1,9-2,9; q
V
= 1,1-2,1;
q
T
= 1,7-2,3) estão inseridas naquelas encontradas no estudo com a 18-ala por
Agostini. Este refinamento possibilita uma maior precisão na escolha destes
parâmetros.
Resultados e Discussão
61
4.1.1 Análise Estatística
Quando o programa é executado repetidas vezes, porém, com diferentes
sementes no sorteio de números aleatórios, os resultados podem diferir. Para evitar
conclusões errôneas por causa desta sutileza, o ideal seria calcular a dia de um
número de simulações. Uma análise estatística é, portanto, feita nesse tópico.
Foram realizadas 400 corridas do algoritmo, partindo da conformação inicial
estendida (Figura 34). A temperatura inicial foi de T
0
= 100 e os valores de q
A
, q
V
e
q
T
foram escolhidos de acordo com os melhores obtidos no estudo da varredura da
22-ala (q
A
= 2,1; q
V
= 1,9; q
T
= 1,7). Foram executados 5.000.000 passos de
avaliações de energia a cada corrida.
O gráfico da Figura 34 mostra a flutuação do -DRMQ entre as estruturas
encontradas pelo GSA e a estrutura de referência (homo-peptídeo 22-Ala em hélice-
alfa). Estruturas com desvios abaixo de 0,25 nm apresentam um alto grau de
resíduos em hélice-alfa e, mesmo que a hélice-alfa não esteja totalmente formada,
podem ser consideradas aceitáveis.
Figura 34 -DRMQ das estruturas obtidas pelo GSA em relação a estrutura de referência
(22-ala em hélice-alfa), utilizando os melhores parâmetros obtidos com a varredura do homo-peptídeo
22-Ala (qA = 2.1; qV = 1.9 e qT = 1.7), 5000000 de passos, T
0
= 100.
Resultados e Discussão
62
A taxa de sucesso
1
foi de 13%. Essa taxa de sucesso é decorrente de
iniciarmos as corridas partindo de estruturas de baixa energia (estruturas
totalmente estendidas em fita-beta), ou seja, estruturas que dificultam a
convergência para a hélice, por estarem "aprisionadas" em um mínimo local de
energia. Já é sabido que, ao iniciar as execuções do THOR/GSA partindo de
estruturas de alta energia, a taxa de sucesso aumenta consideravelmente, como foi
visto no estudo com a 18-ala [AGOSTINI, F. P. et al. (2006)].
4.1.2 Conclusões Parciais dos Estudos com a 22-ala
As simulações com o modelo de polialanina foram apenas o passo inicial para
o estudo do método GSA aplicado ao problema do enovelamento de proteínas. O
modelo de polialaninas foi escolhido por ser simples (não carregado) e muito
estudado. Sabe-se que em ambientes hidrofóbicos formam hélices-alfa estáveis, o
que facilita o estudo.
Mediante a análise do cálculo do -DRMQ das conformações encontradas
pelo THOR/GSA em relação à estrutura de hélice-alfa de uma cadeia de
22 alaninas, usada como referência, observa-se que as estruturas de menor -
DRMQ coincidem com as de menor energia, o que mostra que os resultados obtidos
encontram-se em acordo com os resultados da literatura.
Além da relação inversa entre q
T
e q
V
encontrada no estudo com a 18-ala,
encontramos também uma relação direta entre os valores de q
T
e os valores de q
A
.
Resultado este que não havia sido observado no trabalho com a 18-ala [AGOSTINI, F.
P. et al. (2006). Esses resultados forneceram uma visão geral de como se comportam
os parâmetros do GSA no problema do enovelamento de proteínas, o que possibilita
uma maior precisão na escolha destes parâmetros.
A princípio, a convergência do método, mesmo usando valores ótimos para os
parâmetros q
A
, q
V
e q
T
, pode ser considerada baixa. Porém, a execução de 5 milhões
de passos do programa para peptídeos com as dimensões da 22-ala, ocorre em
poucos minutos em processadores convencionais. Em uma estratégia para predizer
estruturas sem referências conhecidas, podemos executar um número muito maior
de ciclos do programa, partindo de estruturas iniciais diferentes, e considerar que a
convergência seria atingida quando o limite inferior em energia não mais fosse
1
A taxa de sucesso é dada pela porcentagem de convergência das estruturas geradas pelo programa
na estrutura de referência. Para o cálculo utilizou-se -DRMQ ≤ 0,25 nm.
Resultados e Discussão
63
superado, e o DMRQ em relação à estrutura média nesse mínimo de energia, que
seria o global, não mais superaria 0,1 nm.
Como o método GSA tem se mostrado eficiente no estudo do enovelamento de
peptídeos [MORET, M. A. et al. (1998, 2000, 2001, 2002, 2005); PASCUTTI, P. G. et al.
(2005); AGOSTINI, F. P. et al. (2006)] e, desta forma, abrindo perspectivas para seu
emprego em diferentes problemas biológicos, foi realizado um estudo de
Ancoramento Molecular (Docking Molecular), em que o GSA foi aplicado para avaliar
a interação entre o fator de crescimento de fibroblastos (FGF) e dímeros de heparina
[PITA, S. S. R. et al. (2008)].
4.1.3 Ancoramento Molecular utilizando o GSA
Os primeiros algoritmos de Ancoramento Molecular (Docking Molecular) foram
desenvolvidos no início da década de 1980 [KUNTZ, I. D. et al. (1982)], e a partir daí,
vários métodos foram estudados visando o desenvolvimento da técnica.
Atualmente, um dos grandes problemas do Ancoramento Molecular é a
flexibilidade molecular [BROOIJMANS, N. & KUNTZ, I. (2003); VERLI, H. & BARREIRO, E.
J. (2005); TEAGUE, S. J. (2003)]. O tratamento da flexibilidade molecular muitas vezes
é inviável devido, principalmente, ao grande número de graus de liberdade da
proteína (ou molécula receptora), o que gera um alto custo computacional.
Os primeiros algoritmos eram chamados de algoritmos de docking rígido, por
tratar ambos ligante e receptor como moléculas rígidas, considerando apenas
alguns movimentos translacionais e rotacionais da molécula ligante. Estes
algoritmos, ultimamente, estão ultrapassados, por não representarem a realidade.
Atualmente, existem muitos algoritmos que incluem a flexibilidade do ligante,
os chamados algoritmos de docking flexível. Estes algoritmos incluem não apenas
os graus de liberdade translacionais e rotacionais, mas também os
conformacionais.
Os dois exemplos de Ancoramento Molecular citados acima, ainda tratam a
proteína (ou receptor) de forma rígida. Atualmente, apenas alguns algoritmos
consideram flexíveis, simultaneamente, ambos ligantes e receptores. Dessa forma,
muitos estudos vêm sendo realizados para a inclusão da flexibilidade na proteína
[PITA, S. S. R. et al. (2008); BROOIJMANS, N. & KUNTZ, I. (1996); OSTERBERG, F. et al.
(2002); VERDONK, M. L. et al. (2003)].
Resultados e Discussão
64
Nesta corrida pelo estudo do Ancoramento Molecular, considerando tanto a
proteína como o ligante flexível, nosso grupo desenvolveu um programa de
Ancoramento Molecular flexível, o GSADOCK, baseado no Generalized Simulated
Annealing (GSA).
O que nos levou a escolher o GSA foi, justamente, a sua capacidade de
convergir, rapidamente, uma macromolécula para a sua conformação de menor
energia (mínimo global). Pois além da flexibilidade do ligante e da proteína, um
algoritmo de Ancoramento eficiente tem que demonstrar acurácia e velocidade nos
seus resultados.
Com a finalidade de avaliar o comportamento e a eficiência do GSADOCK,
estudou-se a formação do complexo entre o fator de crescimento de fibroblastos
(Fibroblast Growth Factor - FGF) e a heparina, testando-se toda a superfície da
proteína para encontrar o sítio de ligação.
Sabe-se que a formação desse complexo é governada, principalmente, pela
atração eletrostática entre os açúcares sulfatados negativamente da heparina com
os grupos carregados positivamente do FGF, sendo, portanto, um excelente modelo
de estudo para o Ancoramento Molecular.
O objetivo deste trabalho consiste, principalmente, na determinação da
melhor combinação dos parâmetros q
A
, q
V
e q
T
, que fornecerá o melhor resultado da
energia de interação para o ancoramento de um dissacarídeo de heparina com a
superfície do sítio de ligação do FGF.
Para determinar a melhor combinação dos parâmetros, uma varredura
sistemática dos parâmetros do GSA (q
A
, q
V
e q
T
) foi realizada. Nas simulações,
considerou-se o meio continuo com uma constante dielétrica (ε) igual a 4. Com a
constante dielétrica baixa, aumenta-se a intensidade das forças de interação
eletrostática entre a proteína e o açúcar, uma vez que os grupos sulfatados da
heparina interagem com os catiônicos do FGF. Empregou-se uma temperatura
artificial inicial de T
0
= 1,0. Cada simulação teve 500.000 passos para cada
conjunto de valores dos parâmetros.
Os resultados demonstraram que o GSADOCK é computacionalmente rápido
na determinação do complexo FGF-heparina, com uma boa concordância com a
estrutura deste complexo, determinado por Cristalografia e Difração de Raios-X
[FAHAM, S. et al. (1996)]. A acurácia, outra característica importante para os
algoritmos de Ancoramento Molecular, foi primeiramente avaliada pela verificação
de um grande número de conformações do polissacarídeo encontradas no sítio de
Resultados e Discussão
65
ligação (Figura 35, retirada do artigo que está em ANEXO [PITA, S. S. R. et al. (2008)]).
Em resumo, os resultados do GSADOCK mostraram que ele pode ser um excelente
recurso na busca de compostos biológicos, especialmente como uma ferramenta de
descoberta de fármacos.
Além disso, verificamos pela varredura de q
A
, q
V
e q
T
, que as faixas dos
melhores parâmetros para o estudo do Ancoramento Molecular são as mesmas
encontradas no estudo do enovelamento protéico.
Figura 35 Representação do FGF com os principais resíduos carregados do sítio de ligação
da heparina (Lys111, Lys120, Arg121, Lys126, Gln124). Na forma de sticks, estão representadas
conformações da molécula de heparina. Em preto, a conformação da heparina que apresentou menor
energia quando ancorada no FGF (qT = 1,7; qA = 1,3; qV 1,7). Em marrom, a conformação da molécula
da heparina que apresentou o segundo melhor ancoramento com o FGF (qT = 1,5; qA= 1,3; qV 1,5). Os
resultados obtidos pelo GSA são comparados com o complexo FGF-heparina (estrutura colorida para a
heparina), determinada experimentalmente (código do PDB: 1BFB).
Resultados e Discussão
66
4.2 mastoparano-X
Os mastoparanos fazem parte da família dos peptídeos antimicrobianos e são
representados por peptídeos curtos e catiônicos extraídos do veneno de vespas
[NAKAGINA, T. et al. (1986)]. Assim como todos os peptídeos antimicrobianos, eles
apresentam grande diversidade de atividade biológica, que depende de parâmetros
como sequência primária, cationicidade, anfipaticidade e hidrofobicidade
[GIANGASPERO, A. et al. (2001)]. Geralmente, estes peptídeos adquirem a
conformação helicoidal anfipática, quando estão interagindo com biomembranas
[KATSU, T. et al. (1989)]. Porém, quando estão em solução aquosa, os mastoparanos
apresentam-se desestruturados [CHUANG, C. C. et al. (1996)]. Esta característica de
ser ao mesmo tempo solúvel e sem estrutura em água e capaz de interagir com a
membrana estruturando-se, deve-se ao fato dos resíduos hidrofóbicos estarem
intercalados ao longo da cadeia, possibilitando a formação de uma face hidrofóbica
quando em hélice [KONNO, K. et al. (2000)]. Acredita-se que os peptídeos, por serem
catiônicos, são atraídos para a membrana plasmática devido à atração eletrostática
entre as superfícies microbianas carregadas negativamente e a carga catiônica dos
peptídeos [KONNO, K. et al. (2000)].
O mastoparano-X (MP-X) é um peptídeo pequeno (239 átomos, 1,65 kDa),
contendo 14 resíduos de aminoácidos (INWKGIAAMAKKIL) extraído do veneno da
vespa xanthoptera [HIRAI, Y. et al. (1979)].
O MP-X apresenta, principalmente, atividade antimicrobiana e hemolítica.
Quando o MP-X se liga à membrana plasmática, ocorre o aumento da
permeabilidade da membrana que, geralmente, resulta no extravasamento de
eletrólitos, e a morte da célula [MATSUZAKI, K. et al. (1996); WHILES, J. A. et al. (2001);
TOSSI, A. et al. (2000)].
Estudos de Dicroísmo Circular (CD) e RMN mostraram que o MP-X, assim
como outros da família dos mastoparanos, apresenta conformação em hélice-alfa
anfipática na presença de membranas aniônicas, zwiteriônicas (i.e., que não
apresentam carga líquida) e em ambientes que mimetizam o meio apolar, como
misturas de 2,2,2-trifluoretanol (TFE) e água [COSTA, S. B. C. (2006)].
O TFE é um co-solvente indutor e estabilizador de estrutura secundária
[ROCCATANO, D. et al. (2002); dos SANTOS, C. M. P. et al. (2004); BUCK, M. (1998);
FIORONI, M. et al. (2000); CHUANG, C. C. et al. (1996); HIGASHIJIMA, T. et al. (1983);
IFRAH, D. et al. (2005)], utilizado na determinação da estrutura do MP-X e de outros
Resultados e Discussão
67
peptídeos [KUSUNOKI, H. et al. (1998); COSTA, S. B. C. (2006)]. Este co-solvente possui
a capacidade de mimetizar a membrana plasmática em solução aquosa, por formar
aglomerados (clusters), proporcionando ambientes com separação de fases
hidrofóbica e hidrofílica. Isto se deve à estrutura anfifílica do TFE (Figura 36), que
contém um grupo hidroxila, responsável pela formação de ligações hidrogênio com
grupos hidrofílicos do peptídeo ou com as moléculas de água ou com outras
moléculas de TFE da solução, além de três átomos de flúor ligados à um mesmo
carbono, proporcionando um ambiente hidrofóbico [BUCK, M. (1998)].
Figura 36 Modelo em bastão-e-bola da estrutura do TFE.
Estudos experimentais mostram que proporções próximas de 30/70 de
TFE/água (v/v) são favoráveis a indução e estabilização de estruturas secundárias
de muitos peptídeos [HONG, D. P. et al. (1999); ROCCATANO, D. et al. (2002)].
A Figura 37 ilustra a estrutura determinada por RMN para o MP-X (código no
PDB: 1A13 [KUSUNOKI, H. et al. (1998)]). A estrutura do MP-X, determinada por RMN,
adota uma hélice-alfa anfipática do Trp3 até a Leu13 [KUSUNOKI, H. et al. (1998);
WAKAMATSU, K. et al. (1992)] em soluções de TFE/água à temperatura ambiente e
em pH fisiológico [CRANDALL, Y. M. & BRUCH, M. D. (2007)].
Figura 37 Estrutura do MP-X determinada por RMN (código do PDB: 1A13 [KUSUNOKI, H. et
al. (1998)]. A carga total do MP-X é de +4 devido aos resíduos carregados (Lys4, Lys11, Lys12) e ao N-
terminal. As cadeias laterais do MP-X estão representadas na forma de bastão (sticks).
Resultados e Discussão
68
4.2.1 Resultados do GSA para o MP-X
Com o objetivo de estudar o desempenho e eficiência do THOR/GSA em
estruturas mais complexas do que as polialaninas, utilizamos o MP-X por ser um
peptídeo pequeno que se estrutura na interface com ambientes apolares. Porém,
antes de apresentarmos os resultados, faremos algumas observações relevantes.
Começamos por ressaltar que as interações entre a cadeia peptídica e o
solvente, e também solvente-solvente, estão entre as mais importantes para o
enovelamento, conferindo a estabilidade estrutural das proteínas. Entretanto, o
programa THOR/GSA, até então, não continha nenhuma função que modelasse,
adequadamente, o solvente. No modelo de polialaninas, o uso de uma constante
dielétrica igual a 2 = 2, simulando um ambiente hidrofóbico contínuo) para
modelar o meio no qual o peptídeo estaria envolto, mostrou-se bastante apropriado.
Porém, o conceito de uma constante dielétrica é válido apenas para meios
homogêneos. Os ambientes devem ser tratados, preferencialmente, de forma
explícita. Contudo, uma alternativa de simular os efeitos do solvente, sem adicionar
qualquer molécula de solvente, explicitamente, é incluir um termo explícito de
energia de solvatação.
Neste trabalho, foi estudada a inclusão de um modelo de cálculo de energia
de solvatação na função que calcula a energia potencial, visto que, os peptídeos a
serem estudados são mais complexos e a conformação é dependente do solvente.
O cálculo da energia potencial no THOR/GSA, até então, era feito com o uso
de potenciais de torção, de Lennard-Jones (van der Waals) e de Coulomb
(eletrostático), do campo de forças GROMOS96. O potencial eletrostático leva em
consideração, de forma implícita, apenas o efeito de blindagem do solvente nas
interações através da constante dielétrica (ε), ou de uma função dielétrica
dependente da distância, ε(r).
Com o intuito de melhorar a maneira de modelar o solvente, foi introduzido
um termo simplificado de energia livre de solvatação descrito por Eisenberg e
McLachlan [EISENBERG, D. & McLANCHLAN, A. D. (1986)].
Sabendo-se que o efeito hidrofóbico é um dos componentes que determinam
o enovelamento de uma proteína, sendo proporcional à área de superfície acessível
ao solvente (SASA), o termo descrito por Eisenberg e McLanchlan calcula a energia
de solvatação pelo somatório da área de cada átomo acessível ao solvente
Resultados e Discussão
69
multiplicado por um parâmetro de tensão superficial (obtido a partir de dados
experimentais), como mostrado na Equação 13,
(13)
onde σ
i
é o parâmetro de tensão superficial do átomo i e A
i
é a área acessível ao
solvente do átomo i.
Dessa forma, o cálculo da nova energia potencial total incluída no
THOR/GSA é obtido pela Equação (14).
(14)
O termo de solvatação é, na verdade, uma penalidade energética que átomos
apolares recebem quando estão expostos ao solvente. Os valores dessa penalidade
foram calculados à partir de dados experimentais do coeficiente de partição dos
aminoácidos entre octanol e água (Tabela 2) [EISENBERG, D. & McLANCHLAN, A. D.
(1986)].
Tabela 2 Valores dos parâmetros de tensão superficial obtidos experimentalmente por
Eisenberg e McLanchlan [EISENBERG, D. & McLANCHLAN, A. D. (1986)].
Parâmetros de tensão superfícial
Tipo de átomo
(kcal/mol/Å
2
)
C
S
N
N
+
O
O
-
16
21
-6
-50
-6
-24
A Área Acessível ao Solvente (Solvent Accessible Surface - SAS) é calculada a
partir do algoritmo de Connolly [CONNOLLY, M. L. (1983)], no qual se considera que
cada átomo de uma macromolécula pode ser representado pelo seu respectivo raio
de van der Waals, da mesma forma que uma molécula de solvente, ou também
chamada de ponta de prova esférica, que em geral é uma molécula de água. A SAS
é, então, definida pelo desenho geométrico originado pelo centro da ponta de prova
({
}) =


=

[1 + cos(

=1
)] +
12
,

12
6
,

6

<
+
4
0


+


<
Resultados e Discussão
70
à medida que esta rola sobre a superfície de van der Waals da macromolécula [LEE,
B. & RICHARDS, F. M. (1971)].
Foi realizada a varredura dos parâmetros q
A
, q
V
e q
T
do GSA no intervalo
[1,1 a 2,9] para o peptídeo do MP-X, considerando a temperatura inicial T
0
= 100,
com mero de passos de 5 milhões (mesmas condições empregadas para a
varredura da 22-ala) [FERNANDES, T. A. V. (2007)]. Notou-se que, apesar da diferença
nas seqüências do MP-X e da polialanina, os mapas de energia das simulações
apontaram para as mesmas observações sobre os valores ótimos dos parâmetros q
A
,
q
V
e q
T
. O mesmo foi observado para o ancoramento heparina-FGF. Além disso, os
trabalhos da Agostini com outros peptídeos também apontaram para os mesmos
valores ideais para esses parâmetros [AGOSTINI, F. P. (2008)]. Resumindo, em todas
as simulações, observou-se sempre as mesmas faixas de melhores valores para os
parâmetros q
A
, q
V
e q
T
.
Desta forma, os resultados conseguidos neste trabalho com o MP-X foram
alcançados utilizando uma série de melhores parâmetros q
A
, q
V
e q
T
[q
A
= 2.1,
q
V
= 1.9 e q
T
= 1.7], empregando o mesmo valor de temperatura/ruído inicial
(T
0
= 100) e número de passos (5.000.000).
Uma observação importante refere-se ao número de graus de liberdade nos
ângulos diedrais do MP-X. Devido às cadeias laterais mais extensas dos
aminoácidos do MP-X, conferiu-se liberdade de rotação não apenas aos ângulos φ e
ψ da cadeia principal, como feito na alanina (a cadeia lateral da alanina é
constituída apenas por um grupo metil), como também aos ângulos diedrais χ das
cadeias laterais dos aminoácidos do MP-X. O detalhe do arquivo de entrada (*.IN) do
MP-X necessário para o programa THOR/GSA pode ser encontrado no apêndice A.
Em todas as simulações o programa partiu de uma conformação inicial totalmente
estendida do MP-X (Figura 38), ou seja, os ângulos φ = ψ = χ=180°. Além disso, o N-
terminal do peptídeo foi tratado como um grupo carregado positivamente (NH3
+
) e o
C-terminal foi amidado, como nos trabalhos experimentais. Para efeito de
comparação foram realizados cálculos com e sem o termo de energia de solvatação.
Resultados e Discussão
71
Figura 38 Conformação estendida do MP-X (Ile-Asn-Trp-Lys-Gly-Ile-Ala-Ala-Met-Ala-Lys-
Lys-Leu-Leu-NH2).
Foram realizadas 50 simulações com o termo de energia de solvatação (COM
SAS) e outras 50 sem o termo de energia de solvatação (SEM SAS) (Figura 39a), na
qual apenas a semente para a geração do número aleatório era alterada.
Examinando todas as estruturas, verifica-se que a diferença da média do
cálculo de -DRMQ (a estrutura de referência usada foi a estrutura do MP-X
determinada por RMN, cód. PDB 1A13) entre as estruturas obtidas com o termo de
energia de solvatação (COM SAS) e as estruturas sem este termo (SEM SAS) foi de
apenas 0,06 nm (média de 0,52 nm para as estruturas encontradas sem o termo de
energia de solvatação e 0,46 nm, com o termo).
A estrutura de menor energia (-32,95 kcal/mol), que também apresentou o
menor -DRMQ (0,34 nm) em relação à estrutura utilizada como referência
(estrutura do PDB), foi encontrada pelo programa que usando o termo de energia de
solvatação (Figura 39a). A energia da estrutura determinada experimentalmente,
calculada pelo GSA, foi de -53,07 kcal/mol.
A diferença entre o -DRMQ da estrutura de menor energia encontrada
COM SAS e o da estrutura de menor energia encontrada SEM SAS foi de apenas
0,03 nm.
A sobreposição da estrutura obtida com o GSA de menor -DRMQ
(0,34 nm), em relação à estrutura do PDB está representada na Figura 39b.
Resultados e Discussão
72
A
B
Figura 39 Resultados do THOR/GSA para o MP-X. (A) Gráfico relacionando o -DRMQ das
estruturas encontradas pelo THOR/GSA em relação à estrutura de referência (estrutura do MP-X
depositada no PDB [cód. PDB 1A13]). Em vermelho estão representadas as 50 estruturas encontradas
com o THOR/GSA sem o termo de energia de solvatação (SEM SAS), e em preto estão representadas as
50 estruturas encontradas através do THOR/GSA com o termo de energia de solvatação (COM SAS).
(B) Sobreposição da estrutura de menor energia (-32,95 kcal/mol) encontrada e que também apresenta
o menor Cα-DRMQ (0,34 nm) (estrutura verde) em relação à estrutura depositada no PDB, 1A13
(estrutura azul). Em destaque (na forma de sticks) a cadeia lateral do resíduo de Asn2 em ambas as
estruturas.
Resultados e Discussão
73
As pequenas alterações nos resultados da comparação do programa COM
SAS e SEM SAS podem resultar do pequeno tamanho do MP-X, no qual
praticamente todos os átomos da cadeia polipeptídica estão expostos ao solvente, o
que torna de pouco efeito o cálculo da SAS.
A estrutura de menor energia obtida pelo GSA sem o cálculo do termo de
energia de solvatação apresentou uma energia de -29,18 kcal/mol e o Cα-DRMQ de
0,37 nm.
Com o intuito de melhorar a estrutura de menor desvio encontrada pelo GSA
foi utilizada a técnica de Dinâmica Molecular.
4.2.2 Resultados da Dinâmica Molecular para o MP-X
O método de Dinâmica Molecular (DM) foi escolhido nesta etapa do trabalho,
pelo fato de descrever o solvente de forma explícita (ao contrário dos métodos
estocásticos) [COUTINHO, K. (1997)]. Cabe ressaltar que, uma vantagem óbvia da DM
sobre os métodos estocásticos consiste no fato das simulações por DM permitirem
seguir uma trajetória do sistema. Além disso, uma estrutura pré-enovelada tem
grandes chances de concluir o enovelamento rapidamente na simulação por DM.
Utilizamos também o todo de DM para estudar o comportamento das
estruturas completamente estendidas do MP-X em solução de TFE/água e com isso
obter resultados para comparar com os resultados obtidos a partir da estrutura do
THOR/GSA.
Foram preparados quatro sistemas, a serem estudados por simulações de
DM.
I. Sistema 1
Sistema Controle
Estrutura inicial
Estrutura do PDB (1A13)
Solvente
H
2
O/TFE 70:30 (v:v)
Temperatura
300 K
Pressão
1 atm
II. Sistema 2
Sistema da conformação de menor energia encontrada
pelo GSA
Estrutura inicial
Estrutura de menor energia
encontrada pelo GSA
Solvente
H
2
O/TFE 70:30 (v:v)
Temperatura
300 K
Pressão
1 atm
Resultados e Discussão
74
III. Sistema 3
Sistema da conformação estendida à 300 K
Estrutura inicial
Estrutura estendida
Solvente
H
2
O/TFE 70:30 (v:v)
Temperatura
300 K
Pressão
1 atm
IV. Sistema 4
Sistema da Conformação estendida sobre à qual
aplicou-se Annealing por DM
Estrutura inicial
Estrutura estendida
Solvente
H
2
O/TFE 70:30 (v:v)
Temperatura
Annealing (iniciando a 400K
e sendo diminuída gradati-
vamente até 300 K
Pressão
1 atm
O primeiro sistema, denominado sistema controle, foi elaborado para que se
garantisse a confiabilidade da técnica e estudar a estabilidade do modelo. O
segundo sistema, intitulado sistema da conformação encontrada pelo GSA, foi
construído com o objetivo de refinar a estrutura obtida pelo GSA e, assim, alcançar
uma estrutura mais próxima da experimental com a aplicação da DM. O sistema 3,
denominado sistema da conformação estendida a 300 K, foi desenvolvido para
comparar as duas técnicas, aplicando a DM sobre esta conformação.
No entanto, acredita-se que a superfície de energia livre de uma proteína em
solução seja parcialmente rugosa e, com isto, em temperatura ambiente, o sistema
protéico fica, frequentemente, "preso" nos vários mínimos locais [ZHOW, R. (2003)].
Com o objetivo de escapar destas armadilhas dos mínimos locais utilizou-se a
técnica de annealing em uma simulação por DM, na qual a estrutura de início era a
conformação estendida (mesma do sistema 3). Este último sistema foi denominado:
sistema da conformação estendida sob o efeito do annealing.
Assim como no estudo de RMN, no qual o MP-X foi determinado [KUSUNOKI,
H. et al. (1998)], foi introduzido em todas as simulações uma mistura de TFE e água,
na proporção de 30% TFE e 70% H
2
O (v:v). Como discutido acima, o TFE é um co-
solvente anfipático, que forma aglomerados (clusters) em soluções polares, bastante
estudados por métodos experimentais, por ser indutor de estrutura secundária.
Sabe-se que as regiões hidrofóbicas dos peptídeos são solvatadas (protegidas) pelo
grupo CF
3
do TFE, enquanto o grupo polar OH do TFE pode formar ligações
hidrogênio com grupos polares do peptídeo, com as moléculas de H
2
O ou a
Resultados e Discussão
75
mesmo com o grupo polar OH de outra molécula de TFE. Desta forma, são capazes
de mimetizar ambientes heterogêneos como o de biomembranas.
Todos os sistemas foram submetidos à simulação por DM no ensemble NPT,
também conhecido como ensemble isobárico-isotérmico, em que o número de
moléculas N, a pressão P e a temperatura T são mantidos constantes. Além disso,
todos os sistemas apresentaram uma molécula do MP-X (soluto), moléculas de água
e moléculas de TFE. Ainda assim, pelo fato do MP-X apresentar carga total +4,
devido aos resíduos Lys4, Lys11, Lys12 e o N-terminal, todos os sistemas foram
neutralizados pela adição de quatro átomos de contra-íons cloro (CL
-
). Para todos os
sistemas o peptídeo foi solvatado numa caixa dodecaédrica com dimensões
próximas de 1,804 x 4,210 x 2,951 nm, que possuí uma distância mínima dos lados
ao peptídeo de 1,5 nm. Todos os sistemas foram submetidos à 300 ns de simulação
à 1 atm de pressão. Com exceção do sistema em que foi empregada a técnica de
annealing, a temperatura foi de 300 K. Nos sistemas no qual se fez uso da técnica
do annealing, a simulação teve início na temperatura de 400 K sendo reduzida
gradativamente até 300 K nos 50 ns iniciais, mantendo-se a 300 K nos 250 ns
restantes da simulação.
O algoritmo LINCS [HESS, B. et al. (1997)] foi empregado para vincular todos os
comprimentos de ligação envolvendo átomos de hidrogênio do peptídeo e o
algoritmo SETTLE [MIYAMOTO, S. & KOLLMAN, P. A. (1992)] para a geometria do
solvente. Os controles da temperatura e da pressão foram realizados por
acoplamento segundo o formalismo de Berendsen [BERENDSEN, H. J. C. (1984)]. Para
o tratamento eletrostático foi utilizado o método do Campo de Reação (Reaction
Field) [TIRONI, I. G. et al. (1995)]. O raio de corte usado para as interações de van der
Walls foram de 1,2 nm, e 1,4 nm para as Coulombianas. Foi utilizado o modelo de
água SPC (Single Point Charge) [BERENDSEN, H. J. C. (1981)] por ser simples (possui
apenas três ponto de carga para cada molécula de água, um para cada átomo) e
pouco custoso computacionalmente, além de representar adequadamente o
problema. O campo de forças utilizado foi o GROMOS96 43a1 [VAN GUNSTEREN, W.
F. et al. (1996)].
Devido à inclusão do solvente, antes da realização da simulação por
dinâmica propriamente dita, a energia de todos os sistemas foi minimizada através
do método do Máximo Declive (Steepest Descent) com restrição de posição dos
átomos pesados. Depois foi realizada uma minimização, também com o método do
Máximo Declive, porém do sistema inteiro, sem restrições. Em seguida realizou-se
Resultados e Discussão
76
uma última minimização do sistema utilizando o método de Gradiente Conjugado.
Além de todas estas minimizações de energia, foi necessário realizar uma simulação
por DM com restrições de posição dos átomos pesados do peptídeo de 5 ns, na
temperatura de 300 K para os sistemas sem a técnica de annealing, e à 400 K para
o sistema que se submeteria ao efeito do annealing. O objetivo de tal simulação é
acomodar as moléculas de água e de TFE ao redor do peptídeo, além de permitir a
pré-formação do aglomerado ("clusters") de TFE. Neste caso, são atribuídas
restrições de movimento aos átomos pesados do peptídeo, enquanto os átomos do
solvente ficam livres para se "acomodar".
SISTEMA 1 CONTROLE
Foi selecionada a primeira estrutura do MP-X das 14 obtidas por RMN
[KUSUNOKI, H. et al. (1998)], para ser utilizada como ponto de partida da simulação
por DM. O sistema apresentou as seguintes condições:
NÚMERO DE MOLÉCULAS DO SISTEMA
Número de moléculas de H
2
O
2332
Número de moléculas de TFE
266
Número de contra-íons
4 CL
-
Número total de átomos
9006
Para a identificação dos padrões de estruturas secundárias assumidos pelo
peptídeo ao longo da simulação, foi utilizado o programa DSSP (“Database of
Secondary Structure in Proteins [KABSCH, W. & SANDER, C. (1983)]), implementado
no pacote computacional GROMACS [LINDAHL, E. et al. (2001)]. Com este programa,
pode-se identificar, através de um código de cores, quais os padrões de estruturas
secundárias (por resíduo) assumidas pelo peptídeo durante o tempo de simulação.
Desta forma, as variações conformacionais da cadeia peptídica do MP-X
podem ser acompanhadas a partir do gráfico de padrões de estrutura secundária
por resíduo ao longo da simulação 1. Nota-se que não houve nenhuma mudança
significativa na estruturação do MP-X (Figura 40). Os resultados mostram que a
conformação em hélice-alfa se manteve estável durante toda a simulação,
do (Trp3) ao 13° resíduo (Leu13).
Resultados e Discussão
77
´
´
´
´
Figura 40 Padrões de estrutura secundária por resíduo, ao longo da simulação, para o MP-
X. Em branco, os resíduos sem estrutura (random coil); em verde, resíduos em curvas (bend); em
amarelo, resíduos em voltas (turn); em roxo, resíduos em hélice-5 ou também denominado de hélice-π;
em azul, resíduos em hélice-alfa; em cinza, resíduos em hélice-3 ou também denominado de hélice-3
10
.
O gráfico da Figura 41a mostra o -DRMQ das conformações do MP-X ao
longo dos 300 ns de simulação, em relação à estrutura de referência (estrutura do
PDB, 1A13). As pequenas flutuações no gráfico de desvio ratificam a estabilidade
mostrada pelo gráfico de padrões de estrutura secundária. O valor pequeno na
média de -DRMQ (0,22 nm) mostra que o peptídeo se encontra bem próximo da
estrutura resolvida experimentalmente.
É válido lembrar que, especificamente, em proteínas as interações por
ligações hidrogênio são fundamentais na manutenção das estruturas em
conformações de menores energias como hélices-alfa e folhas-beta. A análise e
quantificação das ligações hidrogênio fornecem dados importantes sobre a
especificidade das interações inter e intramoleculares.
Os números das ligações hidrogênio de todos os sistemas deste trabalho
foram obtidos pela definição de dois grupos, e pelo cálculo da existência, ou não, da
ligação hidrogênio, segundo o seguinte critério: (i) distância de corte de 3,5 Å entre
os átomos doador e receptor, e (ii) ângulo de corte receptor-doador-hidrogênio de
30°. O par do grupo analisado foi cadeia-principal/cadeia-principal.
No sistema controle, o número de ligações hidrogênio entre o esqueleto
peptídico (Figura 41b) sofreu pouca flutuação durante a simulação, corroborando a
estabilidade conformacional mostrada pelo gráfico de padrões de estrutura
secundária. A simulação mostrou um número médio de 8,01 ligações hidrogênio.
Resultados e Discussão
78
Figura 41 (A) Gráfico de -DRMQ do MP-X obtido ao longo dos 300 ns de simulção em
relação à estrutura de referência (estrutura do PBD, 1A13). (B) Gráfico do número de ligações
hidrogênio entre os átomos do esqueleto peptídico. Em vermelho, destacamos a "suavização" através
da média dos resultados a cada 300 pontos.
SISTEMA 2 CONFORMAÇÃO DE MENOR ENERGIA
ENCONTRADA PELO GSA
O objetivo dessa simulação é terminar de enovelar a estrutura encontrada
pelo GSA através do método de DM. A estrutura de menor energia
(-32,95 kcal/mol), que também foi a de menor -DRMQ (0,34 nm), encontrada pelo
programa THOR/GSA (Figura 39a), foi selecionada como ponto de partida para esta
simulação. O sistema apresentou as seguintes condições:
NÚMERO DE MOLÉCULAS DO SISTEMA
Número de moléculas de H
2
O
2049
Número de moléculas de TFE
236
Número de contra-íons
4 CL
-
Número total de átomos
7944
A evolução temporal do Sistema 2 (sistema da conformação do GSA) é
mostrada no gráfico da Figura 42. Observa-se, que no início da simulação o
programa de análise não reconhece nenhum padrão de estrutura secundária,
assumindo padrões de voltas, curvas e pontes-beta. No entanto, próximo dos 35 ns
A
B
Resultados e Discussão
79
de simulação, o peptídeo começa a assumir a conformação de hélice-alfa do
7° resíduo (Ala7) ao 11° (Lys11), e próximo de 185 ns o peptídeo se encontra na
conformação de hélice-alfa do (Trp3) ao 13° (Leu13) resíduo, assumindo uma
conformação muito próxima da conformação determinada pelo RMN.
´
´
´
´
Figura 42 Padrões de estrutura secundária por resíduo, ao longo da simulação, para o MP-
X. Em branco, os resíduos sem estrutura (random coil); em vermelho, os resíduos em folha-beta; em
preto, os resíduos em ponte-beta (beta-bridge) ou também denominado alça-beta; em verde, os
resíduos em curvas (bend); em amarelo, os resíduos em voltas (turn); em roxo, resíduos em hélice-5 ou
também denominado de hélice-π; em cinza, os resíduos em hélice-3 ou também denominado de hélice-
3
10
; em azul, resíduos em hélice-alfa.
O gráfico de Cα-DRMQ (Figura 43a) entre as estruturas encontradas na
trajetória da simulação e a estrutura do PDB (estrutura de referência), mostra que
nos 115 ns finais a cadeia polipeptídica apresenta uma média do desvio muito
baixa (média de 0,19 nm). Isto mostra que neste intervalo a conformação da cadeia
polipeptídica do MP-X convergiu para uma estrutura semelhante a estrutura
determinada experimentalmente.
Foi observado também que, conforme a estrutura do peptídeo vai se
estruturando em hélice-alfa e diminuindo o valor do Cα-DRMQ, o número de
ligações hidrogênio entre os átomos do esqueleto peptídico vai aumentando
(Figura 43b). A estrutura inicial (estrutura encontrada pelo GSA) apresentou o
DRMQ de 0,34 nm e 3 ligações hidrogênio. No intervalo entre 185 ns e 300 ns a
média de ligações hidrogênio foi de 8,04, dia igual a do sistema controle
(Sistema 1).
Resultados e Discussão
80
Figura 43 (A) Gráfico de -DRMQ do MP-X obtido ao longo dos 300 ns de simulação em
relação à estrutura de referência (estrutura do PBD, 1A13). (B) Gráfico do número de ligações
hidrogênio entre os átomos do esqueleto peptídico. Em vermelho, destacamos a "suavização" através
da média dos resultados a cada 300 pontos.
A sobreposição da estrutura que mostrou o menor -DRMQ (0,06 nm), da
simulação por DM (verde), em relação a estrutura resolvida experimentalmente por
RMN, depositada no PDB (azul), está representada na Figura 44. Além disso, na
forma de CPK estão representadas as cadeias laterais das duas estruturas (em azul
as cadeias laterais da estrutura selecionada dentre as finais da simulação e em
verde as cadeias laterais da estrutura do PDB).
Figura 44 Sobreposição da estrutura, em verde, de menor -DRMQ (0,06 nm) selecionada
da simulação por DM com a estrutura, em azul, resolvida experimentalmente por RMN e depositada
no PDB (cód. 1A13). Em destaque, na forma de CPK, as cadeias laterais das duas estruturas (em azul
a cadeia lateral da estrutura do PDB e em verde da estrutura de menor desvio selecionada da trajetória
da simulação).
A
B
Resultados e Discussão
81
SISTEMA 3 CONFORMAÇÃO ESTENDIDA DO MP-X A 300 K
Para efeito de comparação com a dinâmica da estrutura vinda do GSA
(sistema 2), foi feita uma simulação partindo da estrutura completamente estendida
do MP-X como ponto de início (Figura 38). O sistema apresentou as seguintes
condições:
NÚMERO DE MOLÉCULAS DO SISTEMA
Número de moléculas de H
2
O
8448
Número de moléculas de TFE
956
Número de contra-íons
4 CL
-
Número total de átomos
32184
Analisando a evolução temporal deste sistema (Figura 45), nota-se que
durante praticamente todos os 300 ns o MP-X possuiu grande flexibilidade, não
assumindo nenhum padrão de estrutura secundária. Seus resíduos ficaram
transitando em curvas e voltas.
´
´
´
Figura 45 Padrões de estrutura secundária por resíduo, ao longo da dinâmica, para o MP-X.
Em branco, os resíduos sem estrutura (random coil); em vermelho, os resíduos em folha-beta; em
preto, os resíduos em ponte-beta (beta-bridge); em verde, os resíduos em curvas (bend); em amarelo, os
resíduos em voltas (turn); em cinza, os resíduos em hélice-3 ou também denominado de hélice-3
10
; em
azul, os resíduos em hélice-alfa.
A desestruturação e grande flexibilidade do MP-X é corroborada pelo valor
médio alto do desvio (0,76 nm) e pela alta variação de -DRMQ durante toda a
simulação (Figura 46a), além do pequeno número de ligações hidrogênio entre os
átomos do esqueleto peptídico (≈ 1 ligação) (Figura 46b).
Resultados e Discussão
82
Figura 46 (A) Gráfico de -DRMQ do MP-X obtido ao longo dos 300 ns de simulação em
relação à estrutura de referência (estrutura do PBD, 1A13). (B) Gráfico do número de ligações
hidrogênio entre os átomos do esqueleto peptídico. Em vermelho, destacamos a "suavização" através
da média dos resultados a cada 300 pontos.
Concluí-se, portanto, que mesmo os 300 ns de simulação por DM do MP-X
(partindo da conformação estendida) na temperatura de 300 K, num ambiente em
que o solvente foi representado explicitamente, não se conseguiu convergir para
uma estrutura próxima da estrutura determinada por RMN. Acredita-se que na
simulação em temperatura ambiente constante, o sistema tenha ficado “preso” em
algum dos mínimos locais da hipersuperfície de energia, necessitando, talvez, de
mais tempo para conseguir escapar dessa armadilha de mínimo local.
Com as simulações do GSA, encontramos estruturas pré-enoveladas com
uma média de -DRMQ menor, em um tempo de execução muito menor do que as
simulações por DM. É válido ressaltar que para calcular cada nanosegundo deste
sistema por DM em uma máquina octo-processada (Intel® Xeon®@2,5 GHz; 4Gb de
memória RAM) leva-se 4,5 horas, ou seja, para simular 300 ns foram necessários
56 dias; e cada simulação do THOR/GSA COM SAS na mesma máquina octo-
processada, porém utilizando apenas, 1 núcleo necessita de 9h, e o THOR/GSA
SEM SAS apenas 45 minutos.
A
B
Resultados e Discussão
83
SISTEMA 4 CONFORMAÇÃO ESTENDIDA DO MP-X sob o efeito
do Annealing na Dinâmica Molecular
No sistema 4 foi realizada uma simulação de 300 ns por DM com o efeito de
annealing dinâmico. Com o uso desta técnica espera-se fugir de alguns mínimos
locais em favor de um mínimo mais global. A estrutura de ponto de partida foi a
estrutura totalmente estendida do MP-X (mesma do Sistema 3) à uma temperatura
de 400 K. Gradualmente a temperatura foi baixada até 300 K nos 50 primeiros
nanosegundos, nos outros 250 ns finais a temperatura foi mantida a 300 K. O
sistema apresentou as seguintes condições (mesma conformação inicial do sistema
3: estendida):
NÚMERO DE MOLÉCULAS DO SISTEMA
Número de moléculas de H
2
O
8448
Número de moléculas de TFE
956
Número de contra-íons
4 CL
-
Número total de átomos
32184
Através da análise da evolução temporal deste sistema (Figura 47), nota-se
que, logo no início da simulação, alguns resíduos do MP-X assumem o padrão de
hélice-alfa. No intervalo entre, aproximadamente, 30 ns e 130 ns o peptídeo assume
uma conformação do (Trp3) ao 13° resíduo (Leu13). Porém depois de 130 ns
alguns resíduos perdem a estrutura de hélice-alfa, que logo em seguida (170 ns)
assumem novamente estruturação, permanecendo por mais vários nanosegundos.
Após 210 ns a estruturação em hélice-alfa do peptídeo vai se perdendo e no final da
simulação nenhum resíduo da cadeia polipeptídica encontra-se em conformação de
hélice-alfa.
De forma diferente do Sistema 3, esta estruturação deve ter ocorrido porque
quando aumentamos a temperatura para a realização do annealing evita-se as
armadilhas de alguns mínimos locais encontrados na simulação em temperatura
ambiente. Porém, a estruturação em hélice não se sustenta como nas simulações 1
e 2.
Resultados e Discussão
84
Figura 47 Padrões de estrutura secundária por resíduo, ao longo da simulação, para o MP-
X. Em branco, os resíduos sem estrutura (random coil); em preto, os resíduos em ponte-beta (beta-
bridge); em verde, os resíduos em curvas (bend); em amarelo, os resíduos em voltas (turn); em roxo,
resíduos em hélice-5 ou também denominado de hélice-π; em cinza, os resíduos em hélice-3 ou
também denominado de hélice-3
10
; em azul, resíduos em hélice-alfa.
A média do -DRMQ no intervalo de 30 a 130 ns é de 0,21 nm; e depois no
intervalo de 170 a 210 ns é de 0,22 nm (Figura 48a). O baixo valor da média do -
DRMQ ( 0,25 nm) comprova que a cadeia polipeptídica do MP-X convergiu para
uma hélice-alfa bem próxima da estrutura determinada experimentalmente nestes
intervalos.
Através do gráfico de ligações hidrogênio (Figura 48b) nota-se que, à medida
que os resíduos vão se estruturando em hélice-alfa, o número de ligações
hidrogênio entre os átomos do esqueleto peptídico aumenta. O número médio de
ligações hidrogênio nos intervalos em que se observou a estruturação do peptídeo
em hélice-alfa do Trp3 até a Leu13 (intervalo em que a média do -DRMQ foi
menor do que 0,25 nm) é o mesmo encontrado na simulação 1 (simulação controle),
de 8 ligações.
Resultados e Discussão
85
Figura 48 (A) Gráfico de -DRMQ do MP-X obtido ao longo dos 300 ns de simulação em
relação à estrutura de referência (estrutura do PBD, 1A13). (B) Gráfico do número de ligações
hidrogênio entre os átomos do esqueleto peptídico. Em vermelho, destacamos a "suavização" através
da média dos resultados a cada 300 pontos.
Devido ao fato desta técnica de DM estudar o espaço temporal de apenas um
peptídeo, não fornecendo um aparato estatístico, levanta-se a questão de que o
peptídeo deva flutuar periodicamente entre o estado parcialmente enovelado e
completamente enovelado.
A sobreposição da estrutura que exibiu o menor -DRMQ (0,13 nm) em
verde, na simulação da DM (em verde), em relação à estrutura determinada
experimentalmente por RMN (em azul) (estrutura depositada no PDB, 1A13) está
representada na Figura 49. Além disso, na forma de CPK estão representadas as
cadeias laterais das duas estruturas (em azul as cadeias laterais da estrutura
selecionada da simulação e em verde as cadeias laterais da estrutura do PDB).
A
B
Resultados e Discussão
86
Figura 49 Sobreposição da estrutura, em verde, de menor -DRMQ (0,13 nm) selecionada
da simulação por DM com a estrutura, em azul, resolvida experimentalmente (estrutura depositada no
PDB, 1A13). Em destaque, na forma de CPK, as cadeias laterais das duas estruturas.
Resultados e Discussão
87
4.2.2.1 Estudo da Estabilidade do MP-X em Água.
Além do estudo do MP-X em ambiente de TFE/água, foi estudada a
estabilidade do peptídeo em ambiente aquoso, que, como dito anteriormente,
mastoparanos apresentam-se desestruturados em solução aquosa [HIGASHIJIMA, et
al. (1983); WAKAMATSU, K. et al. (1983)].
Com o objetivo de estudar a estabilidade estrutural do MP-X em água foram
feitas duas simulações:
I. Sistema 1.1
Sistema da estrutura determinada experimentalmente
em H
2
O
Estrutura inicial
Estrutura do PDB (1A13)
Solvente
H
2
O
Temperatura
300 K
Pressão
1 atm
II. Sistema 2.1
Sistema da conformação estendida sobre à qual
aplicou-se Annealing por DM, em H
2
O
Estrutura inicial
Estrutura estendida
Solvente
H
2
O
Temperatura
Annealing (iniciando a 400K
e sendo diminuída gradati-
vamente até 300 K
Pressão
1atm
SISTEMA 1.1 CONFORMAÇÃO do PDB
Assim como no sistema estudado em ambientes TFE/água, foi selecionada a
primeira estrutura das 14 obtidas por RMN do MP-X [KUSUNOKI, H. et al. (1998)]
para ser empregada como ponto de partida da simulação por DM. O sistema
apresentou as seguintes condições:
NÚMERO DE MOLÉCULAS DO SISTEMA
Número de moléculas de H
2
O
2874
Número de contra-íons
4 CL
-
Número total de átomos
8770
O sistema foi submetido a 300 ns de simulação por DM a 300 K e pressão de
1 atmosfera (atm).
Assim como em todas as simulações anteriores, o sistema foi minimizado
pelos mesmos métodos de minimização de energia empregados anteriormente. Além
Resultados e Discussão
88
disso, também, fez-se uso da Dinâmica Molecular com restrições de posição do
soluto de 5 ns, na temperatura de 300 K, devido à inclusão do solvente. O objetivo
da simulação com restrição de posição dos átomos pesados do peptídeo é acomodar
as moléculas de água ao seu redor.
Analisando a evolução temporal da simulação por DM deste sistema,
observa-se que o peptídeo não conseguiu se estabilizar em nenhum padrão de
estrutura secundária durante todos os 300 ns, mostrando-se grande flexibilidade
(Figura 50). Esse resultado é corroborado pelos resultados experimentais, no qual
se diz que o MP-X não assume estrutura secundária em solução aquosa,
apresentando-se estendido ou desestruturado [HIGASHIJIMA, et al. (1983);
WAKAMATSU, K. et al. (1983)].
Figura 50 Padrões de estrutura secundária por resíduo, ao longo da simulação, para o MP-
X. Em branco, os resíduos sem estrutura (random coil); em vermelho, os resíduos em folha-beta; em
preto, os resíduos em ponte-beta (beta-bridge); em verde, os resíduos em curvas (bend); em amarelo, os
resíduos em voltas (turn); em roxo, resíduos em hélice-5 ou também denominado de hélice-π; em
cinza, os resíduos em hélice-3 ou também denominado de hélice-3
10
; em azul, resíduos em hélice-alfa.
O gráfico da Figura 51a mostra uma média alta do -DRMQ (0,49 nm) em
relação à estrutura depositada no PDB (estrutura de referência). Nota-se que, logo
no início da simulação, as estruturas se afastam da estrutura de referência, o que
pode ser visto pelo aumento do desvio (-DRMQ). No meio da simulação, no
intervalo em que a cadeia polipeptídica do MP-X se estrutura em hélice-alfa, o
desvio diminui mostrando que a volta se aproxima da estrutura de referência. No
entanto, rapidamente volta a se desestruturar e se afastar da estrutura de
referência, mostrando uma grande instabilidade conformacional.
O número de ligações hidrogênio entre os átomos do esqueleto peptídico pode
ser visto na Figura 51b. O número médio de ligações hidrogênio foi de 3,37 ligações
(número muito menor do que o encontrado na simulação do Sistema 1, no
ambiente TFE/água).
Resultados e Discussão
89
Figura 51 (A) Gráfico de -DRMQ do MP-X obtido ao longo dos 300 ns de simulação em
relação à estrutura de referência (estrutura do PBD, 1A13). (B) Gráfico do número de ligações
hidrogênio entre os átomos do esqueleto peptídico. Em vermelho, destacamos a "suavização" através
da média dos resultados a cada 300 pontos.
SISTEMA 2.1 CONFORMAÇÃO ESTENDIDA DO MP-X sob o efeito
do Annealing na Dinâmica Molecular
Para efeito de comparação, com os resultados obtidos com a simulação do
MP-X em ambientes de TFE/água, foi feita uma simulação partindo da estrutura
completamente estendida do MP-X como ponto de início (Figura 38) sob o efeito do
annealing (400-300 K) nos 50 ns iniciais (da mesma maneira que no sistema 3 do
estudo do MP-X em ambientes de TFE/água). Nos 250 ns finais o sistema foi
mantido em temperatura constante de 300 K. Empregou-se as seguintes condições:
NÚMERO DE MOLÉCULAS DO SISTEMA
Número de moléculas de H
2
O
12759
Número de contra-íons
4 CL
-
Número total de átomos
38425
Foram realizados 300 ns de simulação por DM à pressão de 1 atm.
Foram empregados os todos de minimização de energia da mesma forma
que nos sistemas anteriores, além da DM de 5 ns com restrição de posição dos
A
B
Resultados e Discussão
90
átomos pesados do peptídeo na temperatura de 400 K, assim como na simulação
através da técnica de annealing.
O gráfico da Figura 52 mostra os padrões de estrutura secundária ao longo
da simulação do Sistema 2.1. Nesta simulação, foi visto que o peptídeo não
assumiu conformação no início da simulação. Entretanto, observou-se uma
conformação em hélice-alfa, na região de 50 ns, do resíduo (Ile6) até o
13° resíduo (Leu13). Esta conformação é logo perdida em torno de 70 ns. Próximo
de 80 ns o peptídeo assume estrutura em folha-beta (Asn2 até Ala9, com 2 resíduos
em conformação de volta, Gly5 e Ile6) que se mantêm por quase toda a simulação.
Figura 52 Padrões de estrutura secundária por resíduo, ao longo da simulação, para o MP-
X. Em branco, os resíduos sem estrutura (random coil); em vermelho, os resíduos em folha-beta; em
preto, os resíduos em ponte-beta (beta-bridge); em verde, os resíduos em curvas (bend); em amarelo, os
resíduos em voltas (turn); em roxo, resíduos em hélice-5 ou também denominado de hélice-π; em
cinza, os resíduos em hélice-3 ou também denominado de hélice-3
10
; em azul, resíduos em hélice-alfa.
O valor alto e estabilização do -DRMQ (0,51 nm) (Figura 53a) mostra que o
peptídeo se estruturou em conformações bem diferentes da determinada
experimentalmente (estrutura de referência). A pequena flutuação após adquirir
conformação de estrutura secundária regular de folha-beta sugere que o peptídeo
tenha sido aprisionado em algum mínimo local de energia.
A Figura 53b, mostra o número de ligações hidrogênio entre os átomos do
esqueleto peptídico durante toda a simulação. A simulação teve uma média de
4,08 ligações hidrogênio.
Resultados e Discussão
91
Figura 53 (A) Gráfico de -DRMQ do MP-X obtido ao longo dos 300 ns de simulação em
relação à estrutura de referência (estrutura do PBD, 1A13). (B) Gráfico do número de ligações
hidrogênio entre os átomos do esqueleto peptídico. Em vermelho, destacamos a "suavização" através
da média dos resultados a cada 300 pontos.
4.2.3 Conclusões Parciais para o MP-X
A partir das informações obtidas pelo estudo do MP-X com a técnica do GSA,
observamos que houve apenas pequenas alterações nos resultados com o termo de
energia de solvatação (COM SAS) em relação à ausência desse termo (SEM SAS).
Esta pequena diferença pode ser resultado do pequeno tamanho do MP-X, no qual,
praticamente, todos os átomos da cadeia polipeptídica estão expostos ao solvente.
Isto tornou irrelevante o cálculo da SAS.
Através dos resultados obtidos pela DM, no qual o ponto de partida foi a
estrutura completamente estendida, sugere-se que, com o uso da ferramenta de
annealing, consiga-se acessar um número maior de rotas de enovelamento, o que
levou o peptídeo a se estruturar, apesar de não ter encontrado estabilidade.
Observamos também que, em temperatura ambiente constante, o peptídeo não
consegue se estruturar mesmo depois de 300 ns em solvente misto TFE/água.
Além disso, as simulações realizadas em solução aquosa são corroboradas
pelos resultados experimentais [McDOWELL, L. et al. (1985)]. Em solução aquosa, na
A
B
Resultados e Discussão
92
qual o ponto de partida foi a estrutura do PDB (Sistema 1.1), observou-se uma
desestruturação depois de poucos nanosegundos.
Uma comparação entre os resultados dos sistemas que tiveram como ponto
de início a estrutura completamente estendida, sob o efeito do annealing, porém em
soluções diferentes (Sistema 4 e Sistema 1.2), mostra que o peptídeo não consegue
estruturar-se em uma conformação próxima da determinada experimentalmente
quando em solução aquosa. No entanto, de forma diferente, em solução TFE/água
mostra uma tendência à estruturação.
Em todas as simulações em solvente misto, observou-se a separação de fases
entre a água e o TFE. As figuras 54a, 54b, 54c e 54d exibem algumas estruturas
encontradas ao longo da simulação do Sistema 4.
Ainda na fase de preparação da simulação, antes da DM de restrição de
posição, verifica-se que as simulações se iniciam com uma mistura mais
homogênea entre água (em vermelho) e TFE (em verde) (Figura 54a). Porém, no
início das simulações propriamente ditas, logo após a DM de restrição de posição, já
se pode notar a separação de fases (Figura 54b). No decorrer das simulações ocorre
mais efetivamente a separação de fases (Figuras 54c e 54d). Além disso, verifica-se
que o peptídeo tende a manter-se na interface entre as moléculas de água e TFE,
como se pode ver em dois instantes da simulação.
Resultados e Discussão
93
Figura 54 Estrutura do peptídeo MP-X em quatro momentos da DM do Sistema 4. (A)
Momento antes da DM com restrição de posição dos átomos pesado do peptídeo. (B) Momento de
partida da simulação de 300 ns. (C) Momento no meio da DM e (D) momento final dos 300 ns da
simulação.
A
B
C
D
Resultados e Discussão
94
Um resultado notável foi o pré-enovelamento feito com o GSA e o uso
subseqüente da técnica de DM, o que garantiu a convergência para a estrutura em
hélice-alfa do peptídeo, observada experimentalmente nas mesmas condições. Isto
aponta para a proposta de uma estratégia em se usar as duas técnicas GSA e DM
acopladas, em que o GSA inicia o enovelamento e a DM conclui. Voltando ao modelo
de funil de enovelamento, aplicando-se somente Dinâmica Molecular não se pode
encontrar a entrada do funil em tempos da ordem de centenas de nanosegundos,
como foi visto no Sistema 3 (simulação estendida em TFE/água). O mínimo global
estaria muito escondido entre um número astronômico de mínimos locais. Com o
GSA, por outro lado, é possível localizar o funil de enovelamento na superfície de
energia, mas ainda não se pode mergulhar nele em busca do mínimo global em
sistemas mais realistas, pela falta de uma melhor representação do solvente. Com a
mistura TFE/água representada explicitamente, e a conseqüente separação de
fases na DM, uma vez dentro do funil, chega-se rapidamente ao mínimo global.
Resultados e Discussão
95
4.3 Trp-cage
No início deste século, Neidigh e colaboradores descobriram que 18 resíduos
do segmento da exendina-4 (Leu21Pro38) é o fragmento mais curto conhecido, que
se enovela em água [NEIDIGH, J. W. et al. (2001)]. No ano de 2002, Neidigh [NEIDIGH,
J. W. (2002)] truncou e redesenhou a exendina-4 para uma mini-proteína de
20 resíduos de aminoácidos (304 átomos), de 2.1 kDa, que exibia uma transição
cooperativa de enovelamento, sendo significativamente mais estável do que
qualquer outra mini-proteína conhecida [DAHIYAT, B. L. & MAYO, S. L. (1997); de la
PAZ, M. L. et al. (2001); KORTEMME, T. et al. (1998); OTTESEN, J. J. & IMPERIALI, B.
(2001); QIU, L. L. et al. (2002); DING, F. et al. (2005)]. Este fragmento foi chamado de
Trp-cage. Devido à rápida cinética de enovelamento (cerca de 4 µs [QIU, L. L. et al.
(2002)]), alta estabilidade termodinâmica e pequeno tamanho, o Trp-cage recebeu
uma considerável atenção na comunidade computacional, tornando-se uma escolha
ideal para o estudo do enovelamento por simulações computacionais [CHOWDHURY,
S. et al. (2003); PITERA, J. W. & SWOPE, W. (2003); SIMMERLING, C. et al. (2002); SNOW,
C. D. et al. (2002); ZAGROVIC, B. & PANDE, V. S. (2003); ZHOU, R. H. (2003); DING, F. et
al. (2005)]. A descoberta desta mini-proteína vem contribuindo muito para o
entendimento dos mecanismos gerais do enovelamento [JURASZEK, J. & BOLHUIS, P.
G. (2006)].
A estrutura dos 20 resíduos do Trp-cage (NLYIQWLKDGGPSSGRPPPS),
determinada por RMN (código do PDB: 1L2Y [NEIDIGH, J. W. et al. (2002)], mostra
uma pequena hélice-alfa da Leu2 até a Lys9, um segmento de hélice-3
10
da Gly11
até a Ser14 e um segmento em hélice tipo poli-prolina nos resíduos restantes em
direção ao C-terminal, que protege o triptofano central (Trp6) do solvente [ZHOU, R.
et al. (2003)] (Figura 55).
Resultados e Discussão
96
Figura 55 Representação, na forma de New Cartoon, da estrutura do Trp-Cage. (Código
PDB: 1L2Y [NEIDIGH, J. W. et al. (2002)]. Em destaque, na forma de CPK, a cadeia lateral do Trp6. Em
tracejado vermelho destacamos as ligações hidrogênio. A carga +1 do Trp-cage é devido ao balanço de
cargas dos resíduos de aminoácidos carregados (Lys8, Asp9 e Arg16).
O Trp-cage apresenta uma alta probabilidade (>95%) de se estruturar em
temperatura ambiente, solução aquosa e pH fisiológico [NEIDIGH, J. W. et al. (2002)].
O seu enovelamento é cooperativamente e hidrofobicamente conduzido pelo
encapsulamento do Trp6 e pela hélice tipo poli-prolina do C-terminal [SNOW, C. D. et
al. (2002); ZHOU, R. et al. (2003); NEIDIGH, J. W. et al. (2002)]. São as cadeias laterais
dos resíduos Tyr3, Leu7, Pro12, Pro17, Pro18 e Pro19 que envolvem o anel da
cadeia lateral do Trp6 protegendo-o da exposição ao solvente [NEIDIGH, J. W. et al.
(2002); CHOWDHURY, S. et al. (2003); SNOW, C. D. et al. (2002); ZAGROVICAND, B. &
PANDE, V. (2003); ZHOU, R. et al. (2003)].
Utilizamos o Trp-cage para estudar o desempenho e eficiência do THOR/GSA,
pelo fato de ser um modelo real comumente empregado para o refinamento e
calibração de métodos computacionais de predição de estrutura. Isto possibilita
avaliar com maior precisão o momento e as condições em que o GSA atinge o
resultado esperado. Diferentemente do mastoparano-X, o Trp-cage não exige
solvente misto para enovelar-se na estrutura nativa, necessitando apenas água ou
uma boa representação dos efeitos do solvente aquoso, o que facilita os cálculos.
Resultados e Discussão
97
4.3.1 Resultados do GSA para o Trp-cage
Nesta seção, apresentaremos os resultados encontrados com o THOR/GSA
na aplicação à mini-proteína Trp-cage, partindo de uma conformação inicial
estendida (Figura 56).
Figura 56 Conformação estendida do Trp-cage (Asn-Leu-Tyr-Ile-Gln-Trp-Leu-Lys-Asp-Gly-
Gly-Pro-Ser-Ser-Gln-Arg-Pro-Pro-Pro-Ser).
Para efeito de comparação, foram realizadas simulações empregando tanto o
THOR/GSA com o termo de energia de solvatação (COM SAS), como sem o termo
(SEM SAS). Os resultados das simulações foram alcançados utilizando os mesmos
parâmetros descritos anteriormente para a 22-ala e para o MP-X [q
A
= 2.1, q
V
= 1.9
e q
T
= 1.7], mesmo valor de temperatura/ruído inicial (T
0
= 100) e mesmo número
de passos (5.000.000). Assim como no MP-X, foi adicionada liberdade de rotação às
cadeias laterais do Trp-cage. Os detalhes do arquivo de entrada do Trp-cage para o
programa THOR/GSA (*.IN) podem ser encontrados no apêndice A.
Foram feitas 50 simulações com o termo de energia de solvatação (COM SAS)
e outras 50 sem o termo de energia de solvatação (SEM SAS) (Figura 57a), na qual
apenas a semente para a geração do número aleatório era alterada.
Analisando todas as estruturas, verificamos que a diferença da média do
desvio dos átomos de carbobo-α do esqueleto peptídico (-DRMQ) em relação à
estrutura determinada por RMN, entre as estruturas com o termo da energia de
solvatação (COM SAS) e as estruturas sem o termo de energia de solvatação
(SEM SAS), foi de apenas 0,02 nm (média de 0,59 nm para as estruturas
encontradas pelo THOR/GSA SEM SAS e 0,61 nm para as estruturas encontradas
pelo THOR/GSA COM SAS. Além da menor média, a estrutura que apresentou
menor energia (26,32 kcal/mol), que também foi a que apresentou menor -DRMQ
(0,32 nm), foi encontrada pelo THOR/GSA SEM SAS (Figura 57a). A energia da
estrutura determinada experimentalmente, calculada pelo GSA, foi de
-1,57 kcal/mol. A sobreposição da estrutura encontrada pelo THOR/GSA de menor
Cα-DRMQ (0,32 nm), com a estrutura determinada experimentalmente está
representada na Figura 57b.
Resultados e Discussão
98
A
B
Figura 57 Resultados do THOR/GSA para o Trp-cage. (A) Gráfico relacionando o -DRMQ
das estruturas geradas pelo THOR/GSA em relação à estrutura de referência (estrutura do Trp-cage
depositada no PDB [cód. PDB 1L2Y]). Em vermelho estão representadas as 50 estruturas encontradas
com o THOR/GSA sem o termo de energia de solvatação (SEM SAS), e em preto estão representadas as
50 estruturas encontradas pelo THOR/GSA com o termo de energia de solvatação (COM SAS). (B)
Sobreposição da estrutura de menor energia (26,18 kcal/mol) encontrada e que também apresenta o
menor Cα-DRMQ (0,32 nm) (estrutura verde) em relação à estrutura depositada no PDB, 1L2Y
(estrutura azul). Em destaque (na forma de sticks) a cadeia lateral do resíduo de Trp6 em ambas as
estruturas.
Resultados e Discussão
99
Apesar do melhor resultado ter sido encontrado pelo algoritmo SEM SAS, os
resultados de modo geral foram satisfatório se compararmos com outros programas
de busca estocástica. Dos quais têm encontrado estruturas com desvio maiores do
que as encontradas com o THOR/GSA e com número de passos muito maiores
[VERMA, A. et al. (2006)].
A diferença entre o valor de -DRMQ da estrutura de menor energia
encontrada pelo THOR/GSA COM SAS e a estrutura encontrada SEM SAS foi de
0,1 nm.
Esta pequena alteração nos resultados, talvez seja pelo fato de ainda
continuarmos estudando uma macromolécula de pequeno tamanho, no qual
praticamente todos os átomos estejam expostos ao solvente.
A estrutura de menor energia encontrada pelo THOR/GSA com o termo de
energia de solvatação apresentou uma energia de 41,37 kcal/mol e o -DRMQ de
0,42 nm.
Pelo fato das estruturas encontradas pelo THOR/GSA não coincidirem com a
estrutura determinada experimentalmente, utilizamos a cnica de DM no intuito
de melhorar a estrutura encontrada, partindo da de menor energia.
4.3.2 Resultados da Dinâmica Molecular para o Trp-cage
Assim como no estudo do MP-X, o método de DM foi escolhido pelo fato de
poder descrever o solvente de forma explícita. O uso da DM tem como objetivo
finalizar a convergência da estrutura de menor energia encontrada pelo
THOR/GSA.
Além deste objetivo, foi feita uma simulação por DM empregando-se
annealing, na qual o ponto de partida era a conformação estendida do Trp-cage
(Figura 56). Essa simulação tem como objetivo compará-la com o resultado
encontrado a partir da estrutura de menor energia obtida pelo THOR/GSA. Desta
forma, incluindo-se o sistema controle, foram preparados três sistemas:
I. Sistema 1
Sistema Controle
Estrutura inicial
Estrutura do PDB (1L2Y)
Solvente
H
2
O
Temperatura
300 K
Pressão
1 atm
Resultados e Discussão
100
II. Sistema 2
Sistema da conformação de menor energia encontrada
pelo GSA
Estrutura inicial
Estrutura de menor energia
encontrada pelo GSA
Solvente
H
2
O
Temperatura
300 K
Pressão
1 atm
III. Sistema 3
Sistema da conformação estendida sobre à qual
aplicou-se Annealing por DM
Estrutura inicial
Estrutura estendida
Solvente
H
2
O
Temperatura
Annealing (iniciando a 400K
e sendo diminuída gradati-
vamente até 300K
Pressão
1 atm
Nenhum sistema foi construído partindo-se da conformação estendida na
temperatura de 300 K, pelo fato dos trabalhos na literatura mostrarem um tempo
na escala de microsegundos para o enovelamento do Trp-cage nestas condições
[SHOW, C. D. et al. (2005)]. Desta forma, apenas um sistema, partindo da
conformação estendida, foi construído, aquele em que aplicou-se o annealing por
Dinâmica Molecular.
Todos os sistemas foram submetidos à simulação por DM no ensemble NPT.
Pelo fato do Trp-cage apresentar carga total +1, todos os sistemas foram
neutralizados pela adição de um átomo de contra-íon Cloro (CL
-
). Para todos os
sistemas a mini-proteína foi solvatada numa caixa dodecaédrica com dimensões
próximas de 3,502 x 4,905 x 2,951 nm, que possuí uma distância mínima dos lados
à mini-proteína de 1,5 nm. Todos os sistemas foram submetidos a 300 ns de
simulação, à 1 atm. Com exceção do sistema em que fora empregada a técnica de
annealing, a temperatura foi de 300 K. No sistema no qual se fez uso da técnica de
annealing, a simulação teve início na temperatura de 400 K, sendo reduzida
gradativamente até 300 K nos 50 ns iniciais, e mantendo-se a 300 K nos 250 ns
restantes da simulação.
Assim como no estudo do MP-X, utilizamos o algoritmo LINCS [HESS, B. et al.
(1997)] para vincular todos os comprimentos de ligação envolvendo átomos de
hidrogênio, e o algoritmo SETTLE [MIYAMOTO, S. & KOLLMAN, P. A. (1992)] para a
geometria do solvente. Os controles da temperatura e da pressão foram realizados
Resultados e Discussão
101
por acoplamento segundo o formalismo de Berendsen [BERENDSEN, H. J. C. et al.
(1984)]. Para o tratamento eletrostático foi utilizado o método do Campo de Reação
(Reaction Field) [TIRONI, I. G. et al. (1995)]. O raio de corte usado para as interações
de van der Walls foi de 1,2 nm e de 1,4 nm para as interações Coulombianas. O
modelo de água SPC (Single Point Charge) [BERENDSEN, H. J. C. et al. (1981)] fora
utilizado por ser simples e pouco custoso computacionalmente, além de representar
adequadamente o problema. O campo de força utilizado foi o GROMOS96 43a1 [VAN
GUNSTEREN, F. H. et al. (1996)].
Da mesma maneira que nos sistemas do MP-X, a energia foi previamente
minimizada utilizando o mesmo protocolo. Em todos os sistemas foi feita uma
Dinâmica com restrição dos átomos pesados, de 5 ns, com o objetivo de acomodar
as moléculas de água ao redor da proteína. Os sistemas no qual não foi utilizado o
annealing a temperatura foi de 300 K. o sistema usando o annealing a
temperatura foi de 400 K.
SISTEMA 1 CONTROLE
O sistema controle foi preparado a partir da estrutura determinada por RMN
[NEIDIGH, J. W. et al. (2002)] (cód. PDB 1L2Y, a primeira das 38 estruturas foi
selecionada), e apresentou as seguintes condições:
NÚMERO DE MOLÉCULAS DO SISTEMA
Número de moléculas de H
2
O
3279
Número de contra-íons
1 CL
-
Número total de átomos
10036
As variações estruturais da cadeia polipeptídica do Trp-cage com o tempo
podem ser visualizadas no seu conjunto pelo gráfico de padrões de estrutura
secundária por resíduo (Figura 58). Nota-se que o sistema apresentou uma variação
pouco significante durante toda a simulação. Os resíduos Tyr3 até Lys8
mantiveram-se em conformação de hélice-alfa (cor azul do código de cores do
gráfico de padrões de estrutura secundária) por toda a simulação. A região em
hélice tipo poli-prolina (Pro17-Pro19) apresentou-se sem estrutura, da mesma
forma observada na estrutura determinada experimentalmente.
Resultados e Discussão
102
Figura 58 Padrões de estrutura secundária por resíduo, ao longo da simulação, para o Trp-
cage. Em branco, os resíduos sem estrutura (random coil); em vermelho, os resíduos em folha-beta; em
preto, os resíduos em ponte-beta (beta-bridge) ou também denominado alça-beta; em verde, os
resíduos em curvas (bend); em amarelo, os resíduos em voltas (turn); em roxo, resíduos em hélice-5 ou
também denominado de hélice-π; em cinza, os resíduos em hélice-3 ou também denominado de hélice-
3
10
; em azul, resíduos em hélice-alfa.
A estabilização da estrutura em conformação próxima à experimental é
também observada com a análise do Cα-DRMQ dos instantâneos do peptídeo ao
longo da dinâmica, tomando a estrutura PDB como referência. O Cα-DRMQ médio
foi pequeno (0,24 nm) ao longo de toda a simulação (Figura 59a). Este valor
pequeno na média do desvio indica que as conformações, na maior parte do tempo,
estão próximas da estrutura determinada por RMN.
O sistema apresentou um número médio de 6,8 ligações hidrogênio no
esqueleto peptídico, corroborando com o número de ligações encontradas na
estrutura do PDB (Figura 59b).
Resultados e Discussão
103
Figura 59 (A) Gráfico de -DRMQ do Trp-Cage obtido ao longo dos 300 ns de simulação em
relação à estrutura de referência (estrutura do PBD, 1L2Y). (B) Gráfico do número de ligações
hidrogênio entre os átomos do esqueleto peptídico. Em vermelho, destacamos a "suavização" através
da média dos resultados a cada 300 pontos.
SISTEMA 2 CONFORMAÇÃO DE MENOR ENERGIA ENCONTRADA
PELO GSA
Da mesma forma que o MP-X, o objetivo desta simulação é terminar de
convergir a estrutura de menor energia encontrada pelo THOR/GSA, em direção a
uma estrutura próxima àquela determinada por RMN.
Portanto, a estrutura inicial desta simulação foi a estrutura de menor energia
encontrada pelo THOR/GSA. Este sistema apresentou as seguintes condições:
NÚMERO DE MOLÉCULAS DO SISTEMA
Número de moléculas de H
2
O
4131
Número de contra-íons
1 CL
-
Número total de átomos
12698
O diagrama que define os padrões de estrutura secundária assumida pela
cadeia polipeptídica ao longo da simulação mostra que a mini-proteína não se
estabilizou em nenhuma conformação secundária regular, apresentando-se
desestruturada (Figura 60). A maioria dos resíduos de aminoácidos visitaram
conformações de curvas e voltas durante toda a simulação.
A
B
Resultados e Discussão
104
Figura 60 Padrões de estrutura secundária por resíduo, ao longo da simulação, para o Trp-
cage. Em branco, os resíduos sem estrutura (random coil); em preto, os resíduos em ponte-beta (beta-
bridge); em verde, os resíduos em curvas (bend); em amarelo, os resíduos em voltas (turn); em cinza, os
resíduos em hélice-3 ou também denominado de hélice-3
10
.
O gráfico da figura 61a ilustra o -DRMQ das conformações da cadeia
polipeptídica do Trp-cage ao longo da simulação. Observa-se que, logo no início da
simulação, o desvio da estrutura em relação à de referência aumenta, deslocando-
se de 0,32 nm para próximo de 0,72 nm, o que é acompanhado pela perda do
número de ligações hidrogênio (Figura 61b). O -DRMQ médio foi de 0,57 nm.
Este alto valor médio no desvio e a alta flutuação são ratificados pela não
estruturação observada no diagrama de padrões de estrutura secundária, e pelo
pequeno número de ligações hidrogênio entre os átomos do esqueleto peptídico ao
longo de toda a simulação (média de 1,09 ligações hidrogênio durante toda a
simulação).
Resultados e Discussão
105
Figura 61 (A) Gráfico de -DRMQ do Trp-cage obtido ao longo dos 300 ns da dinâmica em
relação à estrutura de referência (estrutura do PBD, 1L2Y). (B) Gráfico do número de ligações
hidrogênio entre os átomos do esqueleto peptídico. Em vermelho, destacamos a "suavização" através
da média dos resultados a cada 300 pontos.
SISTEMA 3 CONFORMAÇÃO ESTENDIDA do Trp-cage sob o efeito
do Annealing na Dinâmica Molecular
Com o intuito de evitar as armadilhas dos mínimos locais observados em
simulações em temperatura constante, fizemos apenas a simulação da estrutura
estendida sob o efeito do annealing dinâmico. Estipulou-se a temperatura inicial do
sistema em 400 K. Esta temperatura foi sendo gradativamente reduzida até 300 K,
nos 50 ns iniciais. Nos próximos 250 ns da simulação a temperatura foi mantida à
300 K. O sistema apresentou as seguintes condições:
NÚMERO DE MOLÉCULAS DO SISTEMA
Número de moléculas de H
2
O
17489
Número de contra-íons
1 CL
-
Número total de átomos
52666
Através do gráfico que mostra a evolução temporal dos padrões de estrutura
secundária, pode-se observar que a cadeia polipeptídica assumiu uma conformação
em folha-beta depois dos 40 ns iniciais, mantendo-se estável nesta conformação
durante o restante da simulação (Figura 62). O primeiro segmento da folha-beta é
A
B
Resultados e Discussão
106
composto da Gln5 até Lys8, depois vem uma região de curva da Asp9 até a Pro12.
Esta conformação em curva pode estar sendo favorecida pelos dois resíduos de
Glicina (Gly10 e Gly11) no centro desta região, que resíduos de Glicina
consecutivos normalmente são encontrados em regiões de dobras. O outro
segmento da folha-beta compreende os resíduos Ser13, Ser14 e Gln15.
Pode-se observar que, a região de conformação tipo poli-prolina do C-
terminal observada experimentalmente, não assumiu nenhuma conformação
durante toda a simulação, da mesma forma que no Sistema 1.
Figura 62 Padrões de estrutura secundária por resíduo, ao longo da simulação, para o Trp-
cage. Em branco, os resíduos sem estrutura (random coil); em vermelho, os resíduos em folha-beta; em
preto, os resíduos em ponte-beta (beta-bridge); em verde, os resíduos em curvas (bend); em amarelo, os
resíduos em voltas (turn); em cinza, os resíduos em hélice-3 ou também denominado de hélice-3
10
.
Nota-se que logo após o rmino do annealing (50 ns), a cadeia polipeptídica
se estabiliza na conformação de folha-beta ficando até o final da simulação. O
gráfico -DRMQ comprova a estabilização da cadeia polipeptídica após os 50 ns
iniciais, na qual se mantém durante todos os 250 ns finais (Figura 63a). É bem
provável que esta estrutura em folha-beta seja de algum dos mínimos da
hipersuperfície de energia do sistema. O annealing desta simulação talvez não
tenha sido suficiente para fugir da bacia atratora do mínimo.
Uma possível estratégia para tentar evitar esta armadilha seria iniciar a
simulação a uma temperatura mais elevada e estender o tempo de annealing
dinâmico para valores maiores do que 50 ns.
O gráfico do -DRMQ das conformações ao longo da simulação mostra que
logo no início da simulação a cadeia polipeptídica do Trp-cage migra de uma
conformação (conformação estendida) que apresentava um grande desvio (1,45 nm),
Resultados e Discussão
107
para uma conformação com desvio de 0,55 nm. O valor do -DRMQ médio foi de
0,64 nm. Mesmo com o -DRMQ médio sendo mais alto do que no Sistema 2 do
Trp-cage, a estruturação da cadeia polipeptídica em uma conformação de folha-
beta justifica o mero médio de 4,52 ligações hidrogênio entre átomos do
esqueleto peptídico (Figura 63b).
Figura 63 (A) Gráfico de -DRMQ do Trp-cage obtido ao longo dos 300 ns da dinâmica em
relação à estrutura de referência (estrutura do PBD, 1L2Y). (B) Gráfico do número de ligações
hidrogênio entre os átomos do esqueleto peptídico. Em vermelho, destacamos a "suavização" através
da média dos resultados a cada 300 pontos.
4.3.3 Conclusões Parciais para o Trp-cage
Os resultados obtidos para o Trp-cage com o THOR/GSA, assim como os
resultados obtidos com o MP-X, apresentaram pequenas alterações, não
significativas, entre o algoritmo com o termo de energia de solvatação (COM SAS) e
o algoritmo sem ele (SEM SAS). Talvez, esta alteração não significativa entre os
algoritmos ocorra devido ao pequeno tamanho das moléculas em estudo. No
entanto, os resultados encontrados em ambos os procedimentos foram muito
satisfatórios se comparados com outros programas de busca estocástica [VERMA, A.
et al. (2006)], devido à boa convergência para estruturas próximas a experimental.
No entanto, a aplicação da DM não levou a resultados satisfatórios como no caso do
A
B
Resultados e Discussão
108
MP-X, em que a estrutura experimental foi refinada. Neste caso a estrutura não
convergiu como a DM aplicada à estrutura obtida com o THOR/GSA.
O fato do Trp-cage possuir um número maior de graus de liberdade se
comparado com o homo-peptídeo de 22-ala e com o MP-X, faz com que, talvez,
necessite de um número maior de passos do THOR/GSA para que consiga uma
melhor convergência.
A partir das informações obtidas pelos resultados de DM, podemos observar
que o uso da técnica de annealing dinâmico nas condições realizadas foi suficiente
para que se pudesse encontrar uma estruturação estável, porém não a estrutura
determinada experimentalmente. Acredita-se que ajustes e calibração dos
parâmetros que controlam o annealing possam ajudar a convergir a cadeia
polipeptídica do Trp-cage em conformações mais próximas à do PDB.
Além disso, uma termalização pré-simulação mais refinada, como, por
exemplo, o aumento gradual da temperatura e a subseqüente diminuição,
gradativa, da restrição dos átomos pesados do sistema possa ajudar com que não
ocorra a indesejada perda de estrutura logo no início da simulação, como ocorreu
no Sistema 2, partindo-se da conformação de menor energia encontrada pelo GSA.
Resultados e Discussão
109
4.4 Villin Headpiece
A Villin Headpiece (HP-36) é uma pequena proteína de 4,2 kDa, composta por
36 aminoácidos (MLSDEDFKAVFGMTRSAFANLPLWKQQNLKKEKGLF), determinada
por RMN em meio aquoso à temperatura ambiente e pH de 3,7 (cód. do PDB: 1VII
[McKNIGHT, C. J. et al. (1997)]. Na verdade, esta proteína é um subdomínio
(C-terminal) termoestável da proteína ligante de actina, a villin. A HP-36 apresenta
um enovelamento rápido e independente, formando um feixe de três hélices-alfa
(primeira hélice-alfa: Asp4-Val10; segunda hélice-alfa: Arg15-Phe18; terceira hélice-
alfa: Leu23-Lys30) estabilizadas por contatos hidrofóbicos (Figura 64) [LUCENT, D. et
al. (2007)]. Cada uma destas três hélices contribui para a estabilização do núcleo
hidrofóbico da proteína. Mais de 70% da superfície dos resíduos que formam o
núcleo hidrofóbico (Leu2, Phe7, Val10, Phe11, Phe18, Lys25, Gln26 e Leu29) estão
inacessíveis ao solvente. A Phe7 é o resíduo mais internalizado de todos, (95% da
sua superfície não está acessível ao solvente) [McKNIGHT, C. J. et al. (1997)]. Esta
proteína é comumente estudada tanto por todos experimentais como por
métodos computacionais, devido ao seu pequeno tamanho e sua cinética de
enovelamento rápida. A HP-36 foi uma das primeiras proteínas a ter seu processo
de enovelamento simulado, com detalhes atômicos, pelo projeto Folding@Home
utilizando computação paralela em larga escala [JAYACHANDRAN, G. et al. (2006)].
Resultados e Discussão
110
Figura 64 Representação, na forma de New Cartoon, da estrutura da Villin Headpiece.
(Código PDB: 1VII [McKNIGHT, C. J. et al. (1997)]. Cada hélice-alfa possui uma volta estabilizada por
ligações hidrogênio (Ala9, Ala19, Lys33). Em destaque os resíduos do núcleo hidrofóbico da Hp-36,
Leu2, Phe7, Val10, Phe11, Phe18, Lys25, Gln26 e Leu29. Mais de 70% da superfície destes resíduos
estão inacessíveis ao solvente.
A HP-36 se torna um modelo atraente para o estudo do desempenho do
THOR/GSA com o termo de energia de solvatação, pelo fato de possuir quase o
dobro de tamanho do Trp-cage, e por possuir uma cinética de enovelamento em
ambiente aquoso. Além disso, assim como o Trp-cage, a HP-36 é um modelo de
estudo para calibração e refinamento de diversos métodos computacionais de
predição de estrutura, o que nos facilita numa avaliação, com maior precisão, do
momento e das condições em que o GSA atinge o resultado esperado, além de uma
possível comparação com outros métodos de predição.
Resultados e Discussão
111
4.4.1 Resultados GSA para a HP-36
Com o objetivo de avaliar a eficiência do THOR/GSA, apresentaremos nesta
seção, os resultados encontrados com a aplicação do algoritmo à estrutura da
HP-36, partindo de uma conformação inicial estendida (Figura 65).
Figura 65 Estrutura primária estendida da Villin Headpiece (Met-Leu-Ser-Asp-Glu-Asp-Phe-
Lys-Ala-Val-Phe-Gly-Met-Thr-Arg-Ser-Ala-Phe-Ala-Asn-Leu-Pro-Leu-Trp-Lys-Gln-Gln-Asn-Leu-Lys-
Lys-Glu-Lys-Gly-Leu-Phe).
Os resultados foram alcançados utilizando os mesmos parâmetros q
A
, q
V
e q
T
,
discutidos na seção 4.1 (utilizados nos modelos de Poli-ala, MP-X e Trp-cage
[q
A
= 2.1, q
V
= 1.9 e q
T
= 1.7]. O valor da temperatura inicial e o número de passos
também foram iguais aos modelos estudado anteriormente (T
0
= 100 e
5.000.000 passos). Assim como para o MP-X e o Trp-cage, conferimos liberdade de
rotação aos ângulos de torção das cadeias laterais χ, além dos ângulos φ e ψ. Os
detalhes do arquivo de entrada (*.IN)] da HP-36 para o programa THOR/GSA podem
ser encontrados no apêndice A.
Assim como nos outros dois modelos estudados anteriormente (MP-X e Trp-
cage), foram feitas 50 simulações com o termo de energia de solvatação (COM SAS)
e outras 50 sem o termo (SEM SAS), na qual apenas a semente para a geração do
número aleatório era modificada (Figura 66).
Através da análise de -DRMQ de todas as estruturas foi possível observar
que a diferença entre àquelas encontradas pelo algoritmo com e sem o termo de
energia de solvatação, foi bem pequena. A estrutura utilizada como referência para
o cálculo do -DRMQ foi a estrutura determinada experimentalmente por RMN
(cód. do PDB: 1VII).
O -DRMQ médio das estruturas encontradas pelo THOR/GSA com o termo
de energia de solvatação (COM SAS) foi de 0,96 nm, contra 0,92 nm das estruturas
encontradas sem o termo de energia de solvatação (SEM SAS).
Além da menor média, a estrutura que apresentou menor energia
(72,89 kcal/mol), que também apresentou o menor -DRMQ (0,70 nm), foi
Resultados e Discussão
112
encontrada pelo THOR/GSA SEM SAS (Figura 66a). A energia da estrutura
determinada experimentalmente, calculada pelo THOR, foi de 5,55 kcal/mol.
A sobreposição da estrutura de menor energia encontrada pelo THOR/GSA
SEM SAS, com a estrutura determinada experimentalmente, está representada na
Figura 66b.
Resultados e Discussão
113
A
B
Figura 66 Villin Headpiece. (A) Gráfico relacionando o desvio dos átomos de carbono-α do
esqueleto peptídico (-DRMQ) das estruturas geradas pelo GSA em relação à estrutura de referência
(estrutura da HP-36 determinada por RMN [cód. PDB 1VII]). Em vermelho estão representadas as
50 estruturas encontradas pelo algoritmo do GSA sem o termo de energia de solvatação (SEM SAS), e
em preto estão representadas as 50 estruturas encontradas pelo algoritmo do GSA com o termo de
energia de solvatação (COM SAS). (B) Sobreposição da estrutura de menor energia encontrada, que
também apresenta o menor -DRMQ (0,70 nm) (estrutura verde), em relação à estrutura depositada
no PDB, 1A13 (estrutura azul).
Resultados e Discussão
114
A diferença entre o valor do -DRMQ da estrutura de menor energia
encontrada pelo THOR/GSA COM SAS e a estrutura encontrada SEM SAS foi de
0,08 nm.
Uma alternativa para melhorar os resultados seria o aumento do número de
avaliações (passos) que a cadeia da HP-36 é bem maior do que as estudadas
anteriormente. No entanto, isto aumentaria drasticamente o custo computacional.
É válido ressaltar que, para a obtenção de apenas uma estrutura utilizando o
THOR/GSA COM SAS nas condições acima, em um processador
intel®Xeon®@2.5Ghz, o tempo despendido foi de 68horas. Uma possível solução
para diminuir este tempo, mesmo aumentando o número de avaliações, seria não
deixar as cadeias laterais assumirem qualquer conformação, mas sim um conjunto
discreto de estados de baixa energia denominados rotâmeros. Para o esqueleto
peptídico, poderia priorizar-se a busca nas posições favoráveis do diagrama de
Ramachandran. Desta forma, reduziria-se consideravelmente o número de graus de
liberdade.
Com o objetivo de terminar de convergir a estrutura de menor energia
encontrada pelo THOR/GSA para uma similar da que fora determinada
experimentalmente, utilizamos o método de DM.
4.4.2 Resultados da Dinâmica Molecular para a HP-36
Sabendo-se que os detalhes atômicos do processo de enovelamento da HP-36
partindo da estrutura completamente estendida já foram determinados através de
simulações por DM, com representação do solvente explícito [FREDDOLINO, P. L. et
al. (2009)], na qual foram necessários 6 μs para se atingir a estrutura desejada,
apenas duas simulações foram construídas. Uma partindo da estrutura
determinada experimentalmente, com a finalidade de se obter um protocolo de
estabilização, e outra partindo da estrutura de menor energia encontrada pelo GSA,
com o objetivo de convergí-la.
Reproduzindo as condições experimentais, simulamos a HP-36 em ambiente
aquoso, temperatura ambiente e no estado de protonação do pH = 3,7. Para
calcular o estado de protomação dos resíduos ionizáveis da HP-36 no pH 3,7
empregamos o servidor PROPKA (http://propka.ki.ku.dk) [(LI, H. et al. (2005)] que
utiliza um conjunto de parâmetros empíricos (ligação hidrogênio, interações por
carga e efeito de desolvatação dos resíduos tituláveis) para calcular os valores pK
a
Resultados e Discussão
115
dos resíduos em diferentes micro-ambientes. O servidor apontou para a protonação
dos seguintes resíduos: Glu5, Asp6 e Glu32 da HP-36.
Os sistemas preparados para o estudo por DM apresentaram as seguintes
características:
I. Sistema 1
Sistema Controle
Estrutura inicial
Estrutura do PDB (1VII)
Solvente
H
2
O
Temperatura
300 K
Pressão
1 atm
II. Sistema 2
Sistema da conformação de menor energia encontrada
pelo GSA
Estrutura inicial
Estrutura de menor energia
encontrada pelo GSA
Solvente
H
2
O
Temperatura
300 K
Pressão
1 atm
Em todos os sistemas a proteína foi solvatada numa caixa dodecaédrica com
dimensões próximas de 3,126 x 1,896 x 2,893 nm, que possuí uma distância
mínima dos lados à proteína de 1,5 nm. Pelo fato da HP-36 apresentar carga total
+5, todos os sistemas foram neutralizados pela adição de cinco átomos de contra-
íons Cloro (CL
-
). Todos os sistemas foram submetidos à 300 ns de simulação, à 1
atm a 300 K.
O algoritmo LINCS [HESS, B. et al. (1997)] foi utilizado para vincular todos os
comprimentos de ligação envolvendo átomos de hidrogênio, e o algoritmo SETTLE
[MIYAMOTO, S. & KOLLMAN, P. A. (1992)] para a geometria do solvente. Os controles
da temperatura e da pressão foram realizados por acoplamento segundo o
formalismo de Berendsen [BERENDSEN, H. J. C. (1984)]. Para o tratamento
eletrostático utilizou-se o método PME (Particle Mesh Ewald) [ESSMAN, U. et al.
(1993)] com raio de corte de 10 Å para as interações eletrostáticas de van der Waals
e de Coulomb. O método PME aumenta em muito o custo computacional, todavia é
empregado para uma descrição rigorosa das interações de longo alcance e os
trabalhos da literatura o empregam para o estudo da HP-36 [WICKSTROM, L. et al.
(2007); MONTICELLI, L. et al. (2006)]. O campo de força OPLS/AA [JORGENSEN, W. L. et
al. (1983)] foi utilizado pelo mesmo motivo. O modelo de água utilizado foi o TIP4P
Resultados e Discussão
116
(Transferable Intermolecular Potentials -4 Points) [JORGENSEN, W. L. et al. (1983)].
Este modelo de água foi empregado por ser o modelo ideal para se trabalhar com o
campo de forças OPLS/AA.
A energia foi previamente minimizada pelo método de Máximo Declive com
restrição de posição dos átomos pesados. Depois foi feita uma minimização,
também com o todo de Máximo Declive, porém do sistema inteiro, sem
restrições. Depois disto, ainda utilizamos o método Gradiente Conjugado para
terminar de minimizar o sistema. Além das minimizações de energia, foi necessário
realizar uma DM de 5 ns, com restrições de posição dos átomos pesados da
proteína, na temperatura de 300 K, com o objetivo de acomodar as moléculas de
água ao redor da proteína.
SISTEMA 1 CONTROLE
O sistema controle foi preparado a partir da estrutura determinada por RMN
(PDB 1VII) [McKNIGHT, C. J. et al. (1997)]) e apresentou as seguintes condições:
NÚMERO DE MOLÉCULAS DO SISTEMA
Número de moléculas de H
2
O
5083
Número de contra-íons
5 CL
-
Número total de átomos
20930
As variações estruturais da cadeia polipeptídica da HP-36 durante os 300 ns
de simulação podem ser visualizadas no seu conjunto pelo gráfico dos padrões de
estrutura secundária por resíduo, como mostrado na figura 67. Observa-se que o
sistema manteve poucas variações na estabilidade das três hélices durante,
praticamente, toda a simulação. No entanto, a primeira hélice (Asp4-Val10) se perde
no final da simulação. Esta perda é condizente com os resultados da literatura, que
mostram que a estrutura desta hélice e o C-terminal variam bastante no conjunto
de estruturas do RMN [McKNIGHT, C. J. et al. (1997); JAYACHANDRAN, G. et al. (2006);
LEI, H. et al. (2006)].
Nota-se que a segunda hélice (Arg15-Phe18) foi a mais estável da simulação.
Esta hélice é importante para a estabilidade do núcleo hidrofóbico [WICKSTROM, L.
et al. (2007)].
Resultados e Discussão
117
Figura 67 Padrões de estrutura secundária por resíduo, ao longo da simulação, para o Villin
Headpiece. Em branco, os resíduos sem estrutura (random coil); em preto, os resíduos em ponte-beta
(beta-bridge); em verde, os resíduos em curvas (bend); em amarelo, os resíduos em voltas (turn); em
roxo, resíduos em hélice-5 ou também chamada de hélice-π; em cinza, os resíduos em hélice-3 ou
também chamada de hélice-3
10
; em azul, resíduos em hélice-alfa.
Este tipo de comportamento é comprovado também pela análise do Cα-
DRMQ das estruturas ao longo da simulação e a estrutura de referência, que neste
caso, fora a estrutura determinada experimentalmente por RMN (cód do PDB: 1VII).
O Cα-DRMQ médio durante toda a simulação foi de aproximadamente 0,31 nm, e
de 0,27 nm durante os 265 ns iniciais, o que indica que as conformações, na maior
parte do tempo, estão próximas da estrutura de referência.
Nota-se que, apenas próximo dos 265 ns, o valor do Cα-DRMQ passa para
faixa superior a de 0,4 nm. Este aumento no valor do Cα-DRMQ é corroborado pela
redução do número de ligações hidrogênio mostrada no gráfico da Figura 68b.
O sistema apresentou um mero médio de 13,74 ligações hidrogênio entre
átomos do esqueleto peptídico ao longo de toda a simulação.
Resultados e Discussão
118
Figura 68 (A) Gráfico de -DRMQ da Villin Headpiece obtido ao longo dos 300 ns da
dinâmica em relação à estrutura de referência (estrutura do PBD, 1VII). (B) Gráfico do número de
ligações hidrogênio entre os átomos do esqueleto peptídico.
SISTEMA 2 CONFORMAÇÃO ENCONTRADA PELO GSA
O objetivo desta simulação é terminar de convergir a estrutura de menor
energia encontrada pelo THOR/GSA para uma próxima da estrutura determinada
experimentalmente. Desta forma, utilizamos a estrutura de menor energia obtida
com o GSA para iniciar a simulação por DM. O sistema apresentou as seguintes
condições:
NÚMERO DE MOLÉCULAS DO SISTEMA
Número de moléculas de H
2
O
6514
Número de contra-íons
5 CL
-
Número total de átomos
26675
O diagrama que define os padrões de estrutura secundária assumida pela
proteína ao logo da simulação mostra que não houve a formação de nenhuma das
três hélices existentes na estrutura determinada experimentalmente durante toda a
simulação (Figura 69). Logo no início da simulação (perto dos 40 ns), a cadeia
polipeptídica da HP-36 se orienta formando uma folha-beta entre os resíduos Asp4-
Asp6 e Ala17-Ala19. Essa folha beta é desfeita próximo dos 170 ns. Porém, logo
A
B
Resultados e Discussão
119
após a estruturação em folha-beta ter sido perdida, a cadeia permaneceu
estruturada em ponte-beta (Asp4 e Ala19). Provavelmente esta orientação dificulta a
formação das hélices-alfa que a estrutura experimental apresenta.
Figura 69 Padrões de estrutura secundária por resíduo, ao longo da simulação, para o Villin
Headpiece. Em branco, os resíduos sem estrutura (random coil); em vermelho, os resíduos em folha-
beta; em preto, os resíduos em ponte-beta (beta-bridge); em verde, os resíduos em curvas (bend); em
amarelo, os resíduos em voltas (turn); em cinza, os resíduos em hélice-3 ou também denominado de
hélice-3
10
.
O gráfico do -DRMQ das conformações ao longo da simulação (Figura 70a)
mostra uma instabilidade estrutural nos 40 ns iniciais de simulação. Entretanto,
após os 40 ns, a cadeia polipeptídica da HP-36 assume uma estabilidade
conformacional, o que pode se acompanhado com o início da estruturação da
cadeia polipeptídica em folha-beta observada no gráfico do padrão de estrutura
secundária. O valor alto médio do Cα-DRMQ (0,93 nm) e a estabilidade
conformacional encontrada pela cadeia polipeptídica sugerem que, provavelmente,
esta estrutura esteja perto de algum mínimo de energia.
Pelo gráfico da Figura 70b observamos que o número de ligações hidrogênio
acompanha a estruturação e desestruturação da folha-beta. Nota-se que o número
de ligações hidrogênio é bem menor do que o número de ligações apresentado pelo
Sistema 1.
Resultados e Discussão
120
Figura 70 (A) Gráfico de -DRMQ da Villin Headpiece obtido ao longo dos 300 ns da
simulação em relação a estrutura de referência (estrutura do PBD, 1VII). (B) Gráfico do número de
ligações hidrogênio entre os átomos do esqueleto peptídico.
4.4.3 Conclusões Parciais para a HP-36
Os resultados obtidos pelo THOR/GSA mostram que, mesmo a Villin
Headpiece tendo quase o dobro do tamanho do Trp-cage, ainda parece ser pequena
para ser estudada pelo THOR/GSA com o termo de energia de solvatação através do
cálculo da Área Acessível ao Solvente. Uma possível forma de contornar este
problema do tamanho, no qual muitos átomos estão expostos ao solvente, e sendo
penalizados energeticamente pelo algoritmo, é a de utilizar um termo simples de
energia de solvatação que não leve em consideração o cálculo da área acessível ao
solvente, ganhando tempo de CPU. Além disto, pelo fato de atribuirmos flexibilidade
às cadeias laterais da proteína, aumentando, portanto, o grau de liberdade,
deveríamos ter aumentado também o número de passos.
A tentativa de convergir a estrutura de menor energia encontrada pelo GSA
empregando a DM não foi bem sucedida, mesmo com 300 ns de dinâmica. É
interessante notar que, no início da simulação o Cα-DRMQ está em torno de 0,6 nm
e após o período de oscilação conformacional ele estabiliza acima de 0,9 nm (Figura
70a). Isto aponta para uma revisão da estratégia de simulação por DM, de forma a
A
B
Resultados e Discussão
121
introduzir o mínimo possível de perturbação no sistema no início da dinâmica.
Talvez, se encontrássemos uma estrutura mais próxima da determinada com o GSA
e aumentássemos o tempo de simulação, atentos ao período de termalização,
conseguiríamos um resultado mais satisfatório.
Conclusões e Perspectivas
122
5 Conclusões e
Perspectivas
Dentre os objetivos deste trabalho incluiu-se o desenvolvimento e aplicações
de técnicas de simulação para investigar o enovelamento protéico. Foi
implementado no pacote computacional THOR/GSA, desenvolvido pelo grupo, um
termo de energia de solvatação para representar os efeitos do solvente de forma
implícita. Assim, seria possível a abordagem de sistemas moleculares mais
realistas, principalmente, sendo o enovelamento de proteínas em grande parte
dirigido pelo efeito hidrofóbico. Foram feitas varreduras nos parâmetros q
A
, q
V
e q
T
do GSA para escolha dos melhores valores aplicáveis ao enovelamento de proteína e
no ancoramento molecular (docking molecular). Outro objetivo foi estabelecer
protocolos e utilizar o todo de Dinâmica Molecular para refinar as estruturas de
menor energia encontradas pelo THOR/GSA, além de estabelecer protocolos para
estudar o enovelamento de proteínas e peptídeos partindo da estrutura
completamente estendida.
A partir da comparação dos resultados do trabalho de Flávia Agostini, sobre
o polímero de 18 alaninas [AGOSTINI, F. P. et. al. (2006)], com os resultados deste
trabalho, sobre o polímero de 22 alaninas, observou-se que, na busca pelo mínimo
global, existe uma relação inversa entre os valores ideais de q
V
e q
T
(com o aumento
de q
T
, ocorre a diminuição dos valores de q
V
). No entanto, no presente trabalho,
observou-se também uma relação direta entre os valores ideais de q
T
e q
A
, de forma
que, o aumento nos valores ideais de q
T
é acompanhado do aumento nos valores
ideais de q
A
. Notou-se também, que as mesmas ries de valores ideais destes
parâmetros podem ser empregadas tanto no enovelamento de cadeias polipeptídicas
quanto no ancoramento molecular. Além disto, conseguimos encontrar uma faixa
para os valores ótimos dos parâmetros do GSA na qual estão inseridas nas faixas
encontradas nos estudos anteriores com a 13 e 18-ala por Agostini. O refinamento
na busca pela relação dos parâmetros possibilitou maior precisão na escolha destes
parâmetros. As faixas ideais para esses parâmetros encontradas no presente
Conclusões e Perspectivas
123
trabalho foram (q
A
= 1,9-2,9; q
V
= 1,1-2,1; q
T
= 1,7-2,3).
Em métodos estocásticos é impossível arrastar o solvente, representado
explicitamente, devido às grandes mudanças na configuração do sistema em estudo
em passos sucessivos. Porém, a água chega a contribuir com cerca de 80% da
massa corporal de seres vivos, o que faz com que o solvente aquoso tenha papel
crucial no enovelamento e estabilidade de proteínas e na sua interação com outras
moléculas. Em simulações envolvendo biomoléculas, portanto, é fundamental uma
boa representação do solvente, seja de maneira implícita em métodos estocásticos
ou em cálculos muito pesados computacionalmente como os empregando Mecânica
Quântica, ou de maneira explícita, representando átomo a átomo, em métodos
determinísticos como a Dinâmica Molecular.
Devido à necessidade da inclusão de um termo que simulasse o solvente
adequadamente no algoritmo GSA, para o tratamento de macromoléculas biológicas
mais complexas, foi incluído no cálculo da energia potencial do programa
THOR/GSA um termo simplificado de energia livre de solvatação, baseado no
lculo da Área Acessível ao Solvente [EISENBERG, D. & McLANCHLAN, A. D. (1986)].
Apesar do grande custo computacional, no entanto, os resultados não
apresentaram mudanças significativas quando comparados com os obtidos sem o
uso deste termo de solvatação.
Uma forma de tentar corrigir este problema envolveria testar outros
tratamentos implícitos para o solvente, implementando termos simplificados de
energia livre de solvatação que não necessitassem do cálculo da Área Acessível ao
Solvente. Um dos principais programas de predição de estrutura, o ROSETTA
1
, vem
ganhando grande notoriedade utilizando um termo proposto por Lazaridis e
Karplus, dependente apenas da distância entre os átomos no cálculo da energia
livre de solvatação [LAZARIDIS, T. & KARPLUS, M. (1999)]. Este termo assume que a
energia livre de solvatação de uma proteína é dada pelo somatório das contribuições
individuais de cada átomo e depende do volume excluído, devido à presença de
grupamentos vizinhos. Na continuidade deste projeto será feita a implementação
deste método.
Ainda a respeito do GSA, sabe-se que otimizar os ângulos de torção das
cadeias laterais implica em aumentar consideravelmente o número de graus de
liberdade do sistema, o que acaba aumentando drasticamente o número de
1
ROSETTA é um programa de predição de estrutura e de projeto de proteínas.
Conclusões e Perspectivas
124
iterações. Sabendo-se disso, uma idéia para minimizar este problema seria a
inclusão de uma biblioteca de rotâmetros dependente da conformação do esqueleto
peptídico [DUNBRACK, R. L. & KARPLUS, M. (1994)], para não deixar as cadeias
laterais assumirem qualquer conformação, mas sim, um conjunto discreto de
estados de baixa energia. Outra forma de aumentar a eficiência do programa seria
adicionar uma restrição no espaço de busca conformacional para apenas os
ângulos permitidos pelo diagrama de Ramachandran [RAMACHANDRAN, G. N. et al.
(1963)].
Atualmente, a fácil acessibilidade a computadores multicores faz com que o
passo seguinte a ser dado no projeto do programa THOR/GSA seja torná-lo capaz
de ser executado em paralelo. Visto que, os sistemas multiprocessados podem ser
uma ótima idéia ao grande aumento dos custos computacionais que as simulações
alcançam. Assim, seria também possível buscar conformações de menor energia
em paralelo, a partir de diversas condições iniciais diferentes. A estrutura de menor
energia obtida poderia ser novamente distribuída por n-processadores e o cálculo
repetido sucessivamente, até que estruturas de menor energia não sejam mais
obtidas e o desvio em relação à estrutura média fosse menor que 0,1 nm.
Os resultados que garantiram a convergência do mastoparano-X para a
mesma estrutura determinada experimentalmente apontam para uma estratégia de
se utilizar as duas técnicas GSA e DM acopladas, no qual o GSA inicia o
enovelamento gerando rapidamente estruturas pré-enoveladas, e a DM termina de
convergir refinando as estruturas de menor energia encontradas pelo GSA. É muito
caro computacionalmente usar apenas da DM convencional em conformações
estendidas para se encontrar a entrada do funil de enovelamento na superfície de
energia. Por outro lado, com o GSA é possível localizar o funil de enovelamento na
superfície de energia, mas ainda não se pode mergulhar nele em busca do mínimo
global em sistemas mais realistas, devido à falta de uma melhor representação do
solvente.
A estratégia de acoplar as técnicas GSA e DM é promissora, como apontam
os resultados com o mastoparano-X, mas carece ainda de uma melhor convergência
para o GSA, o que se conseguiria com um bom tratamento da solvatação, e de um
protocolo que elimine perturbações conformacionais na DM, como as observadas
para a Villin-headpiece.
Acredita-se que a hipersuperfície de energia de uma proteína em solução seja
bastante rugosa, e desta forma, em temperatura ambiente, o sistema protéico,
Conclusões e Perspectivas
125
normalmente, fica "preso" nos vários mínimos locais [ZHOW, R. (2003)]. Uma
maneira de evitar os indesejados mínimos locais, que vem ganhando notoriedade é
o uso das simulações de troca de réplicas em DM (Replica Exchange Molecular
Dynamics REMD). Esta técnica é empregada para aumentar a freqüência no
acesso às conformações da cadeia, especialmente se as conformações são
separadas por barreiras energéticas. Ela será empregada na continuidade deste
projeto.
Referências Bibliográficas
126
6 Referências
Bibliográficas
Agostini, F. P. Mapeamento de Parâmetros do Simulated Annealing Generalizado
aplicado ao problema do Enovelamento de Proteínas. Tese de doutorado LNCC - 2008.
Agostini, F. P.; Soares-Pinto, D. O.; Osthoff, C.; Moret, M. A. & Pascutti, P. G. Generalized
Simulated Annealing applied to protein folding studies. J. Comp. Chem., 27:1142-1155,
2006.
Agostini, F. P.; Osthoff, C.; Vassalo, A.; Soares-Pinto, D. O.; Pascutti, P. G. A Grid
Alternative Solution for Protein Folding Studies Applications. Revista Tecnologia da
Informação, 3(2):103-105, 2003.
Alberts, B. Molecular biology of the the cell. ed. Porto Alegre: Editora Artmed., 2004.
Alder, B. J. & Wainwright, T. E. Phase transition for a hard sphere system. J. Chem.
Phys., 27(5):1208-1209, 1957.
Alves, N. A. & Hansmann, U. H. E. Partition function zeros and finite size scaling of
helix-coil transitions in a polypeptide. Phys. Rev. Lett., 84(8):1836-1839, 2000.
Alves, N. A. & Hansmann, U. H. E. Yang-Lee zeros and the helix-coil transition in a
continuum model of polyalanine. Physica A Statistical Mechanics and its Applications,
292(1-4):509-518, 2001.
Andricioaei, I. & Straub, J. E. Generalized simulated annealing algorithms using Tsallis
statistics: application to conformational optimization of a tetrapeptide of special
interest. Phys. Rev. E, 53:R3055-R3058, 1996.
Anfinsen, C. B. & Scheraga, H. A. Experimental and theoretical aspects of protein
folding. Adv. Protein Chem., 29:205300, 1975.
Anfinsen, C. B. Principles that govern the folding of proteins. Science, 181:187, 1973.
Anfinsen, C. B. Studies on the principles that govern the folding of protein chains. Les
Prix Nobel, 103-119, 1972.
Anfinsen, C. B.; Haber, E.; Sela, M. & White, F. H. The kinetics of formation of native
ribonuclease during oxidation of the reduced polypeptide chain. Proc. Natl. Acad. Sci.
U.S.A., 47:1309-1314, 1961.
Barua, B. & Andersen, N. H. Determinants of miniprotein stability: can anything
replace a buried H-bonded Trp sidechain? Letters in Peptide Science, 8:221-226, 2001.
Berendsen, H. J. C.; Postma, J. P. M.; Dinola, A. & Haak, J. R.. Molecular Dynamics with
Coupling to an External Bath. J. Chem. Phys., 81:3684-3690, 1984.
Referências Bibliográficas
127
Berendsen, H. J. C.; Postma, J. P. M.; Van Gunsteren, W. F. & Hermans, J. In
Intermolecular Forces. Editado por B. Pullman. Ed. Reidel, Dordrecht (Holanda), pp. 331-
342, 1981.
Bhuyan, A. K. & Udgaonkar, J. B. Real-time NMR measurements of protein folding and
hydrogen exchange dynamics. National Center for Biological Sciences, Current Science, vol.
77, n°. 7, Bangalore, Índia, 1999.
Branden, C. & Tooze, J. Introduction to protein structure. Gerland Publishing Inc., New
York and London, 1991.
Brooijmans, N. & Kuntz, I. Molecular recognition and docking algorithms. Ann Rev
Biophys. and Biomol. Struct., 32:335, 2003.
Brooks III, C. L. Methodological advances in molecular dynamics simulation of
biological systems. Cur. Op. Struc. Biol., 5(2):211-215, 1995.
Brooks III, C. L.; Gruebele, M.; Onuchic, J. N. & Wolynes, P. G. Chemical Physics of
Protein Folding. Proc. Natl. Acad. Sci. U.S.A., 95:11037-11038, 1998.
Brooks III, C. L.; Karplus, M. & Pettitt, B. M. Proteins: A Theorical Perspective of
Dynamics Structure, and Thermodynamics. Advances in chemical physics, LXXI, John
Wiley & Sons, New York, 1988.
Brooks, B. R.; Bruccoleri, R. E.; Olafson, B. D.; States, D. J.; Swaminathan, S. & Karplus,
M. CHARMM: A Program for Macromolecular Energy, Minimization, and Dynamics
Calculations. J. Comp. Chem., 4(2):187-217, 1983.
Bryngelson, J. D. & Wolynes, P. G. Spin-Glasses and the Statistical-Mechanics of Protein
Folding. Proc. Natl. Acad. Sci. U.S.A., 84(21): 7524-7528, 1987.
Bryngelson, J. D.; Onuchic, J. N.; Socci, N. D. & Wolynes, P. G. Funnels, pathways and
the energy landscape of protein folding: a synthesis. Protein Struct. Funct. Genet.,
21:167-195, 1995.
Buck, M. Trifuoroethanol and colleagues: cosolvents come of age. recent studies with
peptides and proteins. Quarterly Reviews of Biophysics, 31:297-355, 1998.
Cabrera, M. P. D.; de Souza, B. M.; Fontana, R.; Konno, K., Palma, M. S.; de Azevedo, W. F.
& Neto, J. R. Conformation and Lytic activity of eumenine mastoparan: a new
antimicrobial peptide from wasp venom. J. Peptide Res., 64:95-103, 2004.
Ceperley, D. & Alder, B. Quantum Monte Carlo. Science, 231(4738):555-560, 1986.
Chakrabartty, A.; Kortemme, T. & Baldwin, R. L. Helix propensities of the amino acids
measured in alanine-based peptides without helix-stabilizing side-chain interactions.
Protein Sci., 3:843852, 1994.
Chan, H. S. & Dill, K. A. The protein folding Problem. Physics Today, 46:24-32, 1993.
Chou, P. Y. & Fasman, G. D. Empirical predictions of protein conformation. Annu. Rev.
Biochem., 47:251-276, 1978.
Chowdhury, S.; Lee, M. C.; Xiong, G. M. & Duan, Y. Ab initio folding simulation of the
Trp-cage mini-protein approaches NMR resolution. J. Mol. Biol., 327:711-717, 2003.
Referências Bibliográficas
128
Chuang, C. C.; Huang, W. C.; Yu, H. M.; Wang, K. & Wu, S. Conformation of Vespa
basalis Mastoparan-B in trifluoroethanol-containing aqueous solution. Biochim.
Biophys. Acta., 1292:1-8, 1996.
Connolly, M. L. Analytical molecular surface calculation. J. Appl. Crystallogr., 16: 548-
558, 1983.
Costa, S. T. B. Estudos Conformacionais por Dinâmica Molecular de Peptídeos
Antimicrobianos da Família dos Mastoparanos em Misturas de TFEgua. Tese de
doutorado. UNESP, 2006.
Coutinho, K. Modelo discreto de solvente. Tese de doutorado, - USP, 1997.
Crandall, Y. M. & Bruch, M. D. Characterization of the Structure and Dynamics of
Mastoparan-X During Folding in Aqueous TFE by CD and NMR Spectroscopy.
Biopolymers, 89(3):197-209, 2007.
Creighton, T. E. Protein folding. Biochemical Journal, 270:1-16, 1990.
Creighton, T. E. Proteins. Structures and macromolecular properties. 2
nd
ed. W.H.
Freeman, New York, 1993.
da SILVA, A. W. S. Estudo Por Modelagem E Dinâmica Molecular Da Protease De
Variantes Do rus Da Imunodeficiência Humana Tipo 1 Resistentes A Drogas
Antivirais. Tese de doutorado - IBCCF/UFRJ, 2003.
Da Silva, D. M. Estudo de Otimização Global com Base na Termoestatística Não-
Extensiva. Tese de Mestrado, 2005.
Dahiyat, B. I. & Mayo, S. L. De novo protein design: fully automated sequence selection.
Science, 278:82-87, 1997.
Darden, T.; York, D. & Pedersen, L. G. Particle Mesh Ewald An N.Log(N) Method for
Ewald Sums in Large Systems J. Chem. Phys., 98:1008910092, 1993.
Dardenne, L. E.; Caffarena, E. R.; Ortmans, I. & Loos, M. PDBTHORBOX. 1999.
Davies, M. N.; Toseland, C. P.; Moss, D. S. & Flower, D. R. Benchmarking pKa prediction.
BMC Biochemistry, 7:18, 2006.
de la Paz, M. L.; Lacroix, E.; Ramirez-Alvarado, M. & Serrano, L. Computer-aided design of
beta-sheet peptides. J. Mol. Biol., 312:229-246, 2001.
Dill, K. A. & Chan, H. S. From Levinthal to pathways to funnels.” Nature Structure
Biology, 4:10-19, 1997.
Dill, K. A.; Bromberg, S.; Yue, K.; Fiebig, K. M.; Yee, D. P.; Thomas, P. D. & Chan, H. S.
Principles of protein folding A perspective from simple exact models. Protein Science,
4:561-602, 1995.
Ding, F.; Buldyrev, S. V. & Dokholyan, N. V. Direct molecular dynamics observation of
protein folding transition state ensemble. Biophys. J., 88:147-155, 2005.
Dunbrack, R. L. & Karplus, M. Conformational analysis of the backbone-dependent
rotamer preferences of protein sidechains. Nat. Struct. Biol., 1(5):334-340, 1994.
Referências Bibliográficas
129
Eisenberg D. & McLachlan A. D. Solvation energy in protein folding and binding. Nature,
319:199-203, 1986.
Englander, S. W. & Mayne, L. Protein Folding Studied using Hidrogen-Exchange
Labeling and 2-Dimensional NMR. Annu. Rev. Biophys. Biomol. Struct., 21:243-265, 1992.
Essman, U.; Perera, L.; Berkowitz, M. L.; Daren, T.; Lee, H. & Pedersen, L. G. A Smooth
Particle Mesh Ewald Method. J. Chem. Phys., 103:8577-8592, 1995.
Faísca, P. F. N. & Telo da Gama, M. M. Folding of small proteins: a matter of geometry?
Molec. Phys., 103:2903-2910, 2005.
Faham, S.; Hileman, R. E.; Fromm, J. R.; Linhardt, R. J. & Rees, D. C. Heparin structure
and interactions with basic fibroblast growth factor. Science, 271(5252):1116-1120,
1996.
Faísca, P. F. N. “O mistério da forma das proteínas”, O Código Secreto: À Descoberta
dos padrões da Natureza. Coordenação de Margarida Telo da Gama, Guilherme Valente,
Ed., Gradiva, 301-326, 2005.
Fersht, A. Structure and Mechanism in Protein Science: A Guide to Enzyme Catalysis
and Protein Folding. W. H. Freeman, New York, 1st. ed., 1999.
Fetrow, J. S. & Skolnick, J. Method for prediction of protein function from sequence
using the sequence-to-structure-to-function paradigm with application to
glutaredoxins/thioredoxins and T1 ribonucleases. J. Mol. Biol., 281(5):949-968, 1998.
Fioroni, M.; Burger, K.; Mark, A. E. & Roccatano, D. A New 2,2,2-trifluoroethanol model
for molecular dynamics simulations. J. Phys. Chem., 104:12347-12354, 2000.
Frauenfelder, H. & Wolynes, P. G. Biomolecules: Where the physics of simplicity and
complexity Meet. Physics Today 47:58-64, 1994.
Freddolino, P. L.; Liu, F.; Park, S.; Gruebele, M. & Schulten, K. Microsecond Explicit
Solvent Molecular Dynamics Simulations of Protein Folding. Biophys. J., 96(3):1590,
2009.
Geman, S. & Geman, D. Stochastic relaxation, gibbs distribution, and the bayesian
restoration of images. IEEE Transactions on Pattern Analysis and Machine Intelligence,
6:183-210, 1983.
Giangaspero, A.; Sandri, L & Tossi, A. Amphipathic α helical antimicrobial peptides: A
systematic study of the effects of structural and physical properties on biological
Activity. Eur. J. Biochem., 268:5589-5600, 2001.
Gibas, C. & Jambeck, P. Developing Bioinformatics Computer Skills. O'Reilly, ISBN:
1565926641, 2002.
Gruebele, M. The Fast Protein Folding Problem. Annu. Rev. Phys. Chem., 50:485-516,
1999.
Hamacher, K. & Wenzel, W. Scaling behaviour of stochastic minimization algorithms in
a perfect funnel landscape. Phys. Rev. E, 59:938-941, 1999.
Hansmann, U. H. E. & Okamoto, Y. Numerical comparisons of three recently proposed
algorithms in the protein folding problem. J. Comput. Chem., 18:920-933, 1997.
Referências Bibliográficas
130
Hansmann, U. H. E. Simulated annealing with tsallis weights - a numerical comparison.
Phys. A, 242:250, 1997.
Hansmann, U. H. E. & Okamoto, Y. Finite-size scaling of helix-coil transitions in poly-
alanine studied by multicanonical simulations. J. Chem. Phys., 110(2):1267-1276, 1999.
Hansmann, U. H. E. New algorithms and physics of proteins. Phys. A Statistical
Mechanics and its aplications, 321:152-163, 2003.
Hardin, C.; Pogorelov, T. V. & Luthey-Schulten, Z. Ab initio protein structure prediction.
Curr. Opin. Struct. Biol., 12(2):176-181, 2002.
Hess, B.; Bekker, H; Berendsen, H. J. C. & Fraaije, J. G. E. M. LINCS: A Linear Constraint
Solver for Molecular Simulations. J. Comp. Chem., 18:1463-1472, 1997.
Higashijima, T.; Wakamatsu, K.; Takemitsu, M.; Fujino, M.; Nakajima, T, Miyazawa, T.
Conformational change of mastoparan from wasp venom of binding with phospholipid
membrane. FEBS Lett., 152(2):227-230, 1983.
Hillisch, A.; Pineda, L. F. & Hilgenfeld, R. Utility of homology models in the drug
discovery process. Drug Discovery Today, 9:659-669, 2004.
Hirai, Y.; Kuwada, M.; Yasuhara, T.; Yoshida, H. & Nakajima, T. A new mast cell
degranulating peptide homologous to mastoparan in the venom of Japanese hornet
(Vespa xanthoptera). Chem. Pharm. Bull., 27:1945-1946, 1979.
Hong, D. P.; Hoshino, M.; Kuboi, R. & Goto, Y. Clustering of fluorine-substituted alcohols
as a factor responsible for their marked effects on proteins and peptides. J. Am. Chem.
Soc., 121(37):8427-8433, 1999.
Honig, B. Protein Folding: From the Levinthal Paradox to Structure Prediction. J. Mol.
Biol., 293(2):283-293, 1999.
Hummer, G.; García A. E. & Garde, S. Conformational diffusion and helix formation
kinetics. Phys. Rev. Lett., 85:2637-2640, 2000.
Huo, S. & Straub, J. E. Direct computation of long time processes in peptides and
proteins: reaction path study of the coil-to-helix transition in polyalanine. Proteins:
Struct. Funct. Genet., 36:249-261, 1999.
Ifrah, D.; Doisy, X.; Ryge, T. S. & Hansen, P. R. Structure-activity relationship study of
anoplin. J. Peptide Sci., 11:113-121, 2005.
Ireta, J.; Neugebauer, J.; Scheffler, M.; Rojo, A. & Galván, M. Structural transitions in the
polyalanine alpha-helix under uniaxial strain. J. American Chem. Soc., 127(49):17241-
17244, 2005.
Jayachandran, G.; Vishal, V. & Pande, V. S. Using massively parallel simulation and
markovian models to study protein folding: examining the dynamics of the villin
headpiece. J. Chem. Phys., 124(16):164902, 2006.
Jorgensen, W. L.; Chandrasekhar, J.; Madura, J. D.; Impey, R. W. & Klein, M. L.
Comparison of simple potential functions for simulating liquid water. J. Chem. Phys.,
79:926-935, 1983.
Referências Bibliográficas
131
Jorgensen, W. L.; Maxwell, D. S. & Tirado-Rives, J. Development and Testing of the OPLS
All-Atom Force Field on Conformational Energetics and Properties of Organic Liquids.
J. American Chem. Soc., 118:11225-11236, 1996.
Júnior, A. D.; Silva, R. S.; Mundim, K. C. & Dardenne, L. E. Performance and
parametrization of the algorithm simplified generalized simulated annealing. Genetics
and Molecular Biology, 27:616-622, 2004.
Juraszek, J. & Bolhuis, P. G. Sampling the multiple folding mechanisms of Trp-cage in
explicit solvent. Proc. Natl. Acad. Sci. U.S.A., 103(43):15859-15864, 2006.
Kabsch, W. & Sander, C. Dictionary of protein secondary structure: Pattern recognition
of hydrogen-bonded and geometrical features. Biopolymers, 22:2577-2637, 1983.
Kabsch, W. & Sander, C. How Good are Predictions of Protein Secondary Structure.
FEBS Letters, 155(2):179-182, 1983.
Karplus, M. & Petsko, G. A. Molecular Dynamics Simulations in Biology. Nature,
347:631-639, 1990.
Katsu, T.; Kuroko, M.; Morikawa, T.; Sanchika, K.; Fujita, Y; Yamamura, H. & Uda, M.
Mechanism of membrane damage induced by the amphipathic peptides gramicidin S
and melittin. Biochim. Biophys. Acta., 983:135-141, 1989.
Kawai, H.; Kikichi, T. & Okamoto, Y. A prediction of tertiary structures of peptide by the
monte carlo simulated annealing method. Protein Eng., 3:85-94, 1989.
Kemp, J. P. & Chen, Z. Y. Formation of helical states in wormlike polymer chains. Phys.
Rev. Lett., 81:3880-3883, 1998.
Kim, P. S. & Baldwin, R. L. Intermediates in the folding reactions of small proteins.
Annu. Rev. Biochem., 59:631-660, 1990.
Kirkpatrick, S.; Gellat, C. D. & Vecchi, M. P. Optimization by Simulated Annealing.
Science, 220(4598):671-680, 1983.
Klein, C. T.; Mayer, B.; Köhler, G. & Wolschann, P. Influence of solvation on helix
formation of poly-alanine studied by multiple annealing simulations. Journal of
Molecular Structure. Theochem., 370:3343, 1996.
Klinov, D. K. & Thirumalai, D. Criterion that Determines the Foldability of Proteins.
Phys. Rev. Lett., 26(21): 4070-4073, 1996.
Konno, K.; Hisada, M.; Naoki, H.; Itagaki, Y.; Kawai, N.; Miwa, A.; Yasuhara, T.; Morimoto,
T. & Nakata, Y. Structure and biological activities of Eumenine Mastoparan-AF (EMP-
AF), a new mast cell degranulating peptide in the venom of the solitary wasp
(Anterhynchium flavomarginatum micado). Toxicon, 38:1505-1515, 2000.
Kortemme, T.; Ramirez-Alvarado, M. & Serrano, L. Design of a 20 amino acid, three-
stranded beta-sheet protein. Science, 281:253256, 1998.
Kuntz, I. D.; Blaney, j. M.; Oatley, S. J.; Langridge, R. & Ferrin, T. E. A geometric approach
to macromolecule-ligand interactions. J. Mol. Biol., 161:269-288, 1982.
Referências Bibliográficas
132
Kusunoki,; H. Wakamatsu, K.; Sato, K.; Miyazawa, T. & Kohno, T. G protein-bond
conformation of mastoparan-X: heteronuclear multidimensional transferred nuclear
overhauser effect analysis of peptide uniformly enriched with C-13 and N-15. Biochem.,
37:4784-4790, 1998.
Lazaridis, T. & Karplus, M. Discrimination of the native from misfolded protein models
with an energy function including implicit solvation. J. Mol. Biol., 288(3):477-487, 1999.
Lazaridis, T. & Karplus, M. Effective energy functions for protein structure prediction.
Curr. Opin. Struct. Biol., 10(2):139-145, 2000.
Lee, B. & Richards, F. M. The interpretation of protein structures: estimation of static
accessibility. J. Mol. Biol., 55:379-400, 1971.
Lei, H.; Wu, C.; Liu, H. & Duan, Y. Folding free-energy landscape of villin headpiece
subdomain from molecular dynamics simulations. Proc. Natl. Acad. Sci. U.S.A.,
104(12):4925-4930, 2007.
Lesk, A. M. Introduction to protein architecture: the structural biology of proteins.
New York: Oxford University Press, p.304, 2001.
Levinthal, C. Are there pathways for protein folding. J. Chim. Phys., 65(1):4445, 1968.
Levy, Y.; Jortner, J. & Becker, O. M. Solvent effects on the energy landscapes and
folding kinetics of polyalanine. Proc. Natl. Acad. Sci. U.S.A., 98:2188, 2001.
Li, H.; Robertson, A.D. & Jensen, J.H. Very fast empirical prediction and rationalization
of protein pKa values. PROTEINS: Structure, Function and Bioinformatics, 61:704-721,
2005.
Lindahl, E.; Hess, B. & Van der Spoel, D. GROMACS 3.0: A package for Molecular
Simulation and Trajectory Analysis. Journal of Molecular Modelling, 7:306-317, 2001.
Linderstrøm-Lang, K. Proteins and Enzymes. Lane Memorial Lectures, Stanford University
Press, Stanford, Calif., p 54, 1952.
Linderstrom-Lang, K.U. & Shellman, J.A. Protein structure and enzyme activity. The
Enzymes. (P.D. Boyer, Ed.), 1(2):443-510, 1959.
Lucent, D.; Vishal, V. & Pande, V. S. Protein folding under confinement: A role for
solvent. Proc. Natl. Acad. Sci. U.S.A., 104(25):10430-10434, 2007.
Matsuzaki, K.; Yoneyama, S.; Murase, O. & Miyajima, K. Transbilayer transport of ions
and lipids coupled with mastoparan-X translocation. Biochem., 35:8450-8456, 1996.
McDowell, L.; Sanyal, G. B. & Prendergast, F. G. Probable role of amphiphilicity in the
binding of mastoparan to calmodulin. Biochem., 24:2979-2984, 1985.
McKnight, C. J.; Doering, D. S.; Matsudaira, P. T. & Kim, P. S. A thermostable 35-residue
subdomain within villin headpiece. J. Mol. Biol., 260:126-134, 1996.
McKnight, C. J.; Matsudaira, P. T. & Kim, P. S. NMR structure of the 35-residue villin
headpiece subdomain. Nat. Struct. Biol., 4:180-184, 1997.
Meirovitch, H. & Vásquez, M. Efficiency of simulated annealing and the Monte Carlo
minimization method for generating a set of low energy structures of peptides.
Journal of Molecular. Structure: Theochem., 398-999:517-522, 1997.
Referências Bibliográficas
133
Metropolis, N.; Rosenbluth, A. W.; Rosenbluth, M. N.; Teller, A. H. & Teller, E. Equation of
state calculations by fast computing machines. J. Chem. Phys., 21:1087, 1953.
Miyamoto, S. & Kollman. P. A. SETTLE: An Analytical Version of the SHAKE and
RATTLE Algorithms for Rigid Water Models. J. Comp. Chem., 13:952-962, 1992.
Monticelli, L.; Simões, C. Belvisi, L. & Colombo, G. Assessing the influence of
electrostatic schemes on molecular dynamics simulations of secondary structure
forming peptides. J. Phys.: Condens. Matter, 18:S329-S345, 2006.
Moret, M. A. Modelagem molecular clássica usando o método estocástico: simulação
por termalização GSA. Dissertação de mestrado, UFBA, Salvador, 1996.
Moret, M. A. Estudo Conformacional de Proteínas usando Métodos Estocásticos
Generalizados. Tese de doutorado UFRJ/IBCCF, 2000.
Moret, M. A.; Bisch, P. M. & Vieira, F. M. C. Algorithm for multipla minima search. Phys.
Rev. E, 57:R2535-R2538, 1998.
Moret, M. A.; Bisch, P. M.; Mundim, K. C. & Pascutti, P. G. A new stochastic strategy to
analyze helix folding. Biophys. J., 82(3):1123-1132, 2002.
Moret, M. A.; Bisch, P. M.; Nogueira-jr, E. & Pascutti, P. G. (2005), Stochastic strategy to
analyze protein folding. Phys. A Statistical and Theoretical Physics, 353:353-364, 2005.
Moret, M. A.; Pascutti, P. G.; Bisch, P. M. & Mundim, K. C. Stochastic molecular
optimization using generalized simulated annealing. Electronic Letters, 19:647-657,
1998.
Moret, M. A.; Pascutti, P. G.; Bisch, P. M.; Mundim, M. S. P. & Mundim, K. C. Classical and
quantum conformational analysis using Generalized Genetic Algorithm. Phys. A
Statistical and Theoretical Physics, 363:260-268, 2006.
Moret, M. A.; Pascutti, P. G.; Mundim, K. C.; Bisch, P. M.; Nogueira-jr, E. Multifractality,
Levinthal paradox, and energy hypersurface. Phys. Review E, 63:20901-20904, 2001.
Moult, J., A decade of CASP: progress, bottlenecks and prognosis in protein structure
prediction. Current Opinion in Structural Biology, 15:285-289, 2005.
Mundim, K. C. & Tsallis, C. Geometry optimization and conformational analysis
through generalized simulated annealing. Int. J. Quant. Chem., 58(4):373-381, 1996.
Mundim, K. C., Modelagem Molecular Aplicada a lidos e Biomoléculas. IV Escola de
Inverno do CBPF, 2002.
Muñoz, V. & Eaton, W. A. A simple model for calculating the kinetics of protein folding
from three-dimensional structures. Proc. Natl. Acad. Sci. U.S.A., 96:11311-11316, 1999.
Nakajima, T.; Uzu, S.; Wakamatsu, K.; Saito, K.; Miyazawa, T.; Yasuhara, T.; Tsukamoto, Y.
& Fujino, M. Amphiphilic peptides in wasp venom. Biopolymers, 25:S115-S121, 1986.
Nayeem, A.; Sitkoff, D. & Junior, S. K. A comparative study of available software for high
accuracy homology modeling: from sequence alignments to structural models. Protein
Science, 15:808-824, 2006.
Neidigh, J. W.; Fesinmeyer, R. M. & Andersen, N. H. Designing a 20-residue protein. Nat.
Struct. Biol., 9:425-430, 2002.
Referências Bibliográficas
134
Neidigh, J. W.; Fesinmeyer, R. M.; Prickett, K. S. & Andersen, N. H. Exendin-4 and
glucagon-like-peptide-1: NMR structural comparisons in the solution and micelle-
associated states. Biochemistry, 40:13188-13200, 2001.
Nelson, D. L. & Cox. M. M., Lehninger's Principles of biochemistry. 4ed., draft, 2004.
Nölting B. Protein Folding Kinetics: Biophysical Methods. Springer Verlag, 1st Edition.
Nozaki, Y. & Tanford, C. Solubility of Amino Acids and Related Compounds in Aqueous
Solutions. J. Bio. Chem., 238(12):4074, 1963.
O’Neil, K. & DeGrado, W. A thermodynamic scale for the helixforming tendencies of the
commonly occurring amino acids. Science, 250:646-651, 1990.
Okamoto, Y. & Hansmann, U. H. E. Thermodynamics of helix-coil transitions studied by
multicanonical algorithms. J. Phys. Chem., 99:11276-11287, 1995.
Onuchic, J. N. Contacting the protein folding funnel with NMR. Proc. Natl. Acad. Sci.
U.S.A., 94:7129-7131, 1997.
Onuchic, J. N.; Nymeyer, H.; Garcia, A. E.; Chahine, J. & Socci, N. D. The energy
landscape theory of protein folding: Insights into folding mechanisms and scenarios.
Advances in Protein Chemistry, 53:87-152, 2000.
Osguthorpe, D. J. Ab initio protein folding. Curr. Opin. Struct. Biol., 10(2):146-152, 2000.
Osterberg, F.; Morris, G. M.; Sanner, M.F.; Olson, A. J. & Goodsell, D. S. Automated
docking to multiple target structure: Incorporation of protein mobility and structural
water heterogeneity in Autodock. Proteins: Structure, Function, and Genetics, 46:34-40,
2002.
Ottesen, J. J. & Imperiali, B. Design of a discretely folded miniprotein motif with
predominantly beta-structure. Nat. Struct. Biol., 8:535- 539, 2001.
Pande, V.; Grosberg, A.; Tanaka, T. & Rokhsar, D. Pathways for protein folding: is a new
view needed? Curr. Opin. Struct. Biol., 8:68-79, 1998.
Pascutti, P. G. Introdução à modelagem e Simulação por Dinâmica Molecular. Apostila
do material didático da disciplina, 2002.
Pascutti, P. G. Modelagem e Diâmica Molecular em Sistemas Biológicos. 2002.
Pascutti, P. G.; Agostini, F. P.; Osthoff, C.; Mundim, K. C.; Moret, M. A. Peptide
Conformational search using Generalized Simulated Annealing method. European
Biophys. J., 34(6):793, 2005.
Pauling, L.; Corey, R. B. & Branson, H. R. The Structure of Proteins: Two Hydrogen-
bonded Helical Configurations of the Polypeptide Chain. Proc. Natl. Acad. Sci. U.S.A.,
37:205-211, 1951.
Peng, Y. & Hansmann, U. H. E. Solvation model dependency of helix-coil transition in
polyalanine. Biophys. J., 82(6):3269-3276, 2002.
Penna, T. J. P. Traveling salesman problem and Tsallis Statistics. Phys. Rev. E, 51(1):R1-
R3, 1995.
Petsko, G. A. & Ringe D. Protein Structure and Function, Blackwell, Singapore, 2004
Referências Bibliográficas
135
Pita, S. S. R.; Fernandes, T. V. A.; Caffarena, E. R.; Pascutti, P. G. Studies of Molecular
Docking Between Fibroblast Growth Factor and Heparin using Generalized Simulated
Annealing. International Journal of Quantum Chemistry, 108:2608-2614, 2008.
Pitera, J. W. & Swope, W. Understanding folding and design: replica-exchange
simulations of „„Trp-cage‟‟ fly miniproteins. Proc. Natl. Acad. Sci. U.S.A., 100:7587-7592,
2003.
Poland, D. & Scheraga, H. A. Theory of Helix-Coil Transitions in Biopolymers. Academic
Press, New York, 1970.
Qiu, L. L.; Pabit, S. A.; Roitberg, A. E. & Hagen, S. J. Smaller and faster: the 20-residue
Trp-cage protein folds in 4 micros. J. Am. Chem. Soc., 124:12952-12953, 2002.
Ramachandran, G. N.; Ramakrishnan, C. & Sasisekharan, V. Stereochemistry of
polypeptide chain configurations. J. Mol. Biol., 7:95-99, 1963.
Ramachandran, G. N.; Venkatachalam, C. M. & Krimm, S. Stereochemical Criteria for
Polypeptide and Protein Chain Conformations. Biophys. J., 6(6): 849-872, 1966.
Reiersen, H. & Rees, A. R. Trifluorethanol may form a solvent matrix for assisted
hydrophobic interactions between peptide side chains. Protein Eng., 13(11):739-743,
2000.
Roccatano, D.; Colombo, G.; Fioroni, M. & Mark, A. E. Mechnism by which 2,2,2-
trifluoroethanol/water mixtures stabilize secondary-structure formation in peptides: A
molecular dynamics study. Proc. Natl. Acad. Sci. U.S.A., 99(19):12179-12184, 2002.
Rost, B. & Sander, C. Bridging the protein sequence-structure gap by structure
predictions. Annu. Rev. Biophys. Biomol. Struct., 25:113-136, 1996.
Rumbley, J.; Hoang, L.; Mayne, L. & Englander, S. W. An amino acid code for protein
folding. Proc. Natl. Acad. Sci. U.S.A., 98(1):105-112, 2001.
Schonbrun, J.; Wedemeyer, W. J. & Baker, D. Protein structure prediction in 2002. Curr.
Opin. Struct. Biol., 12:348-354, 2002.
Serra, P.; Stanton, A. F. & Kais, S. Pivot Method for Global Optimization. Phys. Rev. E,
55(1):1162-1165, 1997.
Shi, Z.; Olson, C. A.; Rose, G. D.; Baldwin, R. L. & Kallenbach, N. R. Polyproline ii
structure in a sequence of seven alanine residues. Proc. Natl. Acad. Sci. U.S.A., 99:9190-
9195, 2002.
Shmygelska, A. & Hoos, H. H. An Improved Ant Colony Optimisation Algorithm for the
2D HP Protein Folding Problem. Department of Computer Science, University of British
Columbia, Vancouver, Canada: BMC Bioinformatics, 2005.
Simmerling, C.; Strockbine, B. & Roitberg, A. E. All-atom structure prediction and folding
simulations of a stable protein. J. Am. Chem. Soc., 124:11258-11259, 2002.
Skourtis, S. S. & Onuchic, J. N. Effective 2-State Systems For Bridge-Mediated
Electron-Transfer - A Green-Function Analysis. Biophys. J., 64(2):A106-A106, 1993.
Snow, C. D.; Sorin, E. J.; Rhee, Y. M. & Pande, V. S. How Well Can Simulation Predict
Protein Folding Kinetics and Thermodynamics? Annu. Rev. Biophys. Biomol. Struct.,
34:43-69, 2005.
Referências Bibliográficas
136
Snow, C. D.; Zagrovic, B. & Pande, V. S. The Trp cage: folding kinetics and unfolded
state topology via molecular dynamics simulations. J. Am. Chem. Soc., 124:14548-
14549, 2002.
Soares, J. L. Fundamentos de Biologia. 1°ed. São Paulo: Editora Scipone, 1999.
Socci, N. D. & Onuchic, J. N. Folding Kinetics of Proteinlike Heteropolymers. J. Chem.
Phys., 101(2):1519-1528, 1994.
Socci, N. D.; Onuchic, J. N. & Wolynes P. G. Diffusive dynamics of the reaction
coordinate for protein folding funnels. J. Chem. Phys., 104(15):5860-5868, 1996.
Spiegel, M. R. Estatística. 3a ed. São Paulo: Makron Books do Brasil Editora Ltda & Editora
McGraw-Hill Ltda., 74-75/106-110, 1994.
Stariolo, D. A. & Tsallis, C. Annual Reviews of Computational Physics II, edited by D. Stanffer
(World Scientific, Singapore) p. 343, 1995.
Stewart, D. E.; Sarkar, A. & Wampler, J. E. Occurrence and role of cis peptide bonds in
protein structures. J. Mol. Biol., 214(1):253260, 1990.
Szu, H. & Hartley, R. Fast simulated annealing. Fhys. Lett. A, 122:157-162, 1987.
Tanford, C. Contribution of Hydrophobic Interactions to Stability of Globular
Conformation of Proteins. J. Am. Chem. Soc., 84:4240, 1962.
Teague, S. J. Implications of protein flexibility for drug discovery. Nature Reviews - Drug
Discovery, 2:527-541, 2003.
Tironi, I. G.; Sperb, R.; Smith, P. E. & van Gunsteren, W. F. A generalized reaction field
method for molecular dynamics simulations. Chem. Phys., 102:5451-5459, 1995.
Tossi, A.; Sandri, L.; Giangaspero, A. Amphipathic, α-helical antimicrobial peptides.
Biopolym., 55:4-30, 2000.
Torvalds, L. B. & Diamond, D. por Prazer: LINUX, Os Bastidores da sua Criação.
Tradução: Rössler, F. B. Rio de Janeiro: Editora Campus Ltda. 2001.
Tramontano, A. & Lesk, A. M. Protein structure prediction. John Wiley and Sons, Inc.,
Weinheim, Germany, edição, 2006.
Tsallis, C. & Brigatti, E. Nonextensive statistical mechanics: A brief introduction. Cont.
Mech. and Thermodyn., 16:223-235, 2004.
Tsallis, C. & Stariolo, D. A. Generalized simulated annealing. Physic. A, 233:395-406,
1996.
Tsallis, C. Possible Generalization of Boltzmann-Gibbs Statistics. Journal of Statistical
Physics, 52:479-487, 1988.
Tsallis, C. Some comments on boltzmann-gibbs statistical mechanics. Chaos, Solitions
and Fractals, 6:539-559, 1995.
Tunnicliffe, R. B.; Waby, J. L.; Williams, R. J. & Williamson, M. P. An Experimental
Investigation of Conformational Fluctuations in Proteins G and L. Structure,
13(11):1677-1684, 2005.
Referências Bibliográficas
137
van der Spoel, D.; van Buuren, A. R.; Apol, E.; Meulenhoff, P. J.; Tieleman, D. P.; Sijbers, A.
L. T. M.; Hess, B., Feentra, K. A., Lindahl, E., van Drunen, R. & Berendsen, H. J. C.
Gromacs User Manual. Groningen: www.gromacs.org. 2001.
van Giessen, A. E. & Straub, J. E. Monte Carlo simulations of polyalanine using a
reduced model and statistics-based interaction potentials. J. Chem. Phys.,
122(2):024904, 2005.
van Gunsteren, W. F. & Berendsen, H. J. C. Computer simulation of molecular
dynamics: metodology, applications and pespectives in chemistry. Angew. Chem. Int.
Ed. Engl., 29:992-1023, 1990.
van Gunsteren, W. F. & Berendsen, H. J. C. Groningen Molecular Simulation (GROMOS)
Library Manual. Biomos, Groningen, 1987.
van Gunsteren, W. F.; Luque, F. J.; Timms, D. & Torda, A. E. Molecular mechanics in
biology: from structure to function, taking account of salvation. Annu. Rev. Biophys.
Biomol. Struc., 23:847-863, 1994.
van Gunsteren, W. F.; Billeter, S. R.; Eising, A. A.; Hünenberger, P. H.; Krüger, P.; Mark, A.
E.; Scott, W. R. P. & Tironi, I. G. Biomolecular Simulation: The GROMOS96 Manual and
User Guide. Zürich, Groningen, 1996.
Verdonk, M. L.; Cole, J. C.; Harshorn, M. J.; Murray, C. W. & Taylor, R. D. Improved
protein-ligand docking using GOLD. Proteins, 52:609-623, 2003.
Verli, H. & Barreiro, E. J. Um paradigma da química medicinal: A flexibilidade dos
ligantes e receptores. Química Nova, 28(1):95-102, 2005.
Verma, A.; Schua, A.; Lee, K. H. & Wenzel, W. Basin hopping simulations for all-atom
protein folding. J. Chem. Phys., 124(4): 044515, 2006.
Wakamatsu, K.; Higashijima, T.; Fujino, T.; Fujino, M.; Nakajima, T. & Miyazawa, T.
Transferred NOE analyses of conformations of peptides as bound to membrane bilayer
of phospholipid; mastoparan-X. FEBS Lett., 162:123-126, 1983.
Wakamatsu, K.; Okada, A.; Miyazawa, T.; Ohya, M. & Higashijima, T. Membrane-bound
conformation of mastoparan-X, a G-protein-activating peptide. Biochem., 31:5654-
5660, 1992.
Wang, L.; O’Connell, T.; Tropsha, A. & Hermans, J. Thermodynamic parameters for the
helix-coil transition of oligopeptides: Molecular dynamics simulation with the peptide
growth method. Proc. Natl. Acad. Sci. U.S.A., 92:10924-10928, 1995.
Weiner, S. J.; Kollman, P. A.; Nguyen, D. T. & Case, D. A. An All Atom Force Field for
Simulations of Proteins and Nucleic Acids. J. Comp. Chem., 7:230-252, 1986.
Westhead, D. R.; Clark, D. E. & Murray, C. W. A comparison of heuristic search
algorithms for molecular docking. J. Comput. Aided Mol. Des., 11:209-228, 1997.
Whiles, J. A.; Brasseur, R.; Glover, K. J.; Melacini, G.; Komives, E. A. & Vold, R. R.
Orientation and effects of mastoparan X on phospholipid bicelles. Biophys. J., 80:280-
293, 2001.
Referências Bibliográficas
138
Wickstrom L.; Bi, Y.; Hornak, V.; Raleigh, D. P. & Simmerling, C. Reconciling the Solution
and X-ray Structures of the Villin Headpiece Helical Subdomain: Molecular Dynamics
Simulations and Double Mutant Cycles Reveal a Stabilizing Cation-π Interaction.
Biochemistry, 46:3624-3634, 2007.
Wilson, S. R.; Cui, W.; Moskowitz, W. J. & Schmidt, K. E. Conformational analysis of
flexible molecules: location of the global minimum energy conformation by the
simulated annealing method. Tetrahedron Lett., 29:4373-4376, 1988.
Wolynes, P. G.; Onuchic, J. N. & Thirumalai, D. Navigating the folding routes. Science,
267:1619-1620, 1995.
Xiang, Y. & Gong, X. G. Efficiency of Generalized Simulated Annealing. Phys. Rev. E,
62(3):4473-4476, 2000.
Xiang, Y.; Sun, D. Y.; Fan, W. & Gong, X. G. Generalized Simulated Annealing algorithm
and its application to the Thomson model. Phys. Lett. A, 233(3):216-220, 1997.
Zagrovic, B. & Pande, V. Solvent viscosity dependence of the folding rate of a small
protein: distributed computing study. J. Comput. Chem., 24:14321436, 2003.
Zhang, Y.; Kolinski, A. & Skolnick, J. A new approach to ab initioprotein structure
prediction. Biophys J., 85(2):1145-1164, 2003.
Zhou, R. H. Trp-cage: folding free energy landscape in explicit water. Proc. Natl. Acad.
Sci. U.S.A., 100:13280-13285, 2003.
Apêndice
139
7 Apêndice
Nesta seção apresentaremos os arquivos de entrada na simulação do GSA e
da Dinâmica Molecular comentados. Além disto, apresentaremos um manual
prático do programa THOR/GSA.
7.1 Apênice A - Arquivos de entrada para
simulação do GSA
O pacote computacional do programa THOR teve sua origem no CBPF
(Centro Brasileiro de Pesquisas Físicas) com os pesquisadores Paulo Mascarello
Bisch e Kleber Mundim, com a implementação dos parâmetros de campo de forças
molecular do programa GROMOS [VAN GUNSTEREN, W. F. & BERENDSEN, H. J. C.
(1987)] e continuidade no Laboratório de Física Biológica do IBCCF/UFRJ, no qual
foi proposto o acoplamento entre o código computacional clássico THOR e o
algoritmo Generalized Simulated Annealing (GSA) [MORET, M. A. et al. (1998)],
surgindo, neste momento, o THOR/GSA. Atualmente, o seu aprimoramento centra-
se no Laboratório de Modelagem e Dinâmica Molecular do IBCCF/UFRJ.
O programa THOR/GSA é um poderoso programa de predição estrutural,
tanto de macromoléculas quanto de complexos enzima-farmacos, por exemplo. No
seu desenvolvimento quatro aspectos foram priorizados para que sua arquitetura
fosse a mais eficiente possível:
Rapidez e robustez nas soluções do problema;
Dados de entrada/saída simplificados. No qual, basicamente, é
necessário apenas o conjunto das coordenadas de cada átomo;
Um programa de fácil compreensão (escrito em linguagem
FORTRAN77), portanto qualquer usuário pode modificá-lo, quando
necessário/desejado;
Executável em qualquer plataforma (x86, x86_64, PowerPC, sparc,
entre outras), podendo trabalhar em qualquer sistema operacional
(LINUX, MS WINDOWS, Solaris, MAC-OS.
Apêndice
140
O programa possui três subdiretórios principais: data, data-in e data-out
Subdiretório data
No subdiretório estão todos os bancos de dados do programa. As
informações sobre as constantes utilizadas para o calculo dos
potenciais estão neste subdiretorio.
Subdiretório data-in
Neste subdiretório encontram-se os arquivos de entrada necessários
para a execução do programa (*.IN; *.TOP; *.MD)
O arquivo *.IN deve conter as coordenadas iniciais de todos os átomos
Exemplo de um Arquivo *.IN
MECANICA MOLECULAR
INTERNAL GSA HOOK FTHET FDHP FDHI GROMOS1 NBCVW FUNCDIE2
0.1000000000 Valor inicial do passo DELTA-X usado na minimizacao.
0.0100000000 Valor da precisao no calculo do potencial.
0.0000000000 Posicao da interface no eixo X.
2.0000000000 Valor de EPSLON1, correspondente ao meio aquoso.
0.0000000000 Valor de EPSLON2, correspondente ao meio apolar.
0.0000000000 Valor de XBOX, lado X da caixa para condicoes periodicas.
0.0000000000 Valor de YBOX, lado Y da caixa para condicoes periodicas.
0.0000000000 Valor de ZBOX, lado Z da caixa para condicoes periodicas.
0.0000000000 Valor de RCUT, raio de corte.
0.0000000000 Valor de RLIST, para lista de vizinhos.
NT 0.000 0 0.00 0 0.00 0 0 0 0 0 -0.280 2 6 7 0 0 0 N ALA 1 1
CH1 1.474 0 0.00 0 0.00 0 1 0 0 0 0.000 1 3 4 0 0 0 CA ALA 1 1
CH3 1.528 0 108.57 0 0.00 0 2 1 0 0 0.000 2 0 0 0 0 0 CB ALA 1 1
C 1.544 0 113.39 0 123.59 0 2 1 3 0 0.380 2 5 8 0 0 0 C ALA 1 1
O 1.230 0 122.81 0 344.25 1 4 2 1 0 -0.380 4 0 0 0 0 0 O ALA 1 1
H 1.004 0 119.57 0 31.33 0 1 2 3 0 0.280 1 0 0 0 0 0 1HI ALA 1 1
H 0.996 0 119.95 0 189.25 0 1 2 6 0 0.000 1 0 0 0 0 0 2HI ALA 1 1
N 1.340 0 113.18 0 178.58 0 4 2 5 0 -0.280 4 9 10 0 0 0 N ALA 2 1
H 0.997 0 121.22 0 8.09 0 8 4 2 0 0.280 8 0 0 0 0 0 H ALA 2 1
CH1 1.479 0 125.06 0 176.49 0 8 4 9 0 0.000 8 11 12 0 0 0 CA ALA 2 1
CH3 1.532 0 110.09 0 73.85 1 10 8 4 0 0.000 10 0 0 0 0 0 CB ALA 2 1
C 1.545 0 112.08 0 121.90 0 10 8 11 0 0.380 10 13 14 0 0 0 C ALA 2 1
O 1.231 0 122.27 0 343.30 1 12 10 8 0 -0.380 12 0 0 0 0 0 O ALA 2 1
...
N 1.339 0 113.97 0 177.76 0 126 124 127 0 -0.280 126 129 130 0 0 0 N ALA 22 1
H 0.995 0 121.63 0 359.44 0 128 126 124 0 0.280 128 0 0 0 0 0 H ALA 22 1
CH1 1.483 0 124.58 0 177.95 0 128 126 129 0 0.000 128 131 132 0 0 0 CA ALA 22 1
CH3 1.529 0 111.16 0 75.98 1 130 128 126 0 0.000 130 0 0 0 0 0 CB ALA 22 1
C 1.539 0 113.31 0 122.29 0 130 128 131 0 0.380 130 133 134 0 0 0 C ALA 22 1
O 1.249 0 119.98 0 349.24 1 132 130 128 0 -0.380 132 0 0 0 0 0 O ALA 22 1
H 1.004 0 115.46 0 179.50 0 132 130 133 0 0.000 132 0 0 0 0 0 HT TER 22 1
#### 0.000 0 0.00 0 0.00 0 0 0 0 0 0.000 0 0 0 0 0 0
O termo INTERNAL no cabeçalho do arquivo garante para o programa que as
coordenadas existente estão de acordo com o sistema de coordenada interna.
O termo GSA é usado quando se deseja realizar apenas uma única
simulação. Para o mapeamento dos parâmetros emprega-se o termo MAPSA no
lugar do GSA. Pode-se empregar também o termo OTMZ para a otimização
utilizando o método Steepest Descent e OPT3 para a otimização através do
Apêndice
141
Gradiente Conjugado. Além disso, os ângulos diedrais a serem otimizados devem
ser marcados como valor 1 na coluna de coordenadas 7.
O termo HOOK representa a força de ligação entre pares de átomos.
FTHET representa a força que atua entre três átomos conduzindo a variação
do ângulo teta.
FDHP representa a força do diedral próprio.
FDHI representa a força do diedral impróprio.
NBCVW representa as interações entre os átomos não-ligados de Coulomb e
van der Waals.
GROMOS1 representa o campo de forças utilizado, que neste caso é o
GROMOS96
Duas funções dielétricas sigmoidais dependente da distância estão
implementadas no programa THOR: FUNCDIE1 e FUNCDIE2, que diferem em seus
valores à medida que a distância tende a zero.
Os arquivos *.TOP contém a topologia da macromolécula a ser simulada, ou
seja, a descrição de todos os átomos da macromolécula. Nele estão especificados,
por exemplo, a tabela de ligação I-J-K; a tabela dos átomos que compõe o torsional
impróprio (I-X-Y-L), o torsional próprio (X-I-J-Y); os vizinhos excluídos; os terceiros
vizinhos; as massas e as cargas.
Os arquivos *.MD contem as siglas de comando que permitem o usuário
escolher parâmetros a serem utilizado pelo programa.
Os arquivos de entrada *.IN e *.TOP podem ser obtidos através de um
programa denominado PDBTHORBOX (também desenvolvido no IBCCF/UFRJ
[DARDENNE, L. E. et al. (1999)]) a partir de um arquivo de coordenadas do tipo x, y,
z do tipo PDB (Protein Data Bank).
Subdiretório data-out
Neste subdiretório serão alocados os arquivos de saída das otimizações
realizadas pelo programa. Um dos arquivos de saída (.PDB) contém as
coordenadas X, Y e Z dos átomos no formato PDB. Outro arquivo de
saída (.OUT) contém as coordenadas internas no formato de matriz-Z
do MOPAC. Além disso, existe um terceiro arquivo (.GSA), que contém
as energias finais da estrutura.
Apêndice
142
Os parâmetros do GSA são especificados em um arquivo separado,
denominado gsa.par. Este arquivo contem os valores para cada parâmetro do GSA
(q
A
, q
T
e q
V
); a semente para a geração do número aleatório, o número de passos a
temperatura inicial e a Dimensão do problema. Segue o exemplo de um arquivo do
gsa.par
2.10 qa = Acceptance index
1.70 qT = Temperature index
1.90 qv = Visiting index
33 NRAN = Seed used in RAN3 routine
5000000 NStopMax = Max number of GSA-loops
100.1 To = Initial Temperature
1.0 D = Dimension
Arquivo de entrada (*.IN) para otimização por GSA da
22-alaninas
MECANICA MOLECULAR
INTERNAL GSA HOOK FTHET FDHP FDHI GROMOS2 NBCVW
0.1000000000 Valor inicial do passo DELTA-X usado na minimizacao.
0.0100000000 Valor da precisao no calculo do potencial.
0.0000000000 Posicao da interface no eixo X.
2.0000000000 Valor de EPSLON1, correspondente ao meio aquoso.
0.0000000000 Valor de EPSLON2, correspondente ao meio apolar.
0.0000000000 Valor de XBOX, lado X da caixa para condicoes periodicas.
0.0000000000 Valor de YBOX, lado Y da caixa para condicoes periodicas.
0.0000000000 Valor de ZBOX, lado Z da caixa para condicoes periodicas.
0.0000000000 Valor de RCUT, raio de corte.
0.0000000000 Valor de RLIST, para lista de vizinhos.
NT 0.000 0 0.00 0 0.00 0 0 0 0 0 -0.280 2 6 7 0 0 0 N ALA 1 1
CH1 1.474 0 0.00 0 0.00 0 1 0 0 0 0.000 1 3 4 0 0 0 CA ALA 1 1
CH3 1.528 0 108.57 0 0.00 0 2 1 0 0 0.000 2 0 0 0 0 0 CB ALA 1 1
C 1.544 0 113.39 0 123.59 0 2 1 3 0 0.380 2 5 8 0 0 0 C ALA 1 1
O 1.230 0 122.81 0 344.25 1 4 2 1 0 -0.380 4 0 0 0 0 0 O ALA 1 1
H 1.004 0 119.57 0 31.33 0 1 2 3 0 0.280 1 0 0 0 0 0 1HI ALA 1 1
H 0.996 0 119.95 0 189.25 0 1 2 6 0 0.000 1 0 0 0 0 0 2HI ALA 1 1
N 1.340 0 113.18 0 178.58 0 4 2 5 0 -0.280 4 9 10 0 0 0 N ALA 2 1
H 0.997 0 121.22 0 8.09 0 8 4 2 0 0.280 8 0 0 0 0 0 H ALA 2 1
CH1 1.479 0 125.06 0 176.49 0 8 4 9 0 0.000 8 11 12 0 0 0 CA ALA 2 1
CH3 1.532 0 110.09 0 73.85 1 10 8 4 0 0.000 10 0 0 0 0 0 CB ALA 2 1
C 1.545 0 112.08 0 121.90 0 10 8 11 0 0.380 10 13 14 0 0 0 C ALA 2 1
O 1.231 0 122.27 0 343.30 1 12 10 8 0 -0.380 12 0 0 0 0 0 O ALA 2 1
N 1.334 0 113.75 0 179.72 0 12 10 13 0 -0.280 12 15 16 0 0 0 N ALA 3 1
H 1.002 0 121.39 0 3.09 0 14 12 10 0 0.280 14 0 0 0 0 0 H ALA 3 1
CH1 1.481 0 125.24 0 177.44 0 14 12 15 0 0.000 14 17 18 0 0 0 CA ALA 3 1
CH3 1.532 0 110.34 0 73.73 1 16 14 12 0 0.000 16 0 0 0 0 0 CB ALA 3 1
C 1.541 0 111.81 0 122.17 0 16 14 17 0 0.380 16 19 20 0 0 0 C ALA 3 1
O 1.230 0 122.51 0 341.49 1 18 16 14 0 -0.380 18 0 0 0 0 0 O ALA 3 1
N 1.340 0 113.59 0 179.48 0 18 16 19 0 -0.280 18 21 22 0 0 0 N ALA 4 1
H 0.995 0 121.36 0 1.85 0 20 18 16 0 0.280 20 0 0 0 0 0 H ALA 4 1
CH1 1.479 0 125.01 0 177.87 0 20 18 21 0 0.000 20 23 24 0 0 0 CA ALA 4 1
CH3 1.538 0 110.40 0 74.20 1 22 20 18 0 0.000 22 0 0 0 0 0 CB ALA 4 1
C 1.536 0 111.94 0 122.40 0 22 20 23 0 0.380 22 25 26 0 0 0 C ALA 4 1
O 1.235 0 122.60 0 342.30 1 24 22 20 0 -0.380 24 0 0 0 0 0 O ALA 4 1
N 1.339 0 113.61 0 178.95 0 24 22 25 0 -0.280 24 27 28 0 0 0 N ALA 5 1
H 0.996 0 121.14 0 2.39 0 26 24 22 0 0.280 26 0 0 0 0 0 H ALA 5 1
CH1 1.477 0 125.14 0 177.61 0 26 24 27 0 0.000 26 29 30 0 0 0 CA ALA 5 1
CH3 1.532 0 110.58 0 74.34 1 28 26 24 0 0.000 28 0 0 0 0 0 CB ALA 5 1
C 1.543 0 111.41 0 122.06 0 28 26 29 0 0.380 28 31 32 0 0 0 C ALA 5 1
O 1.230 0 122.55 0 341.93 1 30 28 26 0 -0.380 30 0 0 0 0 0 O ALA 5 1
N 1.339 0 113.43 0 179.00 0 30 28 31 0 -0.280 30 33 34 0 0 0 N ALA 6 1
H 0.996 0 121.25 0 1.96 0 32 30 28 0 0.280 32 0 0 0 0 0 H ALA 6 1
CH1 1.475 0 124.94 0 177.91 0 32 30 33 0 0.000 32 35 36 0 0 0 CA ALA 6 1
CH3 1.535 0 110.55 0 74.67 1 34 32 30 0 0.000 34 0 0 0 0 0 CB ALA 6 1
C 1.542 0 111.53 0 121.97 0 34 32 35 0 0.380 34 37 38 0 0 0 C ALA 6 1
O 1.237 0 122.33 0 342.16 1 36 34 32 0 -0.380 36 0 0 0 0 0 O ALA 6 1
N 1.330 0 113.69 0 178.75 0 36 34 37 0 -0.280 36 39 40 0 0 0 N ALA 7 1
H 1.003 0 121.37 0 2.42 0 38 36 34 0 0.280 38 0 0 0 0 0 H ALA 7 1
CH1 1.480 0 125.23 0 177.75 0 38 36 39 0 0.000 38 41 42 0 0 0 CA ALA 7 1
CH3 1.533 0 110.31 0 74.79 1 40 38 36 0 0.000 40 0 0 0 0 0 CB ALA 7 1
C 1.539 0 111.54 0 122.08 0 40 38 41 0 0.380 40 43 44 0 0 0 C ALA 7 1
O 1.230 0 122.71 0 341.47 1 42 40 38 0 -0.380 42 0 0 0 0 0 O ALA 7 1
N 1.339 0 113.35 0 179.15 0 42 40 43 0 -0.280 42 45 46 0 0 0 N ALA 8 1
H 0.996 0 121.27 0 1.95 0 44 42 40 0 0.280 44 0 0 0 0 0 H ALA 8 1
CH1 1.476 0 124.91 0 178.13 0 44 42 45 0 0.000 44 47 48 0 0 0 CA ALA 8 1
Apêndice
143
CH3 1.533 0 110.43 0 75.18 1 46 44 42 0 0.000 46 0 0 0 0 0 CB ALA 8 1
C 1.543 0 111.38 0 121.81 0 46 44 47 0 0.380 46 49 50 0 0 0 C ALA 8 1
O 1.230 0 122.49 0 341.61 1 48 46 44 0 -0.380 48 0 0 0 0 0 O ALA 8 1
N 1.337 0 113.49 0 179.32 0 48 46 49 0 -0.280 48 51 52 0 0 0 N ALA 9 1
H 0.996 0 121.38 0 2.29 0 50 48 46 0 0.280 50 0 0 0 0 0 H ALA 9 1
CH1 1.478 0 124.88 0 177.71 0 50 48 51 0 0.000 50 53 54 0 0 0 CA ALA 9 1
CH3 1.532 0 110.48 0 74.72 1 52 50 48 0 0.000 52 0 0 0 0 0 CB ALA 9 1
C 1.544 0 111.50 0 122.07 0 52 50 53 0 0.380 52 55 56 0 0 0 C ALA 9 1
O 1.231 0 122.40 0 342.33 1 54 52 50 0 -0.380 54 0 0 0 0 0 O ALA 9 1
N 1.332 0 113.48 0 179.07 0 54 52 55 0 -0.280 54 57 58 0 0 0 N ALA 10 1
H 1.002 0 121.51 0 2.79 0 56 54 52 0 0.280 56 0 0 0 0 0 H ALA 10 1
CH1 1.481 0 125.06 0 177.25 0 56 54 57 0 0.000 56 59 60 0 0 0 CA ALA 10 1
CH3 1.532 0 110.52 0 74.00 1 58 56 54 0 0.000 58 0 0 0 0 0 CB ALA 10 1
C 1.540 0 111.56 0 122.23 0 58 56 59 0 0.380 58 61 62 0 0 0 C ALA 10 1
O 1.230 0 122.64 0 341.26 1 60 58 56 0 -0.380 60 0 0 0 0 0 O ALA 10 1
N 1.339 0 113.40 0 179.23 0 60 58 61 0 -0.280 60 63 64 0 0 0 N ALA 11 1
H 0.996 0 121.31 0 2.35 0 62 60 58 0 0.280 62 0 0 0 0 0 H ALA 11 1
CH1 1.477 0 124.84 0 177.99 0 62 60 63 0 0.000 62 65 66 0 0 0 CA ALA 11 1
CH3 1.532 0 110.43 0 75.23 1 64 62 60 0 0.000 64 0 0 0 0 0 CB ALA 11 1
C 1.543 0 111.44 0 121.84 0 64 62 65 0 0.380 64 67 68 0 0 0 C ALA 11 1
O 1.230 0 122.42 0 341.13 1 66 64 62 0 -0.380 66 0 0 0 0 0 O ALA 11 1
N 1.336 0 113.47 0 179.34 0 66 64 67 0 -0.280 66 69 70 0 0 0 N ALA 12 1
H 0.995 0 121.64 0 2.08 0 68 66 64 0 0.280 68 0 0 0 0 0 H ALA 12 1
CH1 1.481 0 124.73 0 177.78 0 68 66 69 0 0.000 68 71 72 0 0 0 CA ALA 12 1
CH3 1.534 0 110.43 0 74.27 1 70 68 66 0 0.000 70 0 0 0 0 0 CB ALA 12 1
C 1.538 0 111.83 0 122.31 0 70 68 71 0 0.380 70 73 74 0 0 0 C ALA 12 1
O 1.238 0 122.51 0 342.26 1 72 70 68 0 -0.380 72 0 0 0 0 0 O ALA 12 1
N 1.332 0 113.66 0 178.50 0 72 70 73 0 -0.280 72 75 76 0 0 0 N ALA 13 1
H 1.003 0 121.12 0 2.29 0 74 72 70 0 0.280 74 0 0 0 0 0 H ALA 13 1
CH1 1.476 0 125.52 0 177.58 0 74 72 75 0 0.000 74 77 78 0 0 0 CA ALA 13 1
CH3 1.539 0 110.30 0 74.98 1 76 74 72 0 0.000 76 0 0 0 0 0 CB ALA 13 1
C 1.538 0 111.77 0 122.17 0 76 74 77 0 0.380 76 79 80 0 0 0 C ALA 13 1
O 1.231 0 122.67 0 342.28 1 78 76 74 0 -0.380 78 0 0 0 0 0 O ALA 13 1
N 1.339 0 113.35 0 178.64 0 78 76 79 0 -0.280 78 81 82 0 0 0 N ALA 14 1
H 0.996 0 121.18 0 1.34 0 80 78 76 0 0.280 80 0 0 0 0 0 H ALA 14 1
CH1 1.476 0 125.04 0 178.20 0 80 78 81 0 0.000 80 83 84 0 0 0 CA ALA 14 1
CH3 1.532 0 110.50 0 75.40 1 82 80 78 0 0.000 82 0 0 0 0 0 CB ALA 14 1
C 1.543 0 111.20 0 121.91 0 82 80 83 0 0.380 82 85 86 0 0 0 C ALA 14 1
O 1.230 0 122.54 0 342.10 1 84 82 80 0 -0.380 84 0 0 0 0 0 O ALA 14 1
N 1.338 0 113.45 0 179.00 0 84 82 85 0 -0.280 84 87 88 0 0 0 N ALA 15 1
H 0.996 0 121.32 0 2.35 0 86 84 82 0 0.280 86 0 0 0 0 0 H ALA 15 1
CH1 1.478 0 124.89 0 177.72 0 86 84 87 0 0.000 86 89 90 0 0 0 CA ALA 15 1
CH3 1.532 0 110.55 0 74.66 1 88 86 84 0 0.000 88 0 0 0 0 0 CB ALA 15 1
C 1.542 0 111.34 0 122.00 0 88 86 89 0 0.380 88 91 92 0 0 0 C ALA 15 1
O 1.230 0 122.50 0 341.58 1 90 88 86 0 -0.380 90 0 0 0 0 0 O ALA 15 1
N 1.339 0 113.56 0 178.79 0 90 88 91 0 -0.280 90 93 94 0 0 0 N ALA 16 1
H 0.997 0 121.21 0 1.85 0 92 90 88 0 0.280 92 0 0 0 0 0 H ALA 16 1
CH1 1.475 0 124.85 0 178.36 0 92 90 93 0 0.000 92 95 96 0 0 0 CA ALA 16 1
CH3 1.534 0 110.42 0 75.13 1 94 92 90 0 0.000 94 0 0 0 0 0 CB ALA 16 1
C 1.543 0 111.45 0 121.69 0 94 92 95 0 0.380 94 97 98 0 0 0 C ALA 16 1
O 1.230 0 122.38 0 340.49 1 96 94 92 0 -0.380 96 0 0 0 0 0 O ALA 16 1
N 1.336 0 113.50 0 179.72 0 96 94 97 0 -0.280 96 99 100 0 0 0 N ALA 17 1
H 0.996 0 121.59 0 2.23 0 98 96 94 0 0.280 98 0 0 0 0 0 H ALA 17 1
CH1 1.480 0 124.72 0 177.75 0 98 96 99 0 0.000 98 101 102 0 0 0 CA ALA 17 1
CH3 1.532 0 110.47 0 74.68 1 100 98 96 0 0.000 100 0 0 0 0 0 CB ALA 17 1
C 1.541 0 111.59 0 122.21 0 100 98 101 0 0.380 100 103 104 0 0 0 C ALA 17 1
O 1.230 0 122.58 0 342.04 1 102 100 98 0 -0.380 102 0 0 0 0 0 O ALA 17 1
N 1.339 0 113.51 0 178.56 0 102 100 103 0 -0.280 102 105 106 0 0 0 N ALA 18 1
H 1.002 0 121.10 0 2.11 0 104 102 100 0 0.280 104 0 0 0 0 0 H ALA 18 1
CH1 1.474 0 125.07 0 177.89 0 104 102 105 0 0.000 104 107 108 0 0 0 CA ALA 18 1
CH3 1.537 0 110.47 0 74.89 1 106 104 102 0 0.000 106 0 0 0 0 0 CB ALA 18 1
C 1.543 0 111.77 0 122.17 0 106 104 107 0 0.380 106 109 110 0 0 0 C ALA 18 1
O 1.230 0 122.52 0 342.56 1 108 106 104 0 -0.380 108 0 0 0 0 0 O ALA 18 1
N 1.339 0 113.42 0 178.83 0 108 106 109 0 -0.280 108 111 112 0 0 0 N ALA 19 1
H 0.996 0 121.21 0 1.87 0 110 108 106 0 0.280 110 0 0 0 0 0 H ALA 19 1
CH1 1.476 0 125.03 0 178.15 0 110 108 111 0 0.000 110 113 114 0 0 0 CA ALA 19 1
CH3 1.533 0 110.46 0 74.62 1 112 110 108 0 0.000 112 0 0 0 0 0 CB ALA 19 1
C 1.545 0 111.55 0 121.82 0 112 110 113 0 0.380 112 115 116 0 0 0 C ALA 19 1
O 1.231 0 122.28 0 341.47 1 114 112 110 0 -0.380 114 0 0 0 0 0 O ALA 19 1
N 1.334 0 113.67 0 179.45 0 114 112 115 0 -0.280 114 117 118 0 0 0 N ALA 20 1
H 1.002 0 121.52 0 1.54 0 116 114 112 0 0.280 116 0 0 0 0 0 H ALA 20 1
CH1 1.483 0 125.14 0 178.52 0 116 114 117 0 0.000 116 119 120 0 0 0 CA ALA 20 1
CH3 1.532 0 110.26 0 74.41 1 118 116 114 0 0.000 118 0 0 0 0 0 CB ALA 20 1
C 1.540 0 111.98 0 122.17 0 118 116 119 0 0.380 118 121 122 0 0 0 C ALA 20 1
O 1.238 0 122.12 0 342.71 1 120 118 116 0 -0.380 120 0 0 0 0 0 O ALA 20 1
N 1.333 0 114.19 0 178.89 0 120 118 121 0 -0.280 120 123 124 0 0 0 N ALA 21 1
H 1.003 0 121.29 0 1.82 0 122 120 118 0 0.280 122 0 0 0 0 0 H ALA 21 1
CH1 1.483 0 125.29 0 178.43 0 122 120 123 0 0.000 122 125 126 0 0 0 CA ALA 21 1
CH3 1.532 0 110.24 0 72.79 1 124 122 120 0 0.000 124 0 0 0 0 0 CB ALA 21 1
C 1.543 0 112.20 0 121.99 0 124 122 125 0 0.380 124 127 128 0 0 0 C ALA 21 1
O 1.229 0 122.25 0 344.83 1 126 124 122 0 -0.380 126 0 0 0 0 0 O ALA 21 1
N 1.339 0 113.97 0 177.76 0 126 124 127 0 -0.280 126 129 130 0 0 0 N ALA 22 1
H 0.995 0 121.63 0 359.44 0 128 126 124 0 0.280 128 0 0 0 0 0 H ALA 22 1
CH1 1.483 0 124.58 0 177.95 0 128 126 129 0 0.000 128 131 132 0 0 0 CA ALA 22 1
CH3 1.529 0 111.16 0 75.98 1 130 128 126 0 0.000 130 0 0 0 0 0 CB ALA 22 1
C 1.539 0 113.31 0 122.29 0 130 128 131 0 0.380 130 133 134 0 0 0 C ALA 22 1
O 1.249 0 119.98 0 349.24 1 132 130 128 0 -0.380 132 0 0 0 0 0 O ALA 22 1
H 1.004 0 115.46 0 179.50 0 132 130 133 0 0.000 132 0 0 0 0 0 HT TER 22 1
#### 0.000 0 0.00 0 0.00 0 0 0 0 0 0.000 0 0 0 0 0 0
Apêndice
144
Arquivo de entrada (*.IN) para otimização por GSA do
mastoparano-X
MECANICA MOLECULAR
INTERNAL GSA HOOK FTHET FDHP FDHI GROMOS2 NBCVW SAS FUNCDIE2
0.1000000000 Valor inicial do passo DELTA-X usado na minimizacao.
0.0100000000 Valor da precisao no calculo do potencial.
0.0000000000 Posicao da interface no eixo X.
2.0000000000 Valor de EPSLON1, correspondente ao meio aquoso.
0.0000000000 Valor de EPSLON2, correspondente ao meio apolar.
0.0000000000 Valor de XBOX, lado X da caixa para condicoes periodicas.
0.0000000000 Valor de YBOX, lado Y da caixa para condicoes periodicas.
0.0000000000 Valor de ZBOX, lado Z da caixa para condicoes periodicas.
0.0000000000 Valor de RCUT, raio de corte.
0.0000000000 Valor de RLIST, para lista de vizinhos.
NL 0.000 0 0.00 0 0.00 0 0 0 0 0 0.129 2 9 10 11 0 0 N ILE A 1 1
CH1 1.470 0 0.00 0 0.00 0 1 0 0 0 0.127 1 3 7 0 0 0 CA ILE A 1 1
CH1 1.530 0 110.91 0 0.00 0 2 1 0 0 0.000 2 4 6 0 0 0 CB ILE A 1 1
CH2 1.530 0 119.36 0 38.24 1 3 2 1 0 0.000 3 5 0 0 0 0 CG1 ILE A 1 1
CH3 1.449 0 109.00 0 120.00 1 4 3 2 0 0.000 4 0 0 0 0 0 CD1 ILE A 1 1
CH3 1.531 0 108.15 0 228.06 1 3 2 4 0 0.000 3 0 0 0 0 0 CG2 ILE A 1 1
C 1.530 0 114.44 0 118.38 0 2 1 3 0 0.380 2 8 12 0 0 0 C ILE A 1 1
O 1.230 0 117.83 0 336.15 1 7 2 1 0 -0.380 7 0 0 0 0 0 O ILE A 1 1
H 1.000 0 112.08 0 288.30 0 1 2 3 0 0.248 1 0 0 0 0 0 H1 ILE A 1 1
H 0.999 0 107.71 0 131.06 0 1 2 9 0 0.248 1 0 0 0 0 0 H2 ILE A 1 1
H 1.000 0 108.81 0 106.92 0 1 2 10 0 0.248 1 0 0 0 0 0 H3 ILE A 1 1
N 1.330 0 117.18 0 180.16 0 7 2 8 0 -0.280 7 13 14 0 0 0 N ASN A 2 1
H 1.000 0 125.01 0 17.19 0 12 7 2 0 0.280 12 0 0 0 0 0 H ASN A 2 1
CH1 1.470 0 123.59 0 166.61 0 12 7 13 0 0.000 12 15 21 0 0 0 CA ASN A 2 1
CH2 1.530 0 110.08 0 166.20 1 14 12 7 0 0.000 14 16 0 0 0 0 CB ASN A 2 1
C 1.530 0 110.89 0 272.79 1 15 14 12 0 0.380 15 17 18 0 0 0 CG ASN A 2 1
O 1.230 0 119.13 0 335.59 0 16 15 14 0 -0.380 16 0 0 0 0 0 OD1 ASN A 2 1
NT 1.330 0 118.28 0 173.60 0 16 15 17 0 -0.830 16 19 20 0 0 0 ND2 ASN A 2 1
H 1.100 0 120.00 0 180.00 0 18 16 15 0 0.415 18 0 0 0 0 0 1HD2 ASN A 2 1
H 1.100 0 120.00 0 180.00 0 18 16 19 0 0.415 18 0 0 0 0 0 2HD2 ASN A 2 1
C 1.530 0 108.73 0 125.43 0 14 12 15 0 0.380 14 22 23 0 0 0 C ASN A 2 1
O 1.230 0 114.73 0 154.08 1 21 14 12 0 -0.380 21 0 0 0 0 0 O ASN A 2 1
N 1.331 0 117.64 0 170.65 0 21 14 22 0 -0.280 21 24 25 0 0 0 N TRP A 3 1
H 1.000 0 121.20 0 331.25 0 23 21 14 0 0.280 23 0 0 0 0 0 H TRP A 3 1
CH1 1.470 0 123.66 0 202.43 0 23 21 24 0 0.000 23 26 37 0 0 0 CA TRP A 3 1
CH2 1.530 0 109.18 0 165.32 1 25 23 21 0 0.000 25 27 0 0 0 0 CB TRP A 3 1
C 1.530 0 115.62 0 186.61 1 26 25 23 0 -0.140 26 28 32 0 0 0 CG TRP A 3 1
C 1.330 0 123.24 0 96.40 0 27 26 25 0 -0.100 27 29 39 0 0 0 CD1 TRP A 3 1
NR 1.329 0 109.62 0 177.71 0 28 27 26 0 -0.050 28 30 31 0 0 0 NE1 TRP A 3 1
H 1.000 0 124.48 0 179.11 0 29 28 27 0 0.190 29 0 0 0 0 0 HE1 TRP A 3 1
C 1.330 0 110.72 0 182.72 0 29 28 30 0 0.000 29 32 36 0 0 0 CE2 TRP A 3 1
C 1.390 0 130.54 0 179.49 0 27 26 28 0 0.000 27 31 33 0 0 0 CD2 TRP A 3 1
C 1.390 0 130.56 0 12.48 0 32 27 26 0 -0.100 32 34 40 0 0 0 CE3 TRP A 3 1
C 1.391 0 120.62 0 164.36 0 33 32 27 0 -0.100 33 35 42 0 0 0 CZ3 TRP A 3 1
C 1.390 0 119.19 0 4.31 0 34 33 32 0 -0.100 34 36 43 0 0 0 CH2 TRP A 3 1
C 1.390 0 119.41 0 357.69 0 35 34 33 0 -0.100 31 35 41 0 0 0 CZ2 TRP A 3 1
C 1.530 0 108.35 0 117.02 0 25 23 26 0 0.380 25 38 44 0 0 0 C TRP A 3 1
O 1.230 0 118.14 0 324.69 1 37 25 23 0 -0.380 37 0 0 0 0 0 O TRP A 3 1
HC 1.090 0 126.94 0 149.30 0 28 27 29 0 0.100 28 0 0 0 0 0 HD1 TRP A 3 1
HC 1.091 0 116.48 0 182.77 0 33 32 34 0 0.100 33 0 0 0 0 0 HE3 TRP A 3 1
HC 1.090 0 117.89 0 176.21 0 36 35 34 0 0.100 36 0 0 0 0 0 HZ2 TRP A 3 1
HC 1.090 0 125.25 0 184.48 0 34 33 35 0 0.100 34 0 0 0 0 0 HZ3 TRP A 3 1
HC 1.090 0 111.80 0 182.20 0 35 34 36 0 0.100 35 0 0 0 0 0 HH2 TRP A 3 1
N 1.330 0 116.64 0 159.32 0 37 25 38 0 -0.280 37 45 46 0 0 0 N LYS A 4 1
H 1.001 0 117.06 0 337.76 0 44 37 25 0 0.280 44 0 0 0 0 0 H LYS A 4 1
CH1 1.470 0 121.34 0 212.20 0 44 37 45 0 0.000 44 47 55 0 0 0 CA LYS A 4 1
CH2 1.531 0 103.83 0 114.70 1 46 44 37 0 0.000 46 48 0 0 0 0 CB LYS A 4 1
CH2 1.530 0 115.04 0 292.70 1 47 46 44 0 0.000 47 49 0 0 0 0 CG LYS A 4 1
CH2 1.530 0 120.72 0 183.75 1 48 47 46 0 0.000 48 50 0 0 0 0 CD LYS A 4 1
CH2 1.530 0 106.03 0 163.91 1 49 48 47 0 0.127 49 51 0 0 0 0 CE LYS A 4 1
NL 1.470 0 107.51 0 209.40 1 50 49 48 0 0.129 50 52 53 54 0 0 NZ LYS A 4 1
H 1.000 0 118.25 0 156.71 0 51 50 49 0 0.248 51 0 0 0 0 0 HZ1 LYS A 4 1
H 1.000 0 106.46 0 116.08 0 51 50 52 0 0.248 51 0 0 0 0 0 HZ2 LYS A 4 1
H 1.001 0 116.48 0 109.65 0 51 50 53 0 0.248 51 0 0 0 0 0 HZ3 LYS A 4 1
C 1.529 0 120.33 0 123.90 0 46 44 47 0 0.380 46 56 57 0 0 0 C LYS A 4 1
O 1.230 0 118.73 0 132.88 1 55 46 44 0 -0.380 55 0 0 0 0 0 O LYS A 4 1
N 1.331 0 118.22 0 189.88 0 55 46 56 0 -0.280 55 58 59 0 0 0 N GLY A 5 1
H 1.000 0 115.44 0 356.43 0 57 55 46 0 0.280 57 0 0 0 0 0 H GLY A 5 1
CH2 1.470 0 130.11 0 190.14 0 57 55 58 0 0.000 57 60 0 0 0 0 CA GLY A 5 1
C 1.529 0 119.85 0 1.62 0 59 57 55 0 0.380 59 61 62 0 0 0 C GLY A 5 1
O 1.230 0 120.26 0 97.02 1 60 59 57 0 -0.380 60 0 0 0 0 0 O GLY A 5 1
N 1.330 0 115.41 0 178.90 0 60 59 61 0 -0.280 60 63 64 0 0 0 N ILE A 6 1
H 1.000 0 119.81 0 1.49 0 62 60 59 0 0.280 62 0 0 0 0 0 H ILE A 6 1
CH1 1.470 0 126.30 0 175.03 0 62 60 63 0 0.000 62 65 69 0 0 0 CA ILE A 6 1
CH1 1.530 0 116.56 0 187.48 1 64 62 60 0 0.000 64 66 68 0 0 0 CB ILE A 6 1
CH2 1.530 0 118.45 0 56.58 1 65 64 62 0 0.000 65 67 0 0 0 0 CG1 ILE A 6 1
CH3 1.449 0 109.00 0 120.00 1 66 65 64 0 0.000 66 0 0 0 0 0 CD1 ILE A 6 1
CH3 1.530 0 114.30 0 223.01 1 65 64 66 0 0.000 65 0 0 0 0 0 CG2 ILE A 6 1
C 1.530 0 116.74 0 139.51 0 64 62 65 0 0.380 64 70 71 0 0 0 C ILE A 6 1
O 1.231 0 117.69 0 148.50 1 69 64 62 0 -0.380 69 0 0 0 0 0 O ILE A 6 1
N 1.330 0 116.26 0 188.41 0 69 64 70 0 -0.280 69 72 73 0 0 0 N ALA A 7 1
H 1.000 0 120.14 0 9.89 0 71 69 64 0 0.280 71 0 0 0 0 0 H ALA A 7 1
CH1 1.470 0 133.15 0 177.91 0 71 69 72 0 0.000 71 74 75 0 0 0 CA ALA A 7 1
CH3 1.530 0 108.64 0 158.65 1 73 71 69 0 0.000 73 0 0 0 0 0 CB ALA A 7 1
C 1.530 0 110.62 0 124.10 0 73 71 74 0 0.380 73 76 77 0 0 0 C ALA A 7 1
O 1.229 0 115.64 0 154.19 1 75 73 71 0 -0.380 75 0 0 0 0 0 O ALA A 7 1
N 1.330 0 121.42 0 180.79 0 75 73 76 0 -0.280 75 78 79 0 0 0 N ALA A 8 1
H 1.000 0 117.02 0 345.50 0 77 75 73 0 0.280 77 0 0 0 0 0 H ALA A 8 1
CH1 1.470 0 126.64 0 172.83 0 77 75 78 0 0.000 77 80 81 0 0 0 CA ALA A 8 1
Apêndice
145
CH3 1.530 0 106.93 0 119.45 1 79 77 75 0 0.000 79 0 0 0 0 0 CB ALA A 8 1
C 1.530 0 116.80 0 123.33 0 79 77 80 0 0.380 79 82 83 0 0 0 C ALA A 8 1
O 1.231 0 118.56 0 141.52 1 81 79 77 0 -0.380 81 0 0 0 0 0 O ALA A 8 1
N 1.330 0 110.82 0 176.85 0 81 79 82 0 -0.280 81 84 85 0 0 0 N MET A 9 1
H 1.000 0 122.70 0 9.84 0 83 81 79 0 0.280 83 0 0 0 0 0 H MET A 9 1
CH1 1.470 0 121.70 0 175.70 0 83 81 84 0 0.000 83 86 90 0 0 0 CA MET A 9 1
CH2 1.530 0 111.13 0 104.74 1 85 83 81 0 0.000 85 87 0 0 0 0 CB MET A 9 1
CH2 1.530 0 107.87 0 221.97 1 86 85 83 0 0.000 86 88 0 0 0 0 CG MET A 9 1
S 1.830 0 116.17 0 287.08 1 87 86 85 0 0.000 87 89 0 0 0 0 SD MET A 9 1
CH3 1.780 0 101.88 0 273.04 1 88 87 86 0 0.000 88 0 0 0 0 0 CE MET A 9 1
C 1.530 0 118.47 0 135.89 0 85 83 86 0 0.380 85 91 92 0 0 0 C MET A 9 1
O 1.231 0 121.26 0 285.13 1 90 85 83 0 -0.380 90 0 0 0 0 0 O MET A 9 1
N 1.330 0 116.76 0 164.69 0 90 85 91 0 -0.280 90 93 94 0 0 0 N ALA A 10 1
H 1.000 0 119.09 0 355.95 0 92 90 85 0 0.280 92 0 0 0 0 0 H ALA A 10 1
CH1 1.470 0 125.15 0 176.07 0 92 90 93 0 0.000 92 95 96 0 0 0 CA ALA A 10 1
CH3 1.530 0 102.57 0 139.39 1 94 92 90 0 0.000 94 0 0 0 0 0 CB ALA A 10 1
C 1.529 0 106.23 0 121.14 0 94 92 95 0 0.380 94 97 98 0 0 0 C ALA A 10 1
O 1.230 0 125.20 0 283.10 1 96 94 92 0 -0.380 96 0 0 0 0 0 O ALA A 10 1
N 1.330 0 112.87 0 178.95 0 96 94 97 0 -0.280 96 99 100 0 0 0 N LYS A 11 1
H 1.000 0 118.42 0 344.72 0 98 96 94 0 0.280 98 0 0 0 0 0 H LYS A 11 1
CH1 1.470 0 123.58 0 199.21 0 98 96 99 0 0.000 98 101 109 0 0 0 CA LYS A 11 1
CH2 1.531 0 107.00 0 158.44 1 100 98 96 0 0.000 100 102 0 0 0 0 CB LYS A 11 1
CH2 1.530 0 112.50 0 200.44 1 101 100 98 0 0.000 101 103 0 0 0 0 CG LYS A 11 1
CH2 1.530 0 111.71 0 199.30 1 102 101 100 0 0.000 102 104 0 0 0 0 CD LYS A 11 1
CH2 1.530 0 114.70 0 182.71 1 103 102 101 0 0.127 103 105 0 0 0 0 CE LYS A 11 1
NL 1.471 0 104.14 0 161.53 1 104 103 102 0 0.129 104 106 107 108 0 0 NZ LYS A 11 1
H 1.000 0 106.70 0 73.62 0 105 104 103 0 0.248 105 0 0 0 0 0 HZ1 LYS A 11 1
H 0.999 0 110.12 0 120.03 0 105 104 106 0 0.248 105 0 0 0 0 0 HZ2 LYS A 11 1
H 1.000 0 103.94 0 111.07 0 105 104 107 0 0.248 105 0 0 0 0 0 HZ3 LYS A 11 1
C 1.530 0 108.68 0 120.53 0 100 98 101 0 0.380 100 110 111 0 0 0 C LYS A 11 1
O 1.230 0 120.98 0 296.86 1 109 100 98 0 -0.380 109 0 0 0 0 0 O LYS A 11 1
N 1.329 0 109.51 0 159.35 0 109 100 110 0 -0.280 109 112 113 0 0 0 N LYS A 12 1
H 1.000 0 119.24 0 31.48 0 111 109 100 0 0.280 111 0 0 0 0 0 H LYS A 12 1
CH1 1.470 0 122.84 0 146.90 0 111 109 112 0 0.000 111 114 122 0 0 0 CA LYS A 12 1
CH2 1.530 0 117.01 0 93.86 1 113 111 109 0 0.000 113 115 0 0 0 0 CB LYS A 12 1
CH2 1.530 0 110.34 0 57.91 1 114 113 111 0 0.000 114 116 0 0 0 0 CG LYS A 12 1
CH2 1.530 0 116.49 0 171.80 1 115 114 113 0 0.000 115 117 0 0 0 0 CD LYS A 12 1
CH2 1.530 0 106.62 0 200.34 1 116 115 114 0 0.127 116 118 0 0 0 0 CE LYS A 12 1
NL 1.471 0 107.84 0 88.60 1 117 116 115 0 0.129 117 119 120 121 0 0 NZ LYS A 12 1
H 1.000 0 116.59 0 292.35 0 118 117 116 0 0.248 118 0 0 0 0 0 HZ1 LYS A 12 1
H 1.000 0 111.09 0 113.20 0 118 117 119 0 0.248 118 0 0 0 0 0 HZ2 LYS A 12 1
H 1.000 0 103.22 0 129.87 0 118 117 120 0 0.248 118 0 0 0 0 0 HZ3 LYS A 12 1
C 1.530 0 114.39 0 136.19 0 113 111 114 0 0.380 113 123 124 0 0 0 C LYS A 12 1
O 1.229 0 119.71 0 303.35 1 122 113 111 0 -0.380 122 0 0 0 0 0 O LYS A 12 1
N 1.330 0 115.94 0 195.07 0 122 113 123 0 -0.280 122 125 126 0 0 0 N LEU A 13 1
H 1.000 0 123.96 0 355.85 0 124 122 113 0 0.280 124 0 0 0 0 0 H LEU A 13 1
CH1 1.469 0 125.24 0 179.23 0 124 122 125 0 0.000 124 127 131 0 0 0 CA LEU A 13 1
CH2 1.530 0 108.27 0 149.12 1 126 124 122 0 0.000 126 128 0 0 0 0 CB LEU A 13 1
CH1 1.530 0 115.06 0 304.20 1 127 126 124 0 0.000 127 129 130 0 0 0 CG LEU A 13 1
CH3 1.530 0 105.32 0 147.25 1 128 127 126 0 0.000 128 0 0 0 0 0 CD1 LEU A 13 1
CH3 1.530 0 110.17 0 116.16 1 128 127 129 0 0.000 128 0 0 0 0 0 CD2 LEU A 13 1
C 1.530 0 113.90 0 135.47 0 126 124 127 0 0.380 126 132 133 0 0 0 C LEU A 13 1
O 1.230 0 118.96 0 102.53 1 131 126 124 0 -0.380 131 0 0 0 0 0 O LEU A 13 1
N 1.330 0 109.21 0 212.34 0 131 126 132 0 -0.280 131 134 135 0 0 0 N LEU A 14 1
H 1.000 0 131.98 0 0.57 0 133 131 126 0 0.280 133 0 0 0 0 0 H LEU A 14 1
CH1 1.470 0 118.40 0 187.27 0 133 131 134 0 0.000 133 136 140 0 0 0 CA LEU A 14 1
CH2 1.530 0 107.73 0 124.03 1 135 133 131 0 0.000 135 137 0 0 0 0 CB LEU A 14 1
CH1 1.531 0 115.24 0 174.71 1 136 135 133 0 0.000 136 138 139 0 0 0 CG LEU A 14 1
CH3 1.530 0 108.26 0 82.18 1 137 136 135 0 0.000 137 0 0 0 0 0 CD1 LEU A 14 1
CH3 1.530 0 108.69 0 122.99 1 137 136 138 0 0.000 137 0 0 0 0 0 CD2 LEU A 14 1
C 1.530 0 111.82 0 122.50 0 135 133 136 0 0.270 135 141 142 0 0 0 C LEU A 14 1
OM 1.230 0 124.38 0 334.74 0 140 135 133 0 -0.635 140 0 0 0 0 0 O LEU A 14 1
OM 1.229 0 109.62 0 180.00 0 140 135 141 0 -0.635 140 0 0 0 0 0 OXT TER A 14 1
#### 0.000 0 0.00 0 0.00 0 0 0 0 0 0.000 0 0 0 0 0 0
Arquivo de entrada (*.IN) para otimização por GSA do
Trp-cage
MECANICA MOLECULAR
INTERNAL GSA HOOK FTHET FDHP FDHI GROMOS2 NBCVW SAS FUNCDIE2
0.1000000000 Valor inicial do passo DELTA-X usado na minimizacao.
0.0100000000 Valor da precisao no calculo do potencial.
0.0000000000 Posicao da interface no eixo X.
80.0000000000 Valor de EPSLON1, correspondente ao meio aquoso.
0.0000000000 Valor de EPSLON2, correspondente ao meio apolar.
0.0000000000 Valor de XBOX, lado X da caixa para condicoes periodicas.
0.0000000000 Valor de YBOX, lado Y da caixa para condicoes periodicas.
0.0000000000 Valor de ZBOX, lado Z da caixa para condicoes periodicas.
0.0000000000 Valor de RCUT, raio de corte.
0.0000000000 Valor de RLIST, para lista de vizinhos.
NL 0.000 0 0.00 0 0.00 0 0 0 0 0 0.129 2 11 12 13 0 0 N ASN A 1 1
CH1 1.449 0 0.00 0 0.00 0 1 0 0 0 0.127 1 3 9 0 0 0 CA ASN A 1 1
CH2 1.525 0 111.08 0 0.00 0 2 1 0 0 0.000 2 4 0 0 0 0 CB ASN A 1 1
C 1.523 0 111.06 0 180.00 1 3 2 1 0 0.380 3 5 6 0 0 0 CG ASN A 1 1
O 1.228 0 120.53 0 0.00 0 4 3 2 0 -0.380 4 0 0 0 0 0 OD1 ASN A 1 1
NT 1.335 0 116.59 0 179.98 0 4 3 5 0 -0.830 4 7 8 0 0 0 ND2 ASN A 1 1
H 1.010 0 119.78 0 0.04 0 6 4 3 0 0.415 6 0 0 0 0 0 1HD2 ASN A 1 1
H 1.010 0 119.83 0 179.97 0 6 4 7 0 0.415 6 0 0 0 0 0 2HD2 ASN A 1 1
C 1.522 0 111.09 0 119.99 0 2 1 3 0 0.380 2 10 14 0 0 0 C ASN A 1 1
O 1.228 0 120.52 0 299.99 1 9 2 1 0 -0.380 9 0 0 0 0 0 O ASN A 1 1
H 1.010 0 108.00 0 180.00 0 1 2 3 0 0.248 1 0 0 0 0 0 H1 ASN A 1 1
H 1.010 0 108.00 0 240.00 0 1 2 11 0 0.248 1 0 0 0 0 0 H2 ASN A 1 1
Apêndice
146
H 1.010 0 108.00 0 240.00 0 1 2 12 0 0.248 1 0 0 0 0 0 H3 ASN A 1 1
N 1.335 0 116.58 0 180.00 0 9 2 10 0 -0.280 9 15 16 0 0 0 N LEU A 2 1
H 1.010 0 119.06 0 0.00 0 14 9 2 0 0.280 14 0 0 0 0 0 H LEU A 2 1
CH1 1.449 0 121.91 0 179.96 0 14 9 15 0 0.000 14 17 21 0 0 0 CA LEU A 2 1
CH2 1.524 0 111.06 0 59.99 1 16 14 9 0 0.000 16 18 0 0 0 0 CB LEU A 2 1
CH1 1.526 0 109.48 0 180.02 1 17 16 14 0 0.000 17 19 20 0 0 0 CG LEU A 2 1
CH3 1.525 0 109.43 0 59.98 1 18 17 16 0 0.000 18 0 0 0 0 0 CD1 LEU A 2 1
CH3 1.524 0 109.46 0 120.08 1 18 17 19 0 0.000 18 0 0 0 0 0 CD2 LEU A 2 1
C 1.521 0 111.12 0 120.01 0 16 14 17 0 0.380 16 22 23 0 0 0 C LEU A 2 1
O 1.229 0 120.52 0 340.05 1 21 16 14 0 -0.380 21 0 0 0 0 0 O LEU A 2 1
N 1.335 0 116.60 0 179.95 0 21 16 22 0 -0.280 21 24 25 0 0 0 N TYR A 3 1
H 1.010 0 119.04 0 0.03 0 23 21 16 0 0.280 23 0 0 0 0 0 H TYR A 3 1
CH1 1.449 0 121.92 0 179.96 0 23 21 24 0 0.000 23 26 35 0 0 0 CA TYR A 3 1
CH2 1.526 0 111.08 0 40.03 1 25 23 21 0 0.000 25 27 0 0 0 0 CB TYR A 3 1
C 1.510 0 109.45 0 180.02 0 26 25 23 0 0.000 26 28 32 0 0 0 CG TYR A 3 1
C 1.400 0 119.96 0 180.00 0 27 26 25 0 -0.100 27 29 37 0 0 0 CD1 TYR A 3 1
C 1.400 0 119.99 0 180.00 0 28 27 26 0 -0.100 28 30 39 0 0 0 CE1 TYR A 3 1
C 1.400 0 119.99 0 359.95 0 29 28 27 0 0.150 29 31 33 0 0 0 CZ TYR A 3 1
C 1.400 0 120.02 0 0.05 0 30 29 28 0 -0.100 30 32 40 0 0 0 CE2 TYR A 3 1
C 1.399 0 120.02 0 179.95 0 27 26 28 0 -0.100 27 31 38 0 0 0 CD2 TYR A 3 1
OA 1.360 0 120.01 0 179.98 0 30 29 31 0 -0.548 30 34 0 0 0 0 OH TYR A 3 1
H 0.960 0 113.00 0 0.00 0 33 30 29 0 0.398 33 0 0 0 0 0 HH TYR A 3 1
C 1.522 0 111.11 0 119.97 0 25 23 26 0 0.380 25 36 41 0 0 0 C TYR A 3 1
O 1.229 0 120.51 0 300.00 1 35 25 23 0 -0.380 35 0 0 0 0 0 O TYR A 3 1
HC 1.090 0 119.99 0 179.99 0 28 27 29 0 0.100 28 0 0 0 0 0 HD1 TYR A 3 1
HC 1.090 0 120.01 0 0.05 0 32 27 26 0 0.100 32 0 0 0 0 0 HD2 TYR A 3 1
HC 1.090 0 120.05 0 180.06 0 29 28 30 0 0.100 29 0 0 0 0 0 HE1 TYR A 3 1
HC 1.090 0 120.04 0 179.97 0 31 30 29 0 0.100 31 0 0 0 0 0 HE2 TYR A 3 1
N 1.335 0 116.60 0 180.05 0 35 25 36 0 -0.280 35 42 43 0 0 0 N ILE A 4 1
H 1.011 0 119.01 0 0.00 0 41 35 25 0 0.280 41 0 0 0 0 0 H ILE A 4 1
CH1 1.449 0 121.92 0 180.01 0 41 35 42 0 0.000 41 44 48 0 0 0 CA ILE A 4 1
CH1 1.525 0 109.44 0 59.99 1 43 41 35 0 0.000 43 45 47 0 0 0 CB ILE A 4 1
CH2 1.525 0 109.46 0 180.00 1 44 43 41 0 0.000 44 46 0 0 0 0 CG1 ILE A 4 1
CH3 1.525 0 109.48 0 179.97 1 45 44 43 0 0.000 45 0 0 0 0 0 CD1 ILE A 4 1
CH3 1.525 0 109.52 0 239.99 1 44 43 45 0 0.000 44 0 0 0 0 0 CG2 ILE A 4 1
C 1.522 0 111.12 0 119.96 0 43 41 44 0 0.380 43 49 50 0 0 0 C ILE A 4 1
O 1.229 0 120.50 0 340.04 1 48 43 41 0 -0.380 48 0 0 0 0 0 O ILE A 4 1
N 1.335 0 116.61 0 179.92 0 48 43 49 0 -0.280 48 51 52 0 0 0 N GLN A 5 1
H 1.011 0 119.05 0 0.12 0 50 48 43 0 0.280 50 0 0 0 0 0 H GLN A 5 1
CH1 1.449 0 121.89 0 179.89 0 50 48 51 0 0.000 50 53 60 0 0 0 CA GLN A 5 1
CH2 1.525 0 111.10 0 40.07 1 52 50 48 0 0.000 52 54 0 0 0 0 CB GLN A 5 1
CH2 1.525 0 109.46 0 179.94 1 53 52 50 0 0.000 53 55 0 0 0 0 CG GLN A 5 1
C 1.522 0 111.09 0 179.97 1 54 53 52 0 0.380 54 56 57 0 0 0 CD GLN A 5 1
O 1.229 0 120.52 0 0.06 0 55 54 53 0 -0.380 55 0 0 0 0 0 OE1 GLN A 5 1
NT 1.335 0 116.62 0 179.99 0 55 54 56 0 -0.830 55 58 59 0 0 0 NE2 GLN A 5 1
H 1.010 0 119.77 0 359.93 0 57 55 54 0 0.415 57 0 0 0 0 0 1HE2 GLN A 5 1
H 1.010 0 119.87 0 180.13 0 57 55 58 0 0.415 57 0 0 0 0 0 2HE2 GLN A 5 1
C 1.523 0 111.08 0 119.96 0 52 50 53 0 0.380 52 61 62 0 0 0 C GLN A 5 1
O 1.228 0 120.54 0 300.07 1 60 52 50 0 -0.380 60 0 0 0 0 0 O GLN A 5 1
N 1.335 0 116.60 0 179.93 0 60 52 61 0 -0.280 60 63 64 0 0 0 N TRP A 6 1
H 1.010 0 119.01 0 0.04 0 62 60 52 0 0.280 62 0 0 0 0 0 H TRP A 6 1
CH1 1.449 0 121.91 0 179.94 0 62 60 63 0 0.000 62 65 76 0 0 0 CA TRP A 6 1
CH2 1.525 0 111.08 0 20.09 1 64 62 60 0 0.000 64 66 0 0 0 0 CB TRP A 6 1
C 1.510 0 114.99 0 179.99 0 65 64 62 0 -0.140 65 67 71 0 0 0 CG TRP A 6 1
C 1.340 0 126.98 0 179.91 0 66 65 64 0 -0.100 66 68 78 0 0 0 CD1 TRP A 6 1
NR 1.430 0 106.98 0 180.00 0 67 66 65 0 -0.050 67 69 70 0 0 0 NE1 TRP A 6 1
H 1.010 0 125.52 0 180.04 0 68 67 66 0 0.190 68 0 0 0 0 0 HE1 TRP A 6 1
C 1.310 0 109.02 0 179.99 0 68 67 69 0 0.000 68 71 75 0 0 0 CE2 TRP A 6 1
C 1.330 0 107.69 0 0.00 0 70 68 67 0 0.000 66 70 72 0 0 0 CD2 TRP A 6 1
C 1.400 0 119.72 0 179.97 0 71 70 68 0 -0.100 71 73 79 0 0 0 CE3 TRP A 6 1
C 1.410 0 116.96 0 0.00 0 72 71 70 0 -0.100 72 74 81 0 0 0 CZ3 TRP A 6 1
C 1.350 0 122.04 0 0.00 0 73 72 71 0 -0.100 73 75 82 0 0 0 CH2 TRP A 6 1
C 1.390 0 120.98 0 359.98 0 74 73 72 0 -0.100 70 74 80 0 0 0 CZ2 TRP A 6 1
C 1.522 0 111.06 0 119.91 0 64 62 65 0 0.380 64 77 83 0 0 0 C TRP A 6 1
O 1.228 0 120.52 0 269.99 1 76 64 62 0 -0.380 76 0 0 0 0 0 O TRP A 6 1
HC 1.089 0 126.49 0 180.08 0 67 66 68 0 0.100 67 0 0 0 0 0 HD1 TRP A 6 1
HC 1.089 0 121.49 0 180.04 0 72 71 73 0 0.100 72 0 0 0 0 0 HE3 TRP A 6 1
HC 1.090 0 122.01 0 180.01 0 75 74 73 0 0.100 75 0 0 0 0 0 HZ2 TRP A 6 1
HC 1.090 0 119.00 0 179.97 0 73 72 74 0 0.100 73 0 0 0 0 0 HZ3 TRP A 6 1
HC 1.090 0 119.49 0 179.97 0 74 73 75 0 0.100 74 0 0 0 0 0 HH2 TRP A 6 1
N 1.335 0 116.55 0 180.08 0 76 64 77 0 -0.280 76 84 85 0 0 0 N LEU A 7 1
H 1.009 0 119.08 0 359.94 0 83 76 64 0 0.280 83 0 0 0 0 0 H LEU A 7 1
CH1 1.449 0 121.88 0 180.04 0 83 76 84 0 0.000 83 86 90 0 0 0 CA LEU A 7 1
CH2 1.524 0 111.09 0 39.96 1 85 83 76 0 0.000 85 87 0 0 0 0 CB LEU A 7 1
CH1 1.525 0 109.48 0 180.02 1 86 85 83 0 0.000 86 88 89 0 0 0 CG LEU A 7 1
CH3 1.525 0 109.45 0 59.98 1 87 86 85 0 0.000 87 0 0 0 0 0 CD1 LEU A 7 1
CH3 1.524 0 109.48 0 120.02 1 87 86 88 0 0.000 87 0 0 0 0 0 CD2 LEU A 7 1
C 1.522 0 111.08 0 120.02 0 85 83 86 0 0.380 85 91 92 0 0 0 C LEU A 7 1
O 1.229 0 120.53 0 299.97 1 90 85 83 0 -0.380 90 0 0 0 0 0 O LEU A 7 1
N 1.335 0 116.58 0 180.00 0 90 85 91 0 -0.280 90 93 94 0 0 0 N LYS A 8 1
H 1.010 0 119.08 0 0.06 0 92 90 85 0 0.280 92 0 0 0 0 0 H LYS A 8 1
CH1 1.449 0 121.89 0 179.91 0 92 90 93 0 0.000 92 95 103 0 0 0 CA LYS A 8 1
CH2 1.524 0 111.11 0 60.02 1 94 92 90 0 0.000 94 96 0 0 0 0 CB LYS A 8 1
CH2 1.525 0 109.52 0 179.99 1 95 94 92 0 0.000 95 97 0 0 0 0 CG LYS A 8 1
CH2 1.525 0 109.51 0 179.99 1 96 95 94 0 0.000 96 98 0 0 0 0 CD LYS A 8 1
CH2 1.524 0 109.48 0 180.02 1 97 96 95 0 0.127 97 99 0 0 0 0 CE LYS A 8 1
NL 1.470 0 109.48 0 180.01 1 98 97 96 0 0.129 98 100 101 102 0 0 NZ LYS A 8 1
H 1.000 0 109.00 0 180.00 0 99 98 97 0 0.248 99 0 0 0 0 0 HZ1 LYS A 8 1
H 1.000 0 109.00 0 240.00 0 99 98 100 0 0.248 99 0 0 0 0 0 HZ2 LYS A 8 1
H 1.000 0 109.00 0 240.00 0 99 98 101 0 0.248 99 0 0 0 0 0 HZ3 LYS A 8 1
C 1.523 0 111.09 0 120.02 0 94 92 95 0 0.380 94 104 105 0 0 0 C LYS A 8 1
O 1.228 0 120.47 0 339.99 1 103 94 92 0 -0.380 103 0 0 0 0 0 O LYS A 8 1
N 1.335 0 116.55 0 180.02 0 103 94 104 0 -0.280 103 106 107 0 0 0 N ASP A 9 1
H 1.010 0 119.10 0 359.95 0 105 103 94 0 0.280 105 0 0 0 0 0 H ASP A 9 1
CH1 1.449 0 121.84 0 180.03 0 105 103 106 0 0.000 105 108 112 0 0 0 CA ASP A 9 1
CH2 1.525 0 111.10 0 60.03 1 107 105 103 0 0.000 107 109 0 0 0 0 CB ASP A 9 1
C 1.528 0 109.45 0 179.99 1 108 107 105 0 0.270 108 110 111 0 0 0 CG ASP A 9 1
OM 1.260 0 117.20 0 89.98 0 109 108 107 0 -0.635 109 0 0 0 0 0 OD1 ASP A 9 1
OM 1.260 0 117.17 0 179.98 0 109 108 110 0 -0.635 109 0 0 0 0 0 OD2 ASP A 9 1
Apêndice
147
C 1.523 0 111.08 0 119.96 0 107 105 108 0 0.380 107 113 114 0 0 0 C ASP A 9 1
O 1.228 0 120.52 0 340.02 1 112 107 105 0 -0.380 112 0 0 0 0 0 O ASP A 9 1
N 1.335 0 116.55 0 179.99 0 112 107 113 0 -0.280 112 115 116 0 0 0 N GLY A 10 1
H 1.010 0 119.08 0 0.00 0 114 112 107 0 0.280 114 0 0 0 0 0 H GLY A 10 1
CH2 1.449 0 121.86 0 180.07 0 114 112 115 0 0.000 114 117 0 0 0 0 CA GLY A 10 1
C 1.522 0 110.42 0 180.00 0 116 114 112 0 0.380 116 118 119 0 0 0 C GLY A 10 1
O 1.229 0 120.47 0 339.97 1 117 116 114 0 -0.380 117 0 0 0 0 0 O GLY A 10 1
N 1.335 0 116.65 0 179.99 0 117 116 118 0 -0.280 117 120 121 0 0 0 N GLY A 11 1
H 1.011 0 119.00 0 359.97 0 119 117 116 0 0.280 119 0 0 0 0 0 H GLY A 11 1
CH2 1.448 0 121.94 0 180.02 0 119 117 120 0 0.000 119 122 0 0 0 0 CA GLY A 11 1
C 1.522 0 110.44 0 179.96 0 121 119 117 0 0.380 121 123 124 0 0 0 C GLY A 11 1
O 1.229 0 120.50 0 340.04 1 122 121 119 0 -0.380 122 0 0 0 0 0 O GLY A 11 1
N 1.337 0 116.99 0 179.91 0 122 121 123 0 0.000 122 125 128 0 0 0 N PRO A 12 1
CH1 1.453 0 120.99 0 180.03 0 124 122 121 0 0.000 124 126 129 0 0 0 CA PRO A 12 1
CH2 1.500 0 109.48 0 160.07 1 125 124 122 0 0.000 125 127 0 0 0 0 CB PRO A 12 1
CH2 1.510 0 109.49 0 359.97 0 126 125 124 0 0.000 126 128 0 0 0 0 CG PRO A 12 1
CH2 1.500 0 106.00 0 0.05 0 127 126 125 0 0.000 124 127 0 0 0 0 CD PRO A 12 1
C 1.522 0 111.10 0 120.00 0 125 124 126 0 0.380 125 130 131 0 0 0 C PRO A 12 1
O 1.229 0 120.51 0 339.94 1 129 125 124 0 -0.380 129 0 0 0 0 0 O PRO A 12 1
N 1.334 0 116.60 0 180.03 0 129 125 130 0 -0.280 129 132 133 0 0 0 N SER A 13 1
H 1.010 0 119.06 0 0.00 0 131 129 125 0 0.280 131 0 0 0 0 0 H SER A 13 1
CH1 1.449 0 121.91 0 179.97 0 131 129 132 0 0.000 131 134 137 0 0 0 CA SER A 13 1
CH2 1.525 0 111.08 0 60.02 1 133 131 129 0 0.150 133 135 0 0 0 0 CB SER A 13 1
OA 1.431 0 109.47 0 180.00 0 134 133 131 0 -0.548 134 136 0 0 0 0 OG SER A 13 1
H 0.959 0 109.46 0 179.95 0 135 134 133 0 0.398 135 0 0 0 0 0 HG SER A 13 1
C 1.522 0 111.15 0 119.99 0 133 131 134 0 0.380 133 138 139 0 0 0 C SER A 13 1
O 1.229 0 120.46 0 340.01 1 137 133 131 0 -0.380 137 0 0 0 0 0 O SER A 13 1
N 1.335 0 116.61 0 179.96 0 137 133 138 0 -0.280 137 140 141 0 0 0 N SER A 14 1
H 1.009 0 119.06 0 0.08 0 139 137 133 0 0.280 139 0 0 0 0 0 H SER A 14 1
CH1 1.449 0 121.85 0 179.92 0 139 137 140 0 0.000 139 142 145 0 0 0 CA SER A 14 1
CH2 1.524 0 111.12 0 60.04 1 141 139 137 0 0.150 141 143 0 0 0 0 CB SER A 14 1
OA 1.430 0 109.49 0 179.96 0 142 141 139 0 -0.548 142 144 0 0 0 0 OG SER A 14 1
H 0.960 0 109.46 0 180.03 0 143 142 141 0 0.398 143 0 0 0 0 0 HG SER A 14 1
C 1.523 0 111.07 0 119.99 0 141 139 142 0 0.380 141 146 147 0 0 0 C SER A 14 1
O 1.229 0 120.47 0 340.01 1 145 141 139 0 -0.380 145 0 0 0 0 0 O SER A 14 1
N 1.335 0 116.59 0 180.00 0 145 141 146 0 -0.280 145 148 149 0 0 0 N GLY A 15 1
H 1.010 0 119.06 0 0.00 0 147 145 141 0 0.280 147 0 0 0 0 0 H GLY A 15 1
CH2 1.449 0 121.86 0 180.01 0 147 145 148 0 0.000 147 150 0 0 0 0 CA GLY A 15 1
C 1.523 0 110.35 0 179.99 0 149 147 145 0 0.380 149 151 152 0 0 0 C GLY A 15 1
O 1.229 0 120.51 0 339.97 1 150 149 147 0 -0.380 150 0 0 0 0 0 O GLY A 15 1
N 1.335 0 116.56 0 180.00 0 150 149 151 0 -0.280 150 153 154 0 0 0 N ARG A 16 1
H 1.009 0 119.06 0 359.97 0 152 150 149 0 0.280 152 0 0 0 0 0 H ARG A 16 1
CH1 1.449 0 121.85 0 180.04 0 152 150 153 0 0.000 152 155 167 0 0 0 CA ARG A 16 1
CH2 1.525 0 111.13 0 60.00 1 154 152 150 0 0.000 154 156 0 0 0 0 CB ARG A 16 1
CH2 1.525 0 109.49 0 180.00 1 155 154 152 0 0.000 155 157 0 0 0 0 CG ARG A 16 1
CH2 1.525 0 109.49 0 180.00 1 156 155 154 0 0.090 156 158 0 0 0 0 CD ARG A 16 1
NE 1.480 0 111.03 0 180.00 1 157 156 155 0 -0.110 157 159 160 0 0 0 NE ARG A 16 1
C 1.330 0 123.06 0 180.04 0 158 157 156 0 0.340 158 161 164 0 0 0 CZ ARG A 16 1
H 1.011 0 118.47 0 179.94 0 158 157 159 0 0.240 158 0 0 0 0 0 HE ARG A 16 1
NZ 1.330 0 121.97 0 359.94 0 159 158 157 0 -0.260 159 162 163 0 0 0 NH1 ARG A 16 1
H 1.010 0 119.78 0 0.05 0 161 159 158 0 0.240 161 0 0 0 0 0 1HH1 ARG A 16 1
H 1.009 0 119.80 0 180.04 0 161 159 162 0 0.240 161 0 0 0 0 0 2HH1 ARG A 16 1
NZ 1.330 0 118.07 0 180.06 0 159 158 161 0 -0.260 159 165 166 0 0 0 NH2 ARG A 16 1
H 1.010 0 119.76 0 359.96 0 164 159 158 0 0.240 164 0 0 0 0 0 1HH2 ARG A 16 1
H 1.009 0 119.83 0 179.97 0 164 159 165 0 0.240 164 0 0 0 0 0 2HH2 ARG A 16 1
C 1.522 0 111.09 0 120.00 0 154 152 155 0 0.380 154 168 169 0 0 0 C ARG A 16 1
O 1.229 0 120.52 0 339.98 1 167 154 152 0 -0.380 167 0 0 0 0 0 O ARG A 16 1
N 1.337 0 117.01 0 179.98 0 167 154 168 0 0.000 167 170 173 0 0 0 N PRO A 17 1
CH1 1.453 0 120.99 0 179.98 0 169 167 154 0 0.000 169 171 174 0 0 0 CA PRO A 17 1
CH2 1.500 0 109.46 0 160.03 1 170 169 167 0 0.000 170 172 0 0 0 0 CB PRO A 17 1
CH2 1.510 0 109.51 0 0.00 0 171 170 169 0 0.000 171 173 0 0 0 0 CG PRO A 17 1
CH2 1.500 0 106.00 0 0.04 0 172 171 170 0 0.000 169 172 0 0 0 0 CD PRO A 17 1
C 1.522 0 111.12 0 119.99 0 170 169 171 0 0.380 170 175 176 0 0 0 C PRO A 17 1
O 1.229 0 120.48 0 340.05 1 174 170 169 0 -0.380 174 0 0 0 0 0 O PRO A 17 1
N 1.337 0 116.98 0 179.92 0 174 170 175 0 0.000 174 177 180 0 0 0 N PRO A 18 1
CH1 1.453 0 120.94 0 179.98 0 176 174 170 0 0.000 176 178 181 0 0 0 CA PRO A 18 1
CH2 1.500 0 109.43 0 160.07 1 177 176 174 0 0.000 177 179 0 0 0 0 CB PRO A 18 1
CH2 1.509 0 109.49 0 0.00 0 178 177 176 0 0.000 178 180 0 0 0 0 CG PRO A 18 1
CH2 1.499 0 106.05 0 0.03 0 179 178 177 0 0.000 176 179 0 0 0 0 CD PRO A 18 1
C 1.522 0 111.13 0 119.97 0 177 176 178 0 0.380 177 182 183 0 0 0 C PRO A 18 1
O 1.229 0 120.54 0 340.02 1 181 177 176 0 -0.380 181 0 0 0 0 0 O PRO A 18 1
N 1.337 0 117.00 0 180.05 0 181 177 182 0 0.000 181 184 187 0 0 0 N PRO A 19 1
CH1 1.453 0 120.99 0 180.04 0 183 181 177 0 0.000 183 185 188 0 0 0 CA PRO A 19 1
CH2 1.500 0 109.46 0 159.97 1 184 183 181 0 0.000 184 186 0 0 0 0 CB PRO A 19 1
CH2 1.509 0 109.51 0 359.95 0 185 184 183 0 0.000 185 187 0 0 0 0 CG PRO A 19 1
CH2 1.500 0 106.03 0 0.00 0 186 185 184 0 0.000 183 186 0 0 0 0 CD PRO A 19 1
C 1.522 0 111.08 0 119.95 0 184 183 185 0 0.380 184 189 190 0 0 0 C PRO A 19 1
O 1.230 0 120.51 0 340.02 1 188 184 183 0 -0.380 188 0 0 0 0 0 O PRO A 19 1
N 1.335 0 116.61 0 180.02 0 188 184 189 0 -0.280 188 191 192 0 0 0 N SER A 20 1
H 1.010 0 119.06 0 359.92 0 190 188 184 0 0.280 190 0 0 0 0 0 H SER A 20 1
CH1 1.449 0 121.94 0 180.13 0 190 188 191 0 0.000 190 193 196 0 0 0 CA SER A 20 1
CH2 1.525 0 111.11 0 59.92 1 192 190 188 0 0.150 192 194 0 0 0 0 CB SER A 20 1
OA 1.430 0 109.45 0 180.04 0 193 192 190 0 -0.548 193 195 0 0 0 0 OG SER A 20 1
H 0.960 0 109.49 0 180.04 0 194 193 192 0 0.398 194 0 0 0 0 0 HG SER A 20 1
C 1.521 0 111.12 0 120.04 0 192 190 193 0 0.270 192 197 198 0 0 0 C SER A 20 1
OM 1.229 0 120.53 0 340.00 1 196 192 190 0 -0.635 196 0 0 0 0 0 O SER A 20 1
OM 1.230 0 119.74 0 179.93 0 196 192 197 0 -0.635 196 0 0 0 0 0 OXT TER A 20 1
#### 0.000 0 0.00 0 0.00 0 0 0 0 0 0.000 0 0 0 0 0 0
Apêndice
148
Arquivo de entrada (*.IN) para otimização por GSA da
Villin Headpiece
MECANICA MOLECULAR
INTERNAL GSA HOOK FTHET FDHP FDHI GROMOS2 NBCVW FUNCDIE2 SAS
0.1000000000 Valor inicial do passo DELTA-X usado na minimizacao.
0.0100000000 Valor da precisao no calculo do potencial.
0.0000000000 Posicao da interface no eixo X.
80.0000000000 Valor de EPSLON1, correspondente ao meio aquoso.
0.0000000000 Valor de EPSLON2, correspondente ao meio apolar.
0.0000000000 Valor de XBOX, lado X da caixa para condicoes periodicas.
0.0000000000 Valor de YBOX, lado Y da caixa para condicoes periodicas.
0.0000000000 Valor de ZBOX, lado Z da caixa para condicoes periodicas.
0.0000000000 Valor de RCUT, raio de corte.
0.0000000000 Valor de RLIST, para lista de vizinhos.
NL 0.000 0 0.00 0 0.00 0 0 0 0 0 0.129 2 9 10 11 0 0 N MET A 1 1
CH1 1.449 0 0.00 0 0.00 0 1 0 0 0 0.127 1 3 7 0 0 0 CA MET A 1 1
CH2 1.525 0 111.09 0 0.00 0 2 1 0 0 0.000 2 4 0 0 0 0 CB MET A 1 1
CH2 1.525 0 109.43 0 180.00 1 3 2 1 0 0.000 3 5 0 0 0 0 CG MET A 1 1
S 1.811 0 109.98 0 179.99 1 4 3 2 0 0.000 4 6 0 0 0 0 SD MET A 1 1
CH3 1.780 0 100.01 0 180.01 1 5 4 3 0 0.000 5 0 0 0 0 0 CE MET A 1 1
C 1.522 0 111.13 0 120.01 0 2 1 3 0 0.380 2 8 12 0 0 0 C MET A 1 1
O 1.230 0 120.47 0 0.00 1 7 2 1 0 -0.380 7 0 0 0 0 0 O MET A 1 1
H 1.010 0 108.00 0 180.00 0 1 2 3 0 0.248 1 0 0 0 0 0 H1 MET A 1 1
H 1.010 0 108.00 0 240.00 0 1 2 9 0 0.248 1 0 0 0 0 0 H2 MET A 1 1
H 1.010 0 108.00 0 240.00 0 1 2 10 0 0.248 1 0 0 0 0 0 H3 MET A 1 1
N 1.335 0 116.64 0 180.02 0 7 2 8 0 -0.280 7 13 14 0 0 0 N LEU A 2 1
H 1.009 0 119.01 0 0.00 0 12 7 2 0 0.280 12 0 0 0 0 0 H LEU A 2 1
CH1 1.449 0 121.90 0 179.99 0 12 7 13 0 0.000 12 15 19 0 0 0 CA LEU A 2 1
CH2 1.525 0 111.12 0 60.01 1 14 12 7 0 0.000 14 16 0 0 0 0 CB LEU A 2 1
CH1 1.525 0 109.50 0 180.00 1 15 14 12 0 0.000 15 17 18 0 0 0 CG LEU A 2 1
CH3 1.524 0 109.49 0 59.97 1 16 15 14 0 0.000 16 0 0 0 0 0 CD1 LEU A 2 1
CH3 1.525 0 109.50 0 120.06 1 16 15 17 0 0.000 16 0 0 0 0 0 CD2 LEU A 2 1
C 1.522 0 111.09 0 119.98 0 14 12 15 0 0.380 14 20 21 0 0 0 C LEU A 2 1
O 1.229 0 120.48 0 0.00 1 19 14 12 0 -0.380 19 0 0 0 0 0 O LEU A 2 1
N 1.335 0 116.62 0 180.01 0 19 14 20 0 -0.280 19 22 23 0 0 0 N SER A 3 1
H 1.010 0 119.04 0 359.95 0 21 19 14 0 0.280 21 0 0 0 0 0 H SER A 3 1
CH1 1.449 0 121.91 0 180.06 0 21 19 22 0 0.000 21 24 27 0 0 0 CA SER A 3 1
CH2 1.525 0 111.09 0 59.99 1 23 21 19 0 0.150 23 25 0 0 0 0 CB SER A 3 1
OA 1.430 0 109.44 0 179.99 0 24 23 21 0 -0.548 24 26 0 0 0 0 OG SER A 3 1
H 0.961 0 109.48 0 180.00 0 25 24 23 0 0.398 25 0 0 0 0 0 HG SER A 3 1
C 1.522 0 111.07 0 119.99 0 23 21 24 0 0.380 23 28 29 0 0 0 C SER A 3 1
O 1.229 0 120.55 0 0.00 1 27 23 21 0 -0.380 27 0 0 0 0 0 O SER A 3 1
N 1.336 0 116.58 0 180.00 0 27 23 28 0 -0.280 27 30 31 0 0 0 N ASP A 4 1
H 1.010 0 119.00 0 359.94 0 29 27 23 0 0.280 29 0 0 0 0 0 H ASP A 4 1
CH1 1.449 0 121.90 0 180.11 0 29 27 30 0 0.000 29 32 36 0 0 0 CA ASP A 4 1
CH2 1.525 0 111.14 0 59.95 1 31 29 27 0 0.000 31 33 0 0 0 0 CB ASP A 4 1
C 1.527 0 109.48 0 180.03 1 32 31 29 0 0.270 32 34 35 0 0 0 CG ASP A 4 1
OM 1.259 0 117.19 0 90.01 0 33 32 31 0 -0.635 33 0 0 0 0 0 OD1 ASP A 4 1
OM 1.260 0 117.17 0 179.95 0 33 32 34 0 -0.635 33 0 0 0 0 0 OD2 ASP A 4 1
C 1.522 0 111.11 0 120.01 0 31 29 32 0 0.380 31 37 38 0 0 0 C ASP A 4 1
O 1.229 0 120.48 0 359.97 1 36 31 29 0 -0.380 36 0 0 0 0 0 O ASP A 4 1
N 1.334 0 116.61 0 179.97 0 36 31 37 0 -0.280 36 39 40 0 0 0 N GLU A 5 1
H 1.010 0 119.04 0 0.08 0 38 36 31 0 0.280 38 0 0 0 0 0 H GLU A 5 1
CH1 1.449 0 121.90 0 179.93 0 38 36 39 0 0.000 38 41 46 0 0 0 CA GLU A 5 1
CH2 1.525 0 111.14 0 60.04 1 40 38 36 0 0.000 40 42 0 0 0 0 CB GLU A 5 1
CH2 1.509 0 109.50 0 180.01 1 41 40 38 0 0.000 41 43 0 0 0 0 CG GLU A 5 1
C 1.527 0 109.46 0 180.01 0 42 41 40 0 0.270 42 44 45 0 0 0 CD GLU A 5 1
OM 1.260 0 117.23 0 90.03 0 43 42 41 0 -0.635 43 0 0 0 0 0 OE1 GLU A 5 1
OM 1.260 0 117.18 0 179.92 0 43 42 44 0 -0.635 43 0 0 0 0 0 OE2 GLU A 5 1
C 1.523 0 111.09 0 120.02 0 40 38 41 0 0.380 40 47 48 0 0 0 C GLU A 5 1
O 1.228 0 120.50 0 0.00 1 46 40 38 0 -0.380 46 0 0 0 0 0 O GLU A 5 1
N 1.335 0 116.57 0 180.02 0 46 40 47 0 -0.280 46 49 50 0 0 0 N ASP A 6 1
H 1.010 0 119.10 0 359.96 0 48 46 40 0 0.280 48 0 0 0 0 0 H ASP A 6 1
CH1 1.450 0 121.91 0 180.03 0 48 46 49 0 0.000 48 51 55 0 0 0 CA ASP A 6 1
CH2 1.525 0 111.10 0 59.98 1 50 48 46 0 0.000 50 52 0 0 0 0 CB ASP A 6 1
C 1.526 0 109.50 0 180.06 1 51 50 48 0 0.270 51 53 54 0 0 0 CG ASP A 6 1
OM 1.260 0 117.24 0 89.93 0 52 51 50 0 -0.635 52 0 0 0 0 0 OD1 ASP A 6 1
OM 1.260 0 117.20 0 180.11 0 52 51 53 0 -0.635 52 0 0 0 0 0 OD2 ASP A 6 1
C 1.521 0 111.11 0 120.04 0 50 48 51 0 0.380 50 56 57 0 0 0 C ASP A 6 1
O 1.229 0 120.51 0 359.96 1 55 50 48 0 -0.380 55 0 0 0 0 0 O ASP A 6 1
N 1.335 0 116.59 0 180.05 0 55 50 56 0 -0.280 55 58 59 0 0 0 N PHE A 7 1
H 1.010 0 119.03 0 0.00 0 57 55 50 0 0.280 57 0 0 0 0 0 H PHE A 7 1
CH1 1.449 0 121.91 0 179.97 0 57 55 58 0 0.000 57 60 67 0 0 0 CA PHE A 7 1
CH2 1.525 0 111.07 0 59.99 1 59 57 55 0 0.000 59 61 0 0 0 0 CB PHE A 7 1
C 1.511 0 114.97 0 180.00 0 60 59 57 0 0.000 60 62 66 0 0 0 CG PHE A 7 1
C 1.400 0 120.01 0 180.02 0 61 60 59 0 -0.100 61 63 69 0 0 0 CD1 PHE A 7 1
C 1.399 0 120.01 0 180.03 0 62 61 60 0 -0.100 62 64 71 0 0 0 CE1 PHE A 7 1
C 1.401 0 120.01 0 359.92 0 63 62 61 0 -0.100 63 65 73 0 0 0 CZ PHE A 7 1
C 1.400 0 119.98 0 0.08 0 64 63 62 0 -0.100 64 66 72 0 0 0 CE2 PHE A 7 1
C 1.400 0 119.97 0 179.99 0 61 60 62 0 -0.100 61 65 70 0 0 0 CD2 PHE A 7 1
C 1.522 0 111.09 0 120.03 0 59 57 60 0 0.380 59 68 74 0 0 0 C PHE A 7 1
O 1.229 0 120.52 0 359.94 1 67 59 57 0 -0.380 67 0 0 0 0 0 O PHE A 7 1
HC 1.090 0 119.94 0 179.97 0 62 61 63 0 0.100 62 0 0 0 0 0 HD1 PHE A 7 1
HC 1.089 0 120.04 0 359.95 0 66 61 60 0 0.100 66 0 0 0 0 0 HD2 PHE A 7 1
HC 1.090 0 120.05 0 180.07 0 63 62 64 0 0.100 63 0 0 0 0 0 HE1 PHE A 7 1
HC 1.090 0 120.00 0 179.95 0 65 64 63 0 0.100 65 0 0 0 0 0 HE2 PHE A 7 1
HC 1.089 0 120.01 0 179.93 0 64 63 65 0 0.100 64 0 0 0 0 0 HZ PHE A 7 1
N 1.335 0 116.61 0 180.06 0 67 59 68 0 -0.280 67 75 76 0 0 0 N LYS A 8 1
H 0.678 0 66.40 0 272.80 0 70 66 61 0 0.280 74 0 0 0 0 0 H LYS A 8 1
CH1 1.449 0 121.93 0 179.95 0 74 67 59 0 0.000 74 77 85 0 0 0 CA LYS A 8 1
CH2 1.526 0 111.07 0 60.00 1 76 74 67 0 0.000 76 78 0 0 0 0 CB LYS A 8 1
CH2 1.525 0 109.45 0 180.00 1 77 76 74 0 0.000 77 79 0 0 0 0 CG LYS A 8 1
CH2 1.525 0 109.46 0 180.05 1 78 77 76 0 0.000 78 80 0 0 0 0 CD LYS A 8 1
Apêndice
149
CH2 1.524 0 109.49 0 180.02 1 79 78 77 0 0.127 79 81 0 0 0 0 CE LYS A 8 1
NL 1.470 0 109.49 0 179.96 1 80 79 78 0 0.129 80 82 83 84 0 0 NZ LYS A 8 1
H 1.000 0 109.00 0 180.00 0 81 80 79 0 0.248 81 0 0 0 0 0 HZ1 LYS A 8 1
H 1.000 0 109.00 0 240.00 0 81 80 82 0 0.248 81 0 0 0 0 0 HZ2 LYS A 8 1
H 1.000 0 109.00 0 240.00 0 81 80 83 0 0.248 81 0 0 0 0 0 HZ3 LYS A 8 1
C 1.522 0 111.13 0 120.00 0 76 74 77 0 0.380 76 86 87 0 0 0 C LYS A 8 1
O 1.229 0 120.48 0 0.03 1 85 76 74 0 -0.380 85 0 0 0 0 0 O LYS A 8 1
N 1.335 0 116.59 0 180.04 0 85 76 86 0 -0.280 85 88 89 0 0 0 N ALA A 9 1
H 1.010 0 119.08 0 359.93 0 87 85 76 0 0.280 87 0 0 0 0 0 H ALA A 9 1
CH1 1.450 0 121.86 0 180.11 0 87 85 88 0 0.000 87 90 91 0 0 0 CA ALA A 9 1
CH3 1.525 0 111.09 0 59.95 1 89 87 85 0 0.000 89 0 0 0 0 0 CB ALA A 9 1
C 1.522 0 111.06 0 120.00 0 89 87 90 0 0.380 89 92 93 0 0 0 C ALA A 9 1
O 1.229 0 120.55 0 0.00 1 91 89 87 0 -0.380 91 0 0 0 0 0 O ALA A 9 1
N 1.335 0 116.59 0 179.98 0 91 89 92 0 -0.280 91 94 95 0 0 0 N VAL A 10 1
H 1.011 0 119.01 0 0.00 0 93 91 89 0 0.280 93 0 0 0 0 0 H VAL A 10 1
CH1 1.449 0 121.95 0 180.03 0 93 91 94 0 0.000 93 96 99 0 0 0 CA VAL A 10 1
CH1 1.526 0 111.09 0 59.96 1 95 93 91 0 0.000 95 97 98 0 0 0 CB VAL A 10 1
CH3 1.525 0 109.44 0 60.07 1 96 95 93 0 0.000 96 0 0 0 0 0 CG1 VAL A 10 1
CH3 1.525 0 109.45 0 119.97 1 96 95 97 0 0.000 96 0 0 0 0 0 CG2 VAL A 10 1
C 1.522 0 111.15 0 120.03 0 95 93 96 0 0.380 95 100 101 0 0 0 C VAL A 10 1
O 1.229 0 120.48 0 0.00 1 99 95 93 0 -0.380 99 0 0 0 0 0 O VAL A 10 1
N 1.335 0 116.57 0 179.99 0 99 95 100 0 -0.280 99 102 103 0 0 0 N PHE A 11 1
H 1.009 0 119.07 0 0.00 0 101 99 95 0 0.280 101 0 0 0 0 0 H PHE A 11 1
CH1 1.449 0 121.82 0 179.98 0 101 99 102 0 0.000 101 104 111 0 0 0 CA PHE A 11 1
CH2 1.525 0 111.16 0 60.03 1 103 101 99 0 0.000 103 105 0 0 0 0 CB PHE A 11 1
C 1.510 0 115.06 0 179.94 0 104 103 101 0 0.000 104 106 110 0 0 0 CG PHE A 11 1
C 1.399 0 120.02 0 179.94 0 105 104 103 0 -0.100 105 107 113 0 0 0 CD1 PHE A 11 1
C 1.401 0 120.00 0 180.02 0 106 105 104 0 -0.100 106 108 115 0 0 0 CE1 PHE A 11 1
C 1.399 0 119.97 0 0.04 0 107 106 105 0 -0.100 107 109 117 0 0 0 CZ PHE A 11 1
C 1.399 0 120.04 0 0.03 0 108 107 106 0 -0.100 108 110 116 0 0 0 CE2 PHE A 11 1
C 1.400 0 119.95 0 180.08 0 105 104 106 0 -0.100 105 109 114 0 0 0 CD2 PHE A 11 1
C 1.523 0 111.09 0 119.98 0 103 101 104 0 0.380 103 112 118 0 0 0 C PHE A 11 1
O 1.229 0 120.50 0 0.00 1 111 103 101 0 -0.380 111 0 0 0 0 0 O PHE A 11 1
HC 1.090 0 120.01 0 180.07 0 106 105 107 0 0.100 106 0 0 0 0 0 HD1 PHE A 11 1
HC 1.089 0 120.05 0 0.00 0 110 105 104 0 0.100 110 0 0 0 0 0 HD2 PHE A 11 1
HC 1.090 0 119.96 0 180.00 0 107 106 108 0 0.100 107 0 0 0 0 0 HE1 PHE A 11 1
HC 1.090 0 120.02 0 179.97 0 109 108 107 0 0.100 109 0 0 0 0 0 HE2 PHE A 11 1
HC 1.090 0 119.94 0 179.94 0 108 107 109 0 0.100 108 0 0 0 0 0 HZ PHE A 11 1
N 1.335 0 116.60 0 180.00 0 111 103 112 0 -0.280 111 119 120 0 0 0 N GLY A 12 1
H 0.678 0 66.33 0 272.76 0 114 110 105 0 0.280 118 0 0 0 0 0 H GLY A 12 1
CH2 1.450 0 121.88 0 180.03 0 118 111 103 0 0.000 118 121 0 0 0 0 CA GLY A 12 1
C 1.522 0 110.37 0 180.00 0 120 118 111 0 0.380 120 122 123 0 0 0 C GLY A 12 1
O 1.228 0 120.53 0 0.00 1 121 120 118 0 -0.380 121 0 0 0 0 0 O GLY A 12 1
N 1.336 0 116.57 0 179.94 0 121 120 122 0 -0.280 121 124 125 0 0 0 N MET A 13 1
H 1.010 0 119.06 0 0.03 0 123 121 120 0 0.280 123 0 0 0 0 0 H MET A 13 1
CH1 1.449 0 121.88 0 179.95 0 123 121 124 0 0.000 123 126 130 0 0 0 CA MET A 13 1
CH2 1.525 0 111.08 0 60.05 1 125 123 121 0 0.000 125 127 0 0 0 0 CB MET A 13 1
CH2 1.526 0 109.46 0 180.00 1 126 125 123 0 0.000 126 128 0 0 0 0 CG MET A 13 1
S 1.810 0 110.00 0 180.00 1 127 126 125 0 0.000 127 129 0 0 0 0 SD MET A 13 1
CH3 1.780 0 99.98 0 180.00 1 128 127 126 0 0.000 128 0 0 0 0 0 CE MET A 13 1
C 1.522 0 111.11 0 119.99 0 125 123 126 0 0.380 125 131 132 0 0 0 C MET A 13 1
O 1.229 0 120.46 0 0.04 1 130 125 123 0 -0.380 130 0 0 0 0 0 O MET A 13 1
N 1.335 0 116.58 0 179.94 0 130 125 131 0 -0.280 130 133 134 0 0 0 N THR A 14 1
H 1.009 0 119.08 0 0.00 0 132 130 125 0 0.280 132 0 0 0 0 0 H THR A 14 1
CH1 1.449 0 121.84 0 180.00 0 132 130 133 0 0.000 132 135 139 0 0 0 CA THR A 14 1
CH1 1.525 0 111.14 0 60.03 1 134 132 130 0 0.150 134 136 138 0 0 0 CB THR A 14 1
OA 1.430 0 109.49 0 59.94 0 135 134 132 0 -0.548 135 137 0 0 0 0 OG1 THR A 14 1
H 0.960 0 109.51 0 180.00 0 136 135 134 0 0.398 136 0 0 0 0 0 HG1 THR A 14 1
CH3 1.526 0 109.45 0 240.06 1 135 134 136 0 0.000 135 0 0 0 0 0 CG2 THR A 14 1
C 1.522 0 111.09 0 119.99 0 134 132 135 0 0.380 134 140 141 0 0 0 C THR A 14 1
O 1.228 0 120.49 0 0.00 1 139 134 132 0 -0.380 139 0 0 0 0 0 O THR A 14 1
N 1.335 0 116.62 0 179.94 0 139 134 140 0 -0.280 139 142 143 0 0 0 N ARG A 15 1
H 1.010 0 119.02 0 0.07 0 141 139 134 0 0.280 141 0 0 0 0 0 H ARG A 15 1
CH1 1.449 0 121.89 0 179.92 0 141 139 142 0 0.000 141 144 156 0 0 0 CA ARG A 15 1
CH2 1.524 0 111.13 0 60.06 1 143 141 139 0 0.000 143 145 0 0 0 0 CB ARG A 15 1
CH2 1.525 0 109.51 0 179.98 1 144 143 141 0 0.000 144 146 0 0 0 0 CG ARG A 15 1
CH2 1.525 0 109.51 0 179.97 1 145 144 143 0 0.090 145 147 0 0 0 0 CD ARG A 15 1
NE 1.480 0 111.04 0 180.02 1 146 145 144 0 -0.110 146 148 149 0 0 0 NE ARG A 15 1
C 1.330 0 123.01 0 180.01 0 147 146 145 0 0.340 147 150 153 0 0 0 CZ ARG A 15 1
H 1.010 0 118.46 0 180.01 0 147 146 148 0 0.240 147 0 0 0 0 0 HE ARG A 15 1
NZ 1.330 0 121.99 0 0.03 0 148 147 146 0 -0.260 148 151 152 0 0 0 NH1 ARG A 15 1
H 1.009 0 119.84 0 359.94 0 150 148 147 0 0.240 150 0 0 0 0 0 1HH1 ARG A 15 1
H 1.011 0 119.78 0 180.00 0 150 148 151 0 0.240 150 0 0 0 0 0 2HH1 ARG A 15 1
NZ 1.330 0 118.00 0 179.93 0 148 147 150 0 -0.260 148 154 155 0 0 0 NH2 ARG A 15 1
H 1.010 0 119.80 0 0.06 0 153 148 147 0 0.240 153 0 0 0 0 0 1HH2 ARG A 15 1
H 1.010 0 119.79 0 179.91 0 153 148 154 0 0.240 153 0 0 0 0 0 2HH2 ARG A 15 1
C 1.522 0 111.07 0 120.00 0 143 141 144 0 0.380 143 157 158 0 0 0 C ARG A 15 1
O 1.228 0 120.52 0 0.00 1 156 143 141 0 -0.380 156 0 0 0 0 0 O ARG A 15 1
N 1.335 0 116.59 0 179.99 0 156 143 157 0 -0.280 156 159 160 0 0 0 N SER A 16 1
H 1.010 0 119.07 0 0.00 0 158 156 143 0 0.280 158 0 0 0 0 0 H SER A 16 1
CH1 1.449 0 121.92 0 179.95 0 158 156 159 0 0.000 158 161 164 0 0 0 CA SER A 16 1
CH2 1.526 0 111.09 0 60.02 1 160 158 156 0 0.150 160 162 0 0 0 0 CB SER A 16 1
OA 1.430 0 109.45 0 180.01 0 161 160 158 0 -0.548 161 163 0 0 0 0 OG SER A 16 1
H 0.961 0 109.43 0 180.01 0 162 161 160 0 0.398 162 0 0 0 0 0 HG SER A 16 1
C 1.522 0 111.13 0 120.01 0 160 158 161 0 0.380 160 165 166 0 0 0 C SER A 16 1
O 1.230 0 120.48 0 0.00 1 164 160 158 0 -0.380 164 0 0 0 0 0 O SER A 16 1
N 1.335 0 116.60 0 180.05 0 164 160 165 0 -0.280 164 167 168 0 0 0 N ALA A 17 1
H 1.010 0 119.05 0 359.92 0 166 164 160 0 0.280 166 0 0 0 0 0 H ALA A 17 1
CH1 1.449 0 121.88 0 180.08 0 166 164 167 0 0.000 166 169 170 0 0 0 CA ALA A 17 1
CH3 1.526 0 111.10 0 59.98 1 168 166 164 0 0.000 168 0 0 0 0 0 CB ALA A 17 1
C 1.522 0 111.11 0 119.99 0 168 166 169 0 0.380 168 171 172 0 0 0 C ALA A 17 1
O 1.229 0 120.47 0 359.97 1 170 168 166 0 -0.380 170 0 0 0 0 0 O ALA A 17 1
N 1.335 0 116.63 0 180.06 0 170 168 171 0 -0.280 170 173 174 0 0 0 N PHE A 18 1
H 1.010 0 118.99 0 359.97 0 172 170 168 0 0.280 172 0 0 0 0 0 H PHE A 18 1
CH1 1.449 0 121.92 0 180.02 0 172 170 173 0 0.000 172 175 182 0 0 0 CA PHE A 18 1
CH2 1.525 0 111.06 0 59.98 1 174 172 170 0 0.000 174 176 0 0 0 0 CB PHE A 18 1
C 1.510 0 114.97 0 179.98 0 175 174 172 0 0.000 175 177 181 0 0 0 CG PHE A 18 1
C 1.401 0 119.98 0 179.97 0 176 175 174 0 -0.100 176 178 184 0 0 0 CD1 PHE A 18 1
C 1.400 0 119.98 0 179.99 0 177 176 175 0 -0.100 177 179 186 0 0 0 CE1 PHE A 18 1
Apêndice
150
C 1.400 0 120.01 0 0.06 0 178 177 176 0 -0.100 178 180 188 0 0 0 CZ PHE A 18 1
C 1.400 0 119.99 0 359.96 0 179 178 177 0 -0.100 179 181 187 0 0 0 CE2 PHE A 18 1
C 1.400 0 120.02 0 180.08 0 176 175 177 0 -0.100 176 180 185 0 0 0 CD2 PHE A 18 1
C 1.521 0 111.10 0 119.99 0 174 172 175 0 0.380 174 183 189 0 0 0 C PHE A 18 1
O 1.229 0 120.54 0 0.00 1 182 174 172 0 -0.380 182 0 0 0 0 0 O PHE A 18 1
HC 1.089 0 120.02 0 180.08 0 177 176 178 0 0.100 177 0 0 0 0 0 HD1 PHE A 18 1
HC 1.090 0 120.00 0 359.92 0 181 176 175 0 0.100 181 0 0 0 0 0 HD2 PHE A 18 1
HC 1.090 0 119.98 0 179.94 0 178 177 179 0 0.100 178 0 0 0 0 0 HE1 PHE A 18 1
HC 1.090 0 120.03 0 179.96 0 180 179 178 0 0.100 180 0 0 0 0 0 HE2 PHE A 18 1
HC 1.089 0 120.00 0 179.99 0 179 178 180 0 0.100 179 0 0 0 0 0 HZ PHE A 18 1
N 1.335 0 116.61 0 180.01 0 182 174 183 0 -0.280 182 190 191 0 0 0 N ALA A 19 1
H 0.678 0 66.38 0 272.76 0 185 181 176 0 0.280 189 0 0 0 0 0 H ALA A 19 1
CH1 1.449 0 121.95 0 180.01 0 189 182 174 0 0.000 189 192 193 0 0 0 CA ALA A 19 1
CH3 1.526 0 111.08 0 59.99 1 191 189 182 0 0.000 191 0 0 0 0 0 CB ALA A 19 1
C 1.521 0 111.15 0 120.00 0 191 189 192 0 0.380 191 194 195 0 0 0 C ALA A 19 1
O 1.230 0 120.49 0 0.00 1 193 191 189 0 -0.380 193 0 0 0 0 0 O ALA A 19 1
N 1.335 0 116.63 0 180.03 0 193 191 194 0 -0.280 193 196 197 0 0 0 N ASN A 20 1
H 1.009 0 119.04 0 359.97 0 195 193 191 0 0.280 195 0 0 0 0 0 H ASN A 20 1
CH1 1.449 0 121.89 0 180.05 0 195 193 196 0 0.000 195 198 204 0 0 0 CA ASN A 20 1
CH2 1.525 0 111.14 0 59.99 1 197 195 193 0 0.000 197 199 0 0 0 0 CB ASN A 20 1
C 1.521 0 111.12 0 179.98 1 198 197 195 0 0.380 198 200 201 0 0 0 CG ASN A 20 1
O 1.228 0 120.52 0 0.00 0 199 198 197 0 -0.380 199 0 0 0 0 0 OD1 ASN A 20 1
NT 1.336 0 116.59 0 180.02 0 199 198 200 0 -0.830 199 202 203 0 0 0 ND2 ASN A 20 1
H 1.009 0 119.79 0 0.00 0 201 199 198 0 0.415 201 0 0 0 0 0 1HD2 ASN A 20 1
H 1.010 0 119.80 0 180.05 0 201 199 202 0 0.415 201 0 0 0 0 0 2HD2 ASN A 20 1
C 1.522 0 111.09 0 119.99 0 197 195 198 0 0.380 197 205 206 0 0 0 C ASN A 20 1
O 1.230 0 120.48 0 359.97 1 204 197 195 0 -0.380 204 0 0 0 0 0 O ASN A 20 1
N 1.335 0 116.64 0 180.03 0 204 197 205 0 -0.280 204 207 208 0 0 0 N LEU A 21 1
H 0.983 0 120.40 0 312.96 0 200 199 198 0 0.280 206 0 0 0 0 0 H LEU A 21 1
CH1 1.449 0 121.91 0 179.99 0 206 204 197 0 0.000 206 209 213 0 0 0 CA LEU A 21 1
CH2 1.525 0 111.08 0 60.00 1 208 206 204 0 0.000 208 210 0 0 0 0 CB LEU A 21 1
CH1 1.525 0 109.44 0 180.00 1 209 208 206 0 0.000 209 211 212 0 0 0 CG LEU A 21 1
CH3 1.525 0 109.50 0 60.01 1 210 209 208 0 0.000 210 0 0 0 0 0 CD1 LEU A 21 1
CH3 1.525 0 109.48 0 120.02 1 210 209 211 0 0.000 210 0 0 0 0 0 CD2 LEU A 21 1
C 1.522 0 111.07 0 120.01 0 208 206 209 0 0.380 208 214 215 0 0 0 C LEU A 21 1
O 1.228 0 120.52 0 0.00 1 213 208 206 0 -0.380 213 0 0 0 0 0 O LEU A 21 1
N 1.337 0 116.97 0 180.05 0 213 208 214 0 0.000 213 216 219 0 0 0 N PRO A 22 1
CH1 1.453 0 120.96 0 180.00 0 215 213 208 0 0.000 215 217 220 0 0 0 CA PRO A 22 1
CH2 1.500 0 109.47 0 159.96 1 216 215 213 0 0.000 216 218 0 0 0 0 CB PRO A 22 1
CH2 1.510 0 109.49 0 0.00 0 217 216 215 0 0.000 217 219 0 0 0 0 CG PRO A 22 1
CH2 1.500 0 106.01 0 359.96 0 218 217 216 0 0.000 215 218 0 0 0 0 CD PRO A 22 1
C 1.522 0 111.11 0 119.99 0 216 215 217 0 0.380 216 221 222 0 0 0 C PRO A 22 1
O 1.229 0 120.51 0 0.00 1 220 216 215 0 -0.380 220 0 0 0 0 0 O PRO A 22 1
N 1.335 0 116.62 0 180.04 0 220 216 221 0 -0.280 220 223 224 0 0 0 N LEU A 23 1
H 1.010 0 119.08 0 0.00 0 222 220 216 0 0.280 222 0 0 0 0 0 H LEU A 23 1
CH1 1.449 0 121.91 0 179.95 0 222 220 223 0 0.000 222 225 229 0 0 0 CA LEU A 23 1
CH2 1.526 0 111.10 0 60.02 1 224 222 220 0 0.000 224 226 0 0 0 0 CB LEU A 23 1
CH1 1.525 0 109.48 0 179.99 1 225 224 222 0 0.000 225 227 228 0 0 0 CG LEU A 23 1
CH3 1.525 0 109.47 0 59.98 1 226 225 224 0 0.000 226 0 0 0 0 0 CD1 LEU A 23 1
CH3 1.525 0 109.43 0 120.00 1 226 225 227 0 0.000 226 0 0 0 0 0 CD2 LEU A 23 1
C 1.522 0 111.12 0 119.95 0 224 222 225 0 0.380 224 230 231 0 0 0 C LEU A 23 1
O 1.230 0 120.48 0 0.08 1 229 224 222 0 -0.380 229 0 0 0 0 0 O LEU A 23 1
N 1.335 0 116.63 0 179.93 0 229 224 230 0 -0.280 229 232 233 0 0 0 N TRP A 24 1
H 1.010 0 119.00 0 0.02 0 231 229 224 0 0.280 231 0 0 0 0 0 H TRP A 24 1
CH1 1.449 0 121.92 0 180.04 0 231 229 232 0 0.000 231 234 245 0 0 0 CA TRP A 24 1
CH2 1.524 0 111.12 0 59.96 1 233 231 229 0 0.000 233 235 0 0 0 0 CB TRP A 24 1
C 1.510 0 115.00 0 179.98 0 234 233 231 0 -0.140 234 236 240 0 0 0 CG TRP A 24 1
C 1.340 0 127.00 0 180.02 0 235 234 233 0 -0.100 235 237 247 0 0 0 CD1 TRP A 24 1
NR 1.430 0 106.99 0 180.04 0 236 235 234 0 -0.050 236 238 239 0 0 0 NE1 TRP A 24 1
H 1.010 0 125.44 0 179.99 0 237 236 235 0 0.190 237 0 0 0 0 0 HE1 TRP A 24 1
C 1.310 0 108.99 0 179.99 0 237 236 238 0 0.000 237 240 244 0 0 0 CE2 TRP A 24 1
C 1.330 0 107.71 0 0.06 0 239 237 236 0 0.000 235 239 241 0 0 0 CD2 TRP A 24 1
C 1.399 0 119.70 0 180.02 0 240 239 237 0 -0.100 240 242 248 0 0 0 CE3 TRP A 24 1
C 1.411 0 117.02 0 359.92 0 241 240 239 0 -0.100 241 243 250 0 0 0 CZ3 TRP A 24 1
C 1.350 0 121.95 0 0.00 0 242 241 240 0 -0.100 242 244 251 0 0 0 CH2 TRP A 24 1
C 1.390 0 121.01 0 0.04 0 243 242 241 0 -0.100 239 243 249 0 0 0 CZ2 TRP A 24 1
C 1.523 0 111.10 0 120.06 0 233 231 234 0 0.380 233 246 252 0 0 0 C TRP A 24 1
O 1.229 0 120.45 0 359.96 1 245 233 231 0 -0.380 245 0 0 0 0 0 O TRP A 24 1
HC 1.090 0 126.52 0 179.96 0 236 235 237 0 0.100 236 0 0 0 0 0 HD1 TRP A 24 1
HC 1.090 0 121.56 0 180.06 0 241 240 242 0 0.100 241 0 0 0 0 0 HE3 TRP A 24 1
HC 1.090 0 121.98 0 180.01 0 244 243 242 0 0.100 244 0 0 0 0 0 HZ2 TRP A 24 1
HC 1.090 0 119.02 0 179.96 0 242 241 243 0 0.100 242 0 0 0 0 0 HZ3 TRP A 24 1
HC 1.090 0 119.49 0 179.93 0 243 242 244 0 0.100 243 0 0 0 0 0 HH2 TRP A 24 1
N 1.335 0 116.61 0 180.03 0 245 233 246 0 -0.280 245 253 254 0 0 0 N LYS A 25 1
H 0.885 0 56.22 0 302.42 0 241 240 248 0 0.280 252 0 0 0 0 0 H LYS A 25 1
CH1 1.448 0 121.91 0 180.00 0 252 245 233 0 0.000 252 255 263 0 0 0 CA LYS A 25 1
CH2 1.525 0 111.11 0 60.00 1 254 252 245 0 0.000 254 256 0 0 0 0 CB LYS A 25 1
CH2 1.525 0 109.45 0 180.01 1 255 254 252 0 0.000 255 257 0 0 0 0 CG LYS A 25 1
CH2 1.526 0 109.46 0 179.96 1 256 255 254 0 0.000 256 258 0 0 0 0 CD LYS A 25 1
CH2 1.525 0 109.46 0 180.00 1 257 256 255 0 0.127 257 259 0 0 0 0 CE LYS A 25 1
NL 1.470 0 109.45 0 180.01 1 258 257 256 0 0.129 258 260 261 262 0 0 NZ LYS A 25 1
H 1.000 0 109.00 0 180.00 0 259 258 257 0 0.248 259 0 0 0 0 0 HZ1 LYS A 25 1
H 1.000 0 109.00 0 240.00 0 259 258 260 0 0.248 259 0 0 0 0 0 HZ2 LYS A 25 1
H 1.000 0 109.00 0 240.00 0 259 258 261 0 0.248 259 0 0 0 0 0 HZ3 LYS A 25 1
C 1.522 0 111.13 0 120.00 0 254 252 255 0 0.380 254 264 265 0 0 0 C LYS A 25 1
O 1.230 0 120.46 0 359.96 1 263 254 252 0 -0.380 263 0 0 0 0 0 O LYS A 25 1
N 1.335 0 116.65 0 180.02 0 263 254 264 0 -0.280 263 266 267 0 0 0 N GLN A 26 1
H 1.010 0 119.00 0 0.00 0 265 263 254 0 0.280 265 0 0 0 0 0 H GLN A 26 1
CH1 1.449 0 121.91 0 179.99 0 265 263 266 0 0.000 265 268 275 0 0 0 CA GLN A 26 1
CH2 1.525 0 111.09 0 60.02 1 267 265 263 0 0.000 267 269 0 0 0 0 CB GLN A 26 1
CH2 1.525 0 109.46 0 179.98 1 268 267 265 0 0.000 268 270 0 0 0 0 CG GLN A 26 1
C 1.522 0 111.10 0 179.97 0 269 268 267 0 0.380 269 271 272 0 0 0 CD GLN A 26 1
O 1.229 0 120.50 0 0.06 0 270 269 268 0 -0.380 270 0 0 0 0 0 OE1 GLN A 26 1
NT 1.335 0 116.61 0 179.92 0 270 269 271 0 -0.830 270 273 274 0 0 0 NE2 GLN A 26 1
H 1.011 0 119.79 0 0.04 0 272 270 269 0 0.415 272 0 0 0 0 0 1HE2 GLN A 26 1
H 1.009 0 119.83 0 179.97 0 272 270 273 0 0.415 272 0 0 0 0 0 2HE2 GLN A 26 1
C 1.523 0 111.09 0 120.00 0 267 265 268 0 0.380 267 276 277 0 0 0 C GLN A 26 1
O 1.229 0 120.47 0 359.95 1 275 267 265 0 -0.380 275 0 0 0 0 0 O GLN A 26 1
N 1.335 0 116.61 0 180.08 0 275 267 276 0 -0.280 275 278 279 0 0 0 N GLN A 27 1
Apêndice
151
H 1.010 0 119.01 0 359.95 0 277 275 267 0 0.280 277 0 0 0 0 0 H GLN A 27 1
CH1 1.448 0 121.91 0 180.05 0 277 275 278 0 0.000 277 280 287 0 0 0 CA GLN A 27 1
CH2 1.524 0 111.11 0 59.94 1 279 277 275 0 0.000 279 281 0 0 0 0 CB GLN A 27 1
CH2 1.525 0 109.49 0 179.99 1 280 279 277 0 0.000 280 282 0 0 0 0 CG GLN A 27 1
C 1.522 0 111.14 0 180.01 0 281 280 279 0 0.380 281 283 284 0 0 0 CD GLN A 27 1
O 1.229 0 120.47 0 0.05 0 282 281 280 0 -0.380 282 0 0 0 0 0 OE1 GLN A 27 1
NT 1.335 0 116.63 0 179.92 0 282 281 283 0 -0.830 282 285 286 0 0 0 NE2 GLN A 27 1
H 1.010 0 119.77 0 0.10 0 284 282 281 0 0.415 284 0 0 0 0 0 1HE2 GLN A 27 1
H 1.010 0 119.78 0 179.87 0 284 282 285 0 0.415 284 0 0 0 0 0 2HE2 GLN A 27 1
C 1.522 0 111.09 0 120.07 0 279 277 280 0 0.380 279 288 289 0 0 0 C GLN A 27 1
O 1.229 0 120.53 0 359.97 1 287 279 277 0 -0.380 287 0 0 0 0 0 O GLN A 27 1
N 1.335 0 116.58 0 180.02 0 287 279 288 0 -0.280 287 290 291 0 0 0 N ASN A 28 1
H 1.010 0 119.08 0 359.96 0 289 287 279 0 0.280 289 0 0 0 0 0 H ASN A 28 1
CH1 1.450 0 121.89 0 180.00 0 289 287 290 0 0.000 289 292 298 0 0 0 CA ASN A 28 1
CH2 1.525 0 111.08 0 60.01 1 291 289 287 0 0.000 291 293 0 0 0 0 CB ASN A 28 1
C 1.522 0 111.09 0 180.00 0 292 291 289 0 0.380 292 294 295 0 0 0 CG ASN A 28 1
O 1.228 0 120.49 0 359.94 0 293 292 291 0 -0.380 293 0 0 0 0 0 OD1 ASN A 28 1
NT 1.335 0 116.57 0 180.08 0 293 292 294 0 -0.830 293 296 297 0 0 0 ND2 ASN A 28 1
H 1.010 0 119.80 0 359.97 0 295 293 292 0 0.415 295 0 0 0 0 0 1HD2 ASN A 28 1
H 1.009 0 119.75 0 180.01 0 295 293 296 0 0.415 295 0 0 0 0 0 2HD2 ASN A 28 1
C 1.522 0 111.07 0 119.95 0 291 289 292 0 0.380 291 299 300 0 0 0 C ASN A 28 1
O 1.229 0 120.54 0 0.08 1 298 291 289 0 -0.380 298 0 0 0 0 0 O ASN A 28 1
N 1.335 0 116.57 0 179.90 0 298 291 299 0 -0.280 298 301 302 0 0 0 N LEU A 29 1
H 0.983 0 120.47 0 313.01 0 294 293 292 0 0.280 300 0 0 0 0 0 H LEU A 29 1
CH1 1.450 0 121.91 0 180.03 0 300 298 291 0 0.000 300 303 307 0 0 0 CA LEU A 29 1
CH2 1.525 0 111.07 0 60.02 1 302 300 298 0 0.000 302 304 0 0 0 0 CB LEU A 29 1
CH1 1.525 0 109.43 0 180.02 1 303 302 300 0 0.000 303 305 306 0 0 0 CG LEU A 29 1
CH3 1.525 0 109.50 0 60.03 1 304 303 302 0 0.000 304 0 0 0 0 0 CD1 LEU A 29 1
CH3 1.525 0 109.45 0 120.01 1 304 303 305 0 0.000 304 0 0 0 0 0 CD2 LEU A 29 1
C 1.521 0 111.09 0 120.01 0 302 300 303 0 0.380 302 308 309 0 0 0 C LEU A 29 1
O 1.229 0 120.54 0 0.03 1 307 302 300 0 -0.380 307 0 0 0 0 0 O LEU A 29 1
N 1.335 0 116.57 0 179.98 0 307 302 308 0 -0.280 307 310 311 0 0 0 N LYS A 30 1
H 1.010 0 119.08 0 0.00 0 309 307 302 0 0.280 309 0 0 0 0 0 H LYS A 30 1
CH1 1.449 0 121.90 0 180.05 0 309 307 310 0 0.000 309 312 320 0 0 0 CA LYS A 30 1
CH2 1.525 0 111.15 0 59.97 1 311 309 307 0 0.000 311 313 0 0 0 0 CB LYS A 30 1
CH2 1.524 0 109.48 0 180.05 1 312 311 309 0 0.000 312 314 0 0 0 0 CG LYS A 30 1
CH2 1.525 0 109.44 0 180.00 1 313 312 311 0 0.000 313 315 0 0 0 0 CD LYS A 30 1
CH2 1.525 0 109.46 0 179.97 1 314 313 312 0 0.127 314 316 0 0 0 0 CE LYS A 30 1
NL 1.470 0 109.48 0 179.98 1 315 314 313 0 0.129 315 317 318 319 0 0 NZ LYS A 30 1
H 1.000 0 109.00 0 180.00 0 316 315 314 0 0.248 316 0 0 0 0 0 HZ1 LYS A 30 1
H 1.000 0 109.00 0 240.00 0 316 315 317 0 0.248 316 0 0 0 0 0 HZ2 LYS A 30 1
H 1.000 0 109.00 0 240.00 0 316 315 318 0 0.248 316 0 0 0 0 0 HZ3 LYS A 30 1
C 1.522 0 111.12 0 120.02 0 311 309 312 0 0.380 311 321 322 0 0 0 C LYS A 30 1
O 1.229 0 120.50 0 0.00 1 320 311 309 0 -0.380 320 0 0 0 0 0 O LYS A 30 1
N 1.335 0 116.62 0 179.99 0 320 311 321 0 -0.280 320 323 324 0 0 0 N LYS A 31 1
H 1.011 0 119.06 0 359.96 0 322 320 311 0 0.280 322 0 0 0 0 0 H LYS A 31 1
CH1 1.449 0 121.89 0 180.07 0 322 320 323 0 0.000 322 325 333 0 0 0 CA LYS A 31 1
CH2 1.525 0 111.13 0 59.99 1 324 322 320 0 0.000 324 326 0 0 0 0 CB LYS A 31 1
CH2 1.525 0 109.45 0 180.00 1 325 324 322 0 0.000 325 327 0 0 0 0 CG LYS A 31 1
CH2 1.525 0 109.43 0 179.97 1 326 325 324 0 0.000 326 328 0 0 0 0 CD LYS A 31 1
CH2 1.525 0 109.43 0 180.00 1 327 326 325 0 0.127 327 329 0 0 0 0 CE LYS A 31 1
NL 1.470 0 109.45 0 180.00 1 328 327 326 0 0.129 328 330 331 332 0 0 NZ LYS A 31 1
H 1.000 0 109.00 0 180.00 0 329 328 327 0 0.248 329 0 0 0 0 0 HZ1 LYS A 31 1
H 1.000 0 109.00 0 240.00 0 329 328 330 0 0.248 329 0 0 0 0 0 HZ2 LYS A 31 1
H 1.000 0 109.00 0 240.00 0 329 328 331 0 0.248 329 0 0 0 0 0 HZ3 LYS A 31 1
C 1.523 0 111.08 0 120.01 0 324 322 325 0 0.380 324 334 335 0 0 0 C LYS A 31 1
O 1.229 0 120.51 0 359.91 1 333 324 322 0 -0.380 333 0 0 0 0 0 O LYS A 31 1
N 1.335 0 116.59 0 180.07 0 333 324 334 0 -0.280 333 336 337 0 0 0 N GLU A 32 1
H 1.010 0 119.03 0 359.96 0 335 333 324 0 0.280 335 0 0 0 0 0 H GLU A 32 1
CH1 1.449 0 121.88 0 180.01 0 335 333 336 0 0.000 335 338 343 0 0 0 CA GLU A 32 1
CH2 1.525 0 111.09 0 60.01 1 337 335 333 0 0.000 337 339 0 0 0 0 CB GLU A 32 1
CH2 1.510 0 109.48 0 179.99 1 338 337 335 0 0.000 338 340 0 0 0 0 CG GLU A 32 1
C 1.527 0 109.51 0 180.00 0 339 338 337 0 0.270 339 341 342 0 0 0 CD GLU A 32 1
OM 1.260 0 117.21 0 89.98 0 340 339 338 0 -0.635 340 0 0 0 0 0 OE1 GLU A 32 1
OM 1.260 0 117.18 0 180.05 0 340 339 341 0 -0.635 340 0 0 0 0 0 OE2 GLU A 32 1
C 1.522 0 111.10 0 119.99 0 337 335 338 0 0.380 337 344 345 0 0 0 C GLU A 32 1
O 1.229 0 120.51 0 0.00 1 343 337 335 0 -0.380 343 0 0 0 0 0 O GLU A 32 1
N 1.335 0 116.62 0 180.04 0 343 337 344 0 -0.280 343 346 347 0 0 0 N LYS A 33 1
H 1.010 0 119.01 0 359.96 0 345 343 337 0 0.280 345 0 0 0 0 0 H LYS A 33 1
CH1 1.449 0 121.89 0 180.06 0 345 343 346 0 0.000 345 348 356 0 0 0 CA LYS A 33 1
CH2 1.524 0 111.16 0 59.97 1 347 345 343 0 0.000 347 349 0 0 0 0 CB LYS A 33 1
CH2 1.525 0 109.51 0 179.98 1 348 347 345 0 0.000 348 350 0 0 0 0 CG LYS A 33 1
CH2 1.525 0 109.46 0 179.99 1 349 348 347 0 0.000 349 351 0 0 0 0 CD LYS A 33 1
CH2 1.525 0 109.43 0 180.02 1 350 349 348 0 0.127 350 352 0 0 0 0 CE LYS A 33 1
NL 1.470 0 109.45 0 180.00 1 351 350 349 0 0.129 351 353 354 355 0 0 NZ LYS A 33 1
H 1.000 0 109.00 0 180.00 0 352 351 350 0 0.248 352 0 0 0 0 0 HZ1 LYS A 33 1
H 1.000 0 109.00 0 240.00 0 352 351 353 0 0.248 352 0 0 0 0 0 HZ2 LYS A 33 1
H 1.000 0 109.00 0 240.00 0 352 351 354 0 0.248 352 0 0 0 0 0 HZ3 LYS A 33 1
C 1.523 0 111.08 0 120.04 0 347 345 348 0 0.380 347 357 358 0 0 0 C LYS A 33 1
O 1.229 0 120.52 0 359.96 1 356 347 345 0 -0.380 356 0 0 0 0 0 O LYS A 33 1
N 1.335 0 116.61 0 180.00 0 356 347 357 0 -0.280 356 359 360 0 0 0 N GLY A 34 1
H 1.011 0 119.03 0 0.00 0 358 356 347 0 0.280 358 0 0 0 0 0 H GLY A 34 1
CH2 1.449 0 121.95 0 179.95 0 358 356 359 0 0.000 358 361 0 0 0 0 CA GLY A 34 1
C 1.521 0 110.41 0 180.00 0 360 358 356 0 0.380 360 362 363 0 0 0 C GLY A 34 1
O 1.229 0 120.53 0 0.05 1 361 360 358 0 -0.380 361 0 0 0 0 0 O GLY A 34 1
N 1.335 0 116.57 0 179.97 0 361 360 362 0 -0.280 361 364 365 0 0 0 N LEU A 35 1
H 1.010 0 119.11 0 0.00 0 363 361 360 0 0.280 363 0 0 0 0 0 H LEU A 35 1
CH1 1.450 0 121.90 0 180.00 0 363 361 364 0 0.000 363 366 370 0 0 0 CA LEU A 35 1
CH2 1.525 0 111.06 0 59.99 1 365 363 361 0 0.000 365 367 0 0 0 0 CB LEU A 35 1
CH1 1.525 0 109.43 0 179.99 1 366 365 363 0 0.000 366 368 369 0 0 0 CG LEU A 35 1
CH3 1.526 0 109.45 0 60.03 1 367 366 365 0 0.000 367 0 0 0 0 0 CD1 LEU A 35 1
CH3 1.524 0 109.47 0 119.99 1 367 366 368 0 0.000 367 0 0 0 0 0 CD2 LEU A 35 1
C 1.521 0 111.12 0 120.01 0 365 363 366 0 0.380 365 371 372 0 0 0 C LEU A 35 1
O 1.229 0 120.51 0 0.00 1 370 365 363 0 -0.380 370 0 0 0 0 0 O LEU A 35 1
N 1.335 0 116.64 0 179.99 0 370 365 371 0 -0.280 370 373 374 0 0 0 N PHE A 36 1
H 1.010 0 118.97 0 0.06 0 372 370 365 0 0.280 372 0 0 0 0 0 H PHE A 36 1
CH1 1.449 0 121.94 0 179.92 0 372 370 373 0 0.000 372 375 382 0 0 0 CA PHE A 36 1
CH2 1.525 0 111.09 0 60.04 1 374 372 370 0 0.000 374 376 0 0 0 0 CB PHE A 36 1
C 1.509 0 115.01 0 179.98 0 375 374 372 0 0.000 375 377 381 0 0 0 CG PHE A 36 1
Apêndice
152
C 1.400 0 120.02 0 179.98 0 376 375 374 0 -0.100 376 378 385 0 0 0 CD1 PHE A 36 1
C 1.400 0 120.02 0 180.03 0 377 376 375 0 -0.100 377 379 387 0 0 0 CE1 PHE A 36 1
C 1.400 0 120.01 0 0.00 0 378 377 376 0 -0.100 378 380 389 0 0 0 CZ PHE A 36 1
C 1.400 0 119.97 0 0.00 0 379 378 377 0 -0.100 379 381 388 0 0 0 CE2 PHE A 36 1
C 1.400 0 120.02 0 0.00 0 380 379 378 0 -0.100 376 380 386 0 0 0 CD2 PHE A 36 1
C 1.522 0 111.12 0 119.98 0 374 372 375 0 0.270 374 383 384 0 0 0 C PHE A 36 1
OM 1.230 0 120.46 0 0.04 1 382 374 372 0 -0.635 382 0 0 0 0 0 O PHE A 36 1
OM 1.229 0 119.78 0 179.96 0 382 374 383 0 -0.635 382 0 0 0 0 0 OXT PHE A 36 1
HC 1.090 0 120.01 0 180.01 0 377 376 378 0 0.100 377 0 0 0 0 0 HD1 PHE A 36 1
HC 1.090 0 120.00 0 179.97 0 381 380 379 0 0.100 381 0 0 0 0 0 HD2 PHE A 36 1
HC 1.090 0 120.06 0 179.98 0 378 377 379 0 0.100 378 0 0 0 0 0 HE1 PHE A 36 1
HC 1.090 0 119.97 0 179.99 0 380 379 381 0 0.100 380 0 0 0 0 0 HE2 PHE A 36 1
HC 1.090 0 120.05 0 179.98 0 379 378 380 0 0.100 379 0 0 0 0 0 HZ TER A 36 1
#### 0.000 0 0.00 0 0.00 0 0 0 0 0 0.000 0 0 0 0 0 0
7.2 Apênice B - Parâmetros para a simulação de
Dinâmica Molecular
O arquivo *.mdp é um arquivo de parâmetros que controla toda a simulação
por Dinâmica Molecular. Segue, como exemplo, o arquivo *.mdp da simulação do
mastoparano-X sob o efeito do annealing (Sistema 4 do estudo com o MP-X).
; File 'mdout.mdp' was generated
; By user: tacio (501)
; On host: cronos.biof.ufrj.br
; At date: Sun Oct 26 16:42:53 2008
;
; VARIOUS PREPROCESSING OPTIONS
title =
cpp = /lib/cpp --> Localização do pré processador C
; RUN CONTROL PARAMETERS
integrator = md --> Tipo de integrador
; Start time and timestep in ps
tinit = 0
dt = 0.002 --> "time-step", para a integração
nsteps = 150000000 --> Número de passos
; mode for center of mass motion removal
comm-mode = Linear
; number of steps for center of mass motion removal
nstcomm = 1
; OUTPUT CONTROL OPTIONS
; Output frequency for coords (x), velocities (v) and forces (f)
nstxout = 10000 --> Freqüência de escrita da
trajetória .trr
nstvout = 10000 --> Freqüência de escrita das
velocidades
nstfout = 0
; Checkpointing helps you continue after crashes
nstcheckpoint = 1000
; Output frequency for energies to log file and energy file
nstlog = 100
nstenergy = 100 --> Freqüência de escrita das energias
; Output frequency and precision for xtc file
nstxtcout = 1000 --> Freqüência de escrita da
trajetória .xtc
xtc-precision = 1000
; Selection of energy groups
Apêndice
153
energygrps Protein TFE SOL CL- --> Grupos para o monitoramento da energia
; NEIGHBORSEARCHING PARAMETERS
; nblist update frequency
nstlist = 5 --> Freqüência de atualização da lista
de vizinhos
; ns algorithm (simple or grid)
ns_type = grid
; Periodic boundary conditions: xyz (default), no (vacuum)
; or full (infinite systems only)
pbc = xyz
; nblist cut-off
rlist = 1.0 --> Raio de corte para vizinhos de
baixo alcance
domain-decomposition = no
; OPTIONS FOR ELECTROSTATICS AND VDW
; Method for doing electrostatics
coulombtype = Reaction-Field --> Tratamento Eletrostático
rcoulomb = 1.4 --> Raio de corte para Coulomb
; Dielectric constant (DC) for cut-off or DC of reaction field
epsilon-r = 54
; Method for doing Van der Waals
vdw-type = Cut-off --> Tipo de energia Van der Waals
rvdw = 1.2 --> Raio de corte para Lennard-Jones ou Potencial
de Buckingham
; Apply long range dispersion corrections for Energy and Pressure
DispCorr = EnerPres
; Extension of the potential lookup tables beyond the cut-off
table-extension = 1
; Spacing for the PME/PPPM FFT grid
fourierspacing = 0.12
; FFT grid size, when a value is 0 fourierspacing will be used
fourier_nx = 0
fourier_ny = 0
fourier_nz = 0
; EWALD/PME/PPPM parameters
pme_order = 4
ewald_rtol = 1e-05
ewald_geometry = 3d
epsilon_surface = 0
optimize_fft = yes
; OPTIONS FOR WEAK COUPLING ALGORITHMS
; Temperature coupling
Tcoupl = berendsen --> Tipo de acoplamento temperatura
; Groups to couple separately
tc-grps = Protein Non-Protein --> grupos separados ao banho
de temperatura
; Time constant (ps) and reference temperature (K)
tau-t = 0.1 0.1 --> Constante de tempo para a
temperatura
ref-t = 400 400 --> Temperatura, em graus Kelvin
; Pressure coupling
Pcoupl = berendsen --> Termostato de Pressão
Pcoupltype = Isotropic
; Time constant (ps), compressibility (1/bar) and reference P (bar)
tau-p = 1 --> Valor de Tau, no termostato de
Berendsen
Apêndice
154
compressibility = 4.5e-5 --> Compressibilidade da água a 1 ATM e 300k,
unidade em bar
-1
ref-p = 1 --> Referencial para o barostato de
Berendsen
; SIMULATED ANNEALING
; Type of annealing for each temperature group (no/single/periodic)
annealing = single single --> Tipo de annealing para cada grupo do banho
de temperatura
; Number of time points to use for specifying annealing in each group
annealing_npoints = 3 3 --> Número de pontos de tempo para uso do annealing em
cada grupo
; List of times at the annealing points for each group
annealing_time = 0 50000 300000 0 50000 300000 --> Lista de tempo dos pontos
do annealing para cada grupo
; Temp. at each annealing point, for each group.
annealing_temp = 400 300 300 400 300 300 --> Temperatura em cada ponto do
annealing, para cada grupo
; GENERATE VELOCITIES FOR STARTUP RUN
gen_vel = yes --> Gerar velocidades iniciais por
distribuição de Maxwell
gen-temp = 400 --> Temperatura inicial, em graus Kelvin
gen-seed = 173529 --> Semente do número aleatório inicial
; OPTIONS FOR BONDS
constraints = all-bonds
; Type of constraint algorithm
constraint-algorithm = Lincs --> Algoritmo de constrição para vincular os
comprimentos de ligação
; Do not constrain the start configuration
unconstrained-start = no
; Use successive overrelaxation to reduce the number of shake iterations
Shake-SOR = no
; Relative tolerance of shake
shake-tol = 0.0001
; Highest order in the expansion of the constraint coupling matrix
lincs-order = 4
; Lincs will write a warning to the stderr if in one step a bond
; rotates over more degrees than
lincs-warnangle = 30
; Convert harmonic bonds to morse potentials
morse = no
Anexo
155
8 Anexo
Em anexo incluímos o trabalho gerado da aplicação do GSA na predição do
complexo entre o Fator de Crescimento de Fibroblasto (FGF) e dímeros de heparina.
Studies of Molecular Docking Between
Fibroblast Growth Factor and Heparin
using Generalized Simulated Annealing
SAMUEL SILVA da ROCHA PITA,
1
TA
´
CIO VINI
´
CIO AMORIM FERNANDES,
1
ERNESTO RAUL CAFFARENA,
2
PEDRO GERALDO PASCUTTI
1
1
Laborato´rio de Modelagem e Dinaˆmica Molecular (LMDM), Instituto de Biofı´sica Carlos Chagas
Filho, Universidade Federal do Rio de Janeiro (UFRJ), Brazil
2
Programa de Computac¸a˜o Cientı´fica (ProCC), Fundac¸a˜o Oswaldo Cruz,
Rio de Janeiro, Brazil
Received 30 December 2007; accepted 17 March 2008
Published online 19 June 2008 in Wiley InterScience (www.interscience.wiley.com).
DOI 10.1002/qua.21731
ABSTRACT: Since the middle 70s, the main molecular docking problem consists in
limitations to treat adequately the degrees of freedom of protein (or a receptor) due to
the energy landscape roughness and the high computational cost. Until recently, only
few algorithms considering flexible simultaneously both ligand and receptor at low
computational cost were developed. As a recent proposed Statistical Mechanics,
generalized simulated annealing (GSA) has been employed at diverse works concerning
global optimization problems. In this work, we used this method exploring the
molecular docking problem taking into account the FGF-2 and heparin complex. Since
the requirements of an efficient docking algorithm are accuracy and velocity, we tested
the influence of GSA parameters q
A
(new configuration acceptance index), q
V
(energy
surface visiting index), and q
T
(temperature decreasing control) on the performance of
GSADOCK program. Our simulations showed that as temperature parameter q
T
increases, q
A
parameter follows this behavior in the interval ranging from 1.1 to 2.3. We
found that the GSA parameters have the best performance for the q
A
values ranging
from 1.1 to 1.3, q
V
values from 1.3 to 1.5, and q
T
values from 1.1 to 1.7. Most of good q
V
values were equal or next the good q
T
values. Finally, the implemented algorithm is
trustworthy and can be employed as a tool of molecular modeling methods. The final
version of the program will be free of charge and will be accessible at our home-page
Correspondence to: S. S. da Rocha Pita; e-mail: samuelpita@biof.
ufrj.br
International Journal of Quantum Chemistry, Vol 108, 2608–2614 (2008)
© 2008 Wiley Periodicals, Inc.
or could be requested to the authors for e-mail. © 2008 Wiley Periodicals, Inc. Int J
Quantum Chem 108: 2608–2614, 2008
Key words: molecular docking; generalized simulated annealing; fibroblast growth
factors; global optimization problem; Tsallis statistics
Introduction
M
olecular docking can be defined as the pre-
diction of the structure of receptor-ligand
complexes. Currently, several simplifications are
being used to make molecular docking useful on
diverse applications [1]. Despite the large number
of innovations that have been incorporated to this
technique, there are still some major issues that
deserve special consideration, such as the receptor’s
flexibility. At present, we are developing a flexible
docking program, the GSADOCK software, based
on the Generalized Simulated Annealing (GSA) [2,
3]. The main attractive of this program resides in its
capability to converge rapidly to the macromolec-
ular configuration of global minimum energy, mak-
ing it applicable to protein folding problem [4–10].
Since proteins have large number of freedom de-
grees, we intend to hold the receptor flexible during
docking process without losing accurateness and
speed.
The GSA methodology, based on the General-
ized Statistical Mechanics, has been applied to a
large variety of problems such as genetic algo-
rithms, molecular optimization using classical or
semiempirical methods, geophysical problems, ma-
terial science, Traveling Salesman Problem, numer-
ical data fitting and, more recently, to the folding of
peptides (Ref. 4 and other cited therein, 5). The
large applicability of this method can be explained
regarding that this approach is faster than “classi-
cal” [11] and “fast” [12] simulated annealing meth-
ods, provided that the right choice of parameters is
done.
In previous works [4, 5], the GSA methodology
was successfully employed to solve the folding of
peptides. Herein, we tested the best combinations
of characteristic GSA parameters (q
V
, q
A
, and q
T
)to
determine the optimal ones that will result in the
best program performance when trying to dock
ligands inside the receptor’s cavity. Thus, we stud-
ied the formation of the fibroblast growth factors
(FGF-2, basic FGF) and heparin complex since the
formation of this structure is mainly governed by
electrostatic attraction between negatively sulfated
sugars and positively charged groups of the protein
[13–20]. This fact, which permits strong interactions
to be held between these molecules, in addition to
the good resolution (1.9 Å) of the available crystal-
lographic structure [17] at Protein Data Bank [20]
(PDB code: 1BFB), allows us to compare our results
with experimental ones.
There is such a considerable overlapping of bio-
logical activities [14–16] among the members of the
FGF family, ranging from cell growth and differen-
tiation, angiogenesis, morphogenesis to wound
healing [16]. FGF receptors have high affinity for
highly charged molecules, such as heparin-like sug-
ars [13, 17, 21]. Despite the fact that several crystal
structures have been described for isolated [22] and
in complex FGFs, the specific nature of biologically
active complexes has remained unknown until now
[13].
Heparin is a linear anionic polysaccharide
formed of repeated subunits of d-glucosamine
linked by
134tol-iduronic acid and sulfated in
three different regions: 2-hydroxyl of iduronic acid
and both 2-amino and 6-hydroxyl of glucosamine
partner [13, 14]. The extent of the sulfation and the
length of the saccharide chain is exploited by FGF
molecules [17] to bind such long sugar chains.
The aim of this work consists mainly in the de-
termination of the best combination of parameters
(q
A
, q
V
, and q
T
) that will give the best scoring inter-
action energies for docking of heparin disaccharide
in its binding site on FGF receptor surface. The
study of this biological system is also interesting
since little is known about the formation mecha-
nism of the FGF-2–heparin complex [13, 14, 17].
Methods
The generalized simulated annealing (GSA)
method [6], implemented in the new version of the
THOR program, was used to obtain conformational
structures of heparin in the binding site of fibroblast
growth factor (FGF2) protein. The THOR [6] force
field is based on the GROMOS96 [23] classical
united atom force field.
The complex interplay between torsional and
nonbonded contributions of a molecule mostly de-
STUDIES OF MOLECULAR DOCKING BETWEEN FGF AND HEPARIN
VOL. 108, NO. 13 DOI 10.1002/qua INTERNATIONAL JOURNAL OF QUANTUM CHEMISTRY 2609
termines the molecular structural modifications
and the intermolecular energy variations. Hereby,
we have chosen the following energy functional to
account for the internal and intermolecular interac-
tion energies:
E͑r
i
,
n
͒ ϭ
͸
nϭ1
N
K
n
͑1 ϩ cos͑k
n
n
Ϫ
n
͒͒
ϩ
͸
iϭ1,iϽj
N
i
ϩ1
ͭ
C
12
͑i,j͒
r
ij
12
Ϫ
C
6
͑i,j͒
r
ij
6
ϩ
q
i
q
j
4
0
r
r
ij
ͮ
(1)
Where the first sum runs over the torsional an-
gles of the ligand and the second term of the equa-
tion represents the nonbonded contribution
through Coulombic and Lennard-Jonnes potentials.
In our simulations, we considered a continuum
medium with a dielectric constant ϭ 4. Conse-
quently, interactions with the solvent are underes-
timated by simulating continuum media. The low
dielectric constant enhances the electrostatic forces
in protein and carbohydrate interactions accelerat-
ing the formation of the complex since the nega-
tively charged groups of heparin interact with cat-
ionic FGF. This electrostatic approximation has
been used by Moret et al. [6] to compare the effect
of various dielectric constant values when applied
to the folding of poly alanine peptide.
The search for complexes with the minimum
global energies involves comparisons between en-
ergy values resulting from two consecutive random
conformations. For a given conformation,
t
, a new
coordinate set,
tϩ1
, of torsional angles is obtained
through a random displacement,
tϩ1
ϭ
t
ϩ⌬
t
,
where
t
is computed from the visiting distribu
-
tion function, according with GSA algorithm [Eq.
(2)]:
g
q
V
͑⌬
1,i
͒ ϭ
ͩ
q
V
Ϫ 1
ͪ
΂
1
2
ͩ
1 Ϫ 1/2͑q
V
Ϫ 1͒
q
V
Ϫ 1
ͪ
Y
ͩ
1
q
V
Ϫ 1
Ϫ
1
2
ͪ
΃
ϫ
͑T
qT
͑t͒͒
1/3Ϫq
V
ͭ
1 ϩ ͑q
V
Ϫ 1͒
͑⌬
1,i
͒
2
͑
qT͑t͒
͒
2
͑3ϪqV͒
ͮ
͑1/͑qVϪ1͒͒
Ϫ1/ 2
(2)
where q
V
is the index controlling the visitation of
the energy surface. To obtain the values of
t,i
the
function above is inverted. Dall’Igna et al. [24] in-
troduced simplifications in the algorithm allowing
calculations of
t,i
in a more straightforward way
without inverting the function. We consider
t,i
ϰ
g
qV
(r
i
), with r
i
randomly chosen, reducing largely
the computational cost.
The acceptance probability in GSA algorithm
[Eq. (3)] decides if the jumps in the structures are
able to be accepted or not, according to:
P
q
A
ϭ
ͫ
1 ϩ ͑q
A
Ϫ 1͒
E
͑
tϩ1
͒
Ϫ E
͑
t
͒
T
q
T
͑t͒
ͬ
Ϫ1/͑q
A
Ϫ1͒
(3)
where q
A
is the configuration acceptance index. If
E
(
tϩ1)
Ͻ E
(
t)
,
t
is replaced by
tϩ1
; else, if E
(
tϩ1)
Ͼ E
(
t)
, a random number n [0, 1]; is generated
and, if n Ͼ P
qA
,
t
is retained; otherwise,
t
is
replaced by
tϩ1
.
On the expression below [Eq. (4)], T
qT
(t)isthe
temperature function, which is given by:
T
q
T
͑t͒ ϭ T
q
T
͑t͒͑1͒
2
q
T
Ϫ1
Ϫ 1
͑1 ϩ t͒
qT Ϫ 1
Ϫ 1
(4)
where q
T
controls the temperature decreasing. For
the FGF-2 heparin docking calculations an initial
temperature T
qT
(t) ϭ 1.0 was used. At each step (t),
a new temperature is calculated. It is expected that
choosing the right set of parameters q
T
, q
V
, and q
A
,
the global minimum is reached guaranteeing no
trapping in a local minimum [4].
Here, the variation of q
T
parameter for visiting
temperature is considered independent from q
A
or
q
V
[4], differently from the original proposal sug
-
gested by Stariolo and Tsallis [3], which considers
q
T
ϭ q
V
in their algorithm.
The q
T
definition was included in an attempt to
slowdown the temperature decay and, to cover a
great area of the energy hypersurface, avoiding
structural trapping in local minima. The cooling is
adjusted by the parameter q
T
, while the visiting
distribution and the acceptance probability func-
tions are controlled by the parameters q
V
and q
A
,
respectively. The right choice of these parameters
[4, 5] will result in an improvement of the efficiency
of the GSA procedure. Hence, we could explore the
q
V
, q
A
, and q
T
values independently. Moret et al. [6]
presented a detailed analysis about GSA implemen-
tation into the THOR program.
In this work, the evaluation of the best parame-
ters for GSA algorithm is a search through the q
A
,
q
V
, and also q
T
parameters’ space for the FGF hep
-
arin docking problem. For each parameter search,
da ROCHA PITA ET AL.
2610 INTERNATIONAL JOURNAL OF QUANTUM CHEMISTRY DOI 10.1002/qua VOL. 108, NO. 13
the other two parameters were kept fixed. The q
T
search ranged from 1.1 to 3.0, while q
A
and q
V
parameters ranged from 1.1 to 2.9. For variations on
the three parameters, we used 0.2 steps, and also
used 500,000 annealing steps for each parameter set
values.
Docking calculations, as a useful tool for drug
discovery, have their potential based on both speed
and accuracy [25] and so we tested GSA against
these two requirements. Another major point to be
regarded is that a considerable number of docking
programs do not make any proteins chains flexible
because this treatment requires a large amount of
computational resources [1, 25, 26], being suitable
for our recent THOR implementations and comput-
ing environment, e.g., not using many processors
on a Grid [4] or massive parallel computers.
Based on this assumption we evaluate the GSA-
DOCK program in these two points (accuracy and
speed) representing the ‘correct’ complex between
heparin dimer and FGF. The FGF complex was
obtained at Protein Data Bank [20] (1BFB) and the
missing hydrogen atoms were modeled using the
WHATIF program [27] (http://swift.cmbi.ru.nl/
server/html/index.html). We run our simulations
at pH ϭ 7.3. In GSADOCK routines we used the
complete structure of FGF-1 protein to scan exhaus-
tively the potential energy surface intending to ob-
tain the better. We built a grid of the 0.265 mesh
around all the protein atoms (giving, approxi-
mately, 1,481,544 points) and the calculations were
made inside this grid. To build the heparin topolo-
gies we had chosen the atom of the sugar bond and
we described more than 14 dihedrals in ligand
structure for each tree GSA parameters (q
T
,q
V
and
q
A
). These were scanned for the sugar structure
resulting in 40 heparin structures for each triad of
parameters. Any one criteria was applied to filter
the results, e.g. nor the polar atoms selection, and
nor grid build around only the active site or other
‘selective’ criteria.
Simulations were performed in an Intel® Duo
Core computer with 3.2 GHz processors taking
ϳ2.5 min per docking, varying sequentially q
V
, q
A
,
and q
T
parameters.
Results and Discussion
The values for q
A
, q
V
, and q
T
parameter set to
obtain the best GSA performance for peptide fold-
ing have been mapped in a previous work [4, 5].
Nevertheless, some uncertainty still remains on the
best values of q
A
, when q
V
and q
T
remain fixed. In
this work, we swept q
A
, q
V
, and q
T
parameters
values to establish the value sets for GSA best per-
formance when calculating molecular docking.
The results have shown that GSA approach is
computationally fast in determining complexes be-
tween FGF-2 and heparin, similar to crystallo-
graphic ones. It is noteworthy that the GSA proce-
dure is capable to reach the global energy minimum
in less steps than conventional stochastic methods
[46].
Accuracy, other important characteristic for
docking programs [1, 25, 26], was first evaluated by
inspection of the major number of polysaccharides
posed at the binding site, as in crystallographic
structure reported by structural studies [13, 17] (see
Fig. 1). In spite of the disparity of GSA parameters,
GSADOCK correctly poses the ligand at adequately
locations in the FGF-2 binding-site, starting with
the molecule 3.5 Å far from it, assuring that GSA
can be successfully applied in the study of molec-
ular complexes.
The crystallographic structure of FGF-heparin
complex used as reference is composed of a tet-
rasaccharide heparin moiety, but only the two cen-
tral monomers interact directly with FGF by elec-
trostatic salt bridges between two heparin sulfate
groups through lysine-126 and arginine-121 and so
FIGURE 1. The main charged FGF residues in the
heparin binding sites are signed and the heparin atoms
are shown as a stick model. The two lowest energy
complexes are shown: best docked (q
T
ϭ 1.7, q
A
ϭ
1.3, q
V
ϭ 1.7); second best docked (q
T
ϭ 1.5, q
A
ϭ
1.3, q
V
ϭ 1.5) and the crystallographic structure of hep
-
arin (1BFB, cyan-yellow-red). This figure was generated
using the VMD program [28]. [Color figure can be
viewed in the online issue, which is available at www.
interscience.wiley.com.]
STUDIES OF MOLECULAR DOCKING BETWEEN FGF AND HEPARIN
VOL. 108, NO. 13 DOI 10.1002/qua INTERNATIONAL JOURNAL OF QUANTUM CHEMISTRY 2611
in our simulations we took into account a heparin
disaccharide only. Despite the FGF surface being
highly charged (bearing 14 lysine, 11 arginine, 8
glutamic, and 7 aspartic acid residues) the two FGF
amino acids residues, lys-126 and arg-121, are the
main residues in FGF binding site for heparin. In
the Figure 1 is shown that heparin dimer was
docked between these two FGF residues.
The root mean square deviations (RMSD) be-
tween configurations produced by GSADOCK and
crystallographic structure [17] (PDB [20] code:
1BFB) (see Fig. 2) were calculated to compare the
complexes of lower energies. The 10 best GSA pa-
rameter set that generate the docked structures of
lowest energy and related RMSDs are shown in the
Figure 2. These GSA sets were run for 40 times each
one producing, in most of simulations, two config-
urations with two RMSD mean values (see Fig. 2).
In Figure 2, the RMSD values were above 3 Å
because we compared a docked heparin disaccharide
with the two central monomers in a tetrasaccharide of
the FGF-heparin crystal structure. The RMSD values
are related with the docked structures of lower ener-
gies. From the Figure 2, the GSA parameters have the
best performance for the q
A
values ranging from 1.1 to
1.3, q
V
values from 1.3 to 1.5, and q
T
values from 1.1 to
1.7. Most of good q
V
values were equal or next the
good q
T
values.
Our general results presented in Figure 3 qualita-
tively reproduce the results on poly alanine folding
published before [4, 5]. It is interesting to note that all
of the structures used here in the RMSD calculations
were posed at the right position and, additionally, has
more negative energies (i.e., better) for the FGF–he-
parin complexes.
Figure 3 reveals the dispersion of all three GSA
parameters (q
A
, q
V
, and q
T
) of some better com
-
plexes which RMSD results were shown in Figure
2 and the other acceptable complexes not shown
in Figure 2. These results could be directly com-
FIGURE 2. RMSD plot of 40 structures of the more negative energies obtained from GSADOCK for 10 GSA param-
eter sets. [Color figure can be viewed in the online issue, which is available at www.interscience.wiley.com.]
da ROCHA PITA ET AL.
2612 INTERNATIONAL JOURNAL OF QUANTUM CHEMISTRY DOI 10.1002/qua VOL. 108, NO. 13
pared with the studies of Agostini et al. [4] and
Fernandes [5]. In these works, the tendency for q
A
versus q
T
values was not found for poly alanine
folding but in this work we note the direct trend
in acceptance parameter against the temperature.
Concerning the q
V
parameter, we noted the same
tendency observed by Agostini et al., the inverse
conduction against q
T
values [4], as q
T
increases
through the calculations the q
V
parameter de
-
creases. It can also be confirmed with a negative
Pearson’s correlation coefficient of q
V
data (r
2
data
not shown). However, it is noteworthy the behavior
of q
A
parameter. As folding calculations could not
find some trend for this parameter [4, 5], at this
point we can assert the tendency of q
A
, as the values
of q
T
raises near 3.0, q
A
tends to elevate reaching
maximum value in 2.9.
Conclusions
Many studies have described the benefits of var-
ious docking methods developed in the last years
[1, 25, 26] but, none of them have pointed solutions
to the major drawback of the docking programs: the
rigidity of the receptor. Since GSA methodology has
been successfully applied to treat the folding of
small peptides [4] we have used it to perform new
docking experiments.
We studied through GSADOCK—the more re-
cent implementation in THOR program—a new
methodology to determine the complex between
the basic fibroblast growth factor (FGF-2) and hep-
arin since the understanding of molecular interac-
tions between them are not satisfactory until now
[13, 16, 17].
We started from the crystallographic structure
of the complex, but with the heparin apart from
its binding site, and swept all combinations of q
A
,
q
V
, and q
T
GSA parameters ranging from 1.1 to
2.9.
The GSADOCK outcomes showed that the sim-
ilar parameters obtained from poly alanine folding
[4, 5] result in the same behavior when studying
molecular complexes of heparin and FGF-2 prom-
ising that GSA can be used as a suitable tool of drug
discovery.
As many studies discussed before [46], the
main breakpoint of GSA methodology is based in
the choice of right parameters [4, 5] however, none-
had scanned the adequate values for docking cal-
culations despite some results in the folding of pep-
tides.
Previous studies published [4, 5] the results of
GSA parameters and reveals the behavior of q
V
against q
T
. Recent unpublished results on our lab
-
oratory confirm the Agostini et al. [4]. results for an
alanine polymer where the q
V
data increase when
q
T
decreases. This proved that our methodology is
trustworthy, since we pointed the same tendency
for q
V
in this work. The result shown in Figure 3
finds out that q
V
values for docking has the same
inverse trend of q
T
.
Tacking into account only the five docked struc-
tures of lowest energy and lower RMSD, the GSA
parameters have the best performance for the q
A
values ranging from 1.1 to 1.3, q
V
values from 1.3 to
1.5, and q
T
values from 1.1 to 1.7.
At this work we can find ascendant tendency in
q
A
since the values of q
A
in docking studies of FGF
and heparin increases until q
T
parameter is reaching
higher values. Calculating the Pearson’s correlation
coefficient (r
2
) in the plot of q
A
(see Fig. 3) resulted
in a positive number which is higher if the minor
values of acceptance (1.1 and 1.3) are discarded
(data not shown).
Other main point arises from energy values,
which are in well accordance with the expected
results, since the more negative energies were ob-
tained for better complexes between FGF-2-HEP,
along with minor RMSDs.
In summary, our results show that GSADOCK
might be an important resource in the seeking of
biological compounds, specially used as a tool of
FIGURE 3. GSA parameter of temperature (q
T
) versus
q
A
(acceptance), and q
V
(visitation) parameters. [Color
figure can be viewed in the online issue, which is avail-
able at www.interscience.wiley.com.]
STUDIES OF MOLECULAR DOCKING BETWEEN FGF AND HEPARIN
VOL. 108, NO. 13 DOI 10.1002/qua INTERNATIONAL JOURNAL OF QUANTUM CHEMISTRY 2613
drug discovery. The implemented algorithm is
trustworthy and it can be employed vastly in mo-
lecular mechanics fields, from molecular simula-
tions, folding and docking, with minimal computa-
tional effort.
References
1. Brooijmans, N.; Kuntz, I. Ann Rev Biophys 2003, 32, 335.
2. Tsallis, C.; Stariolo, D. E. Physica A 1996, 233, 395.
3. Stariolo, D. A.; Tsallis, C. Annual Reviews of Computational
Physics; World Scientific: Singapore, 1995; Vol. 2, p 343.
4. Agostini, F. P.; Soares-Pinto, D. O.; Osthoff, C.; Moret, M. A.;
Pascutti, P. G. J Comp Chem 2006, 27, 1142.
5. Fernandes, T. V. Estudo do Enovelamento de Peptideos por
Me´todos Estoca´sticos Generalizados e por Dinaˆmica Molec-
ular, Universidade Federal do Rio de Janeiro: Rio de Janeiro,
2007, p 91.
6. Moret, M. A.; Bisch, P. M.; Mundim, K. C.; Pascutti, P. G.
Biophys J 2002, 82, 1123.
7. Moret, M. A.; Pascutti, P. G.; Bisch, P. M.; Mundim,
V. F. M. S. P.; Mundim, K. C. Physi A 2006, 363, 260.
8. Moret, M. A.; Nogueira, E.; Bisch, P. M.; Pascutti, P. G.
Physica A 2005, 353, 353.
9. Moret, M. A.; Pascutti, P. G.; Mundim, K. C.; Bisch, P. M.;
Nogueira, E. Physica E 2001, 63, 20901.
10. Moret, M. A.; Pascutti, P. G.; Bisch, P. M.; Mundim, K. C.
J Comp Chem 1998, 19, 647.
11. Kirkpatrick, S.; Gelatt, C. D.; Vecchi, M. P. Science 1983, 220,
671.
12. Szu, H.; Hartley, R. Phys Lett A 1987, 122, 157.
13. DiGabriele, A. D.; Lax, I.; Chen, D. I.; Svahn, C. M.; Jaye, M.;
Schlesinger, J.; Hendrickson, W. A. Nature 1998, 393, 812.
14. Patrie, K. M.; Botelho, M. J.; Franklin, K.; Chiu, I.-M. Bio-
chemistry 1999, 38, 9264.
15. Pelegrini, L. Curr Opin Struct Biol 2001, 11, 629.
16. Faham, S.; Linhardt, R. J.; Rees, C. D. Curr Opin Struct Biol
1998, 8, 578.
17. Faham, S.; Hileman, R. E.; Fromm, J. R.; Linhardt, R. J.; Rees,
C. D. Science 1996, 271, 1116.
18. Harper, J. W.; Lobb, R. R. Biochemistry 1988, 271, 671.
19. Thompson, L. D.; Pantoliano, L. D.; Springer, B. A. Biochem-
istry 1994, 33, 3831.
20. Moy, F. J.; Seddon, A. P.; Bo¨hlen, P.; Powers, R. Biochemistry
1996, 35, 13552.
21. Berman, H. J.; Westbrook, J.; Feng, Z.; Bhat, T. N.; Weissig,
H.; Shindyalov, I. N.; Bourne, P. E. Nucl Acid Res 2000, 28,
235.
22. Mulloy, B.; Forster, M. J.; Jones, C.; Davies, D. B. Biochem J
1993, 293, 849.
23. van Gusteren, W. F.; Biliter, S. R.; Eising, A. A. W. F.; Hu¨nen-
berger, P. H.; Kru¨ ger, P.; Mark, A. E.; Scott, W. R. P.; Tironi,
I. G. Biomolecular Simulation: The GROMOS96 Manual and
User Guide Vdf Hochschulverlag AG an der ETH Zu¨ rich,
Zu¨rich, Switzerland, 1996, p 1.
24. Dall’ Igna, A., Jr.; Silva, R. S.; Mundim, K. C.; Dardenne, L. E.
Genet Mol Biol 2004, 27, 616.
25. Taylor, J. D.; Jewsburry, P. J.; Essex, J. W. J Comput-Aided
Mol Des 2002, 16, 151.
26. Rester, U. QSAR Comb Sci 2006, 25, 605.
27. Vriend, G. J Mol Graph 1990, 8, 52.
28. Humphrey, W.; Dalke, A. and Schulten, K. J Molec Graphics
1996, 14, 33–38.
da ROCHA PITA ET AL.
2614 INTERNATIONAL JOURNAL OF QUANTUM CHEMISTRY DOI 10.1002/qua VOL. 108, NO. 13
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo