Predicción de estructura 3D
Threading
Florencio Pazos (PDG - Centro Nacional de Biotecnología,
Madrid).
Paulino Gómez Puertas (PDG - Centro Nacional de Biotecnología,
Madrid). 
El "reconocimiento de plegamiento", "diseño por homología
remota" o
threading es una técnica de predicción de
estructura tridimensional de proteinas aplicable cuando no hay similitud
suficiente de secuencia entre la secuencia problema y ninguna estructura
3D conocida y, por tanto, no se pueden aplicar las técnicas de "modelado
por homología". Se basa en superponer la secuencia problema
sobre la estructura de diferentes proteínas cuyo plegamiento estructural
es conocido y evaluar cómo "encaja" en cada uno de ellos. Por "encajar"
se entienden cosas diferentes según el programa de threading: coincidencia
de estructura secundaria, accesibilidad o energía de solvatación
similares, etc.
Programas.
-
1.- El primer paso consiste en comprobar no existe una proteína
homóloga de estructura conocida; es decir, que no se puede
aplicar la aproximación de "diseño
por homología". Para responder esta pregunta, el primer método
a utilizar es una búsqueda, utilizando BLAST,
contra la base de datos PDB.
-
2.- Estudiar las caracteristicas estructurales de la proteína, puede
ayudar a discriminar entre modelos de threading: Características
1D
-
3.- Algunos programas de threading.:
-
Links a métodos que se pueden usar a través de la WWW:
-
3D-pssm (ICNET). Based on
sequence profiles, solvatation potentials and secondary structure.
-
TOPITS
(PredictProtein server) (EMBL). Based on coincidence of secondary structure
and accesibility.
-
UCLA-DOE Structure Prediction Server
(UCLA). Executes various threading programs and report a consensus.
-
123D+. Combines
substitution matrix, secondary structure prediction, and contact capacity
potentials.
-
SAM/HMM
(UCSC). Basen on Markov models of alignments of crystalized proteins.
-
FAS
(Burnham Institute). Based on profile-profile matching algorithms of the
query sequence with sequences from clustered PDB database.
-
PSIPRED-GenThreader
(Brunel)
-
FUGUE:
Profile library search against the HOMSTRAD homologous structure alignment
database (Cambridge Univ.)
-
Métodos cuyos ejecutables o códigos están disponibles:
-
THREADER2(Brunel).
Based on solvatation potentials and contacts obtained from crystalized
proteins.
-
ProFIT CAME (Salzburg).
-
4.- Clasificación y comparación de estructuras tridimensionales:
3D
STRUCTURE DATABASES
-
5.- Un buen programa para la visualización y combinación
de resultados de Threading: Threadlize.
Ejemplos ya hechos:
TTLSCKVTSVEAITDTVYRVRIVPDAAFSFRAGQYLMVVMDERDKRPFSMASTPDEKGFI
ELHIGASEINLYAKAVMDRILKDHQIVVDIPHGEAWLRDDEERPMILIAGGTGFSYARSI
LLTALARNPNRDITIYWGGREEQHLYDLCELEALSLKHPGLQVVPVVEQPEAGWRGRTGT
VLTAVLQDHGTLAEHDIYIAGRFEMAKIARDLFCSERNAREDRLFGDAFAFI
Resultados.
Polyribonucleotide nucleotidyltransferase (84aa):
AEIEVGRVYT GKVTRIVDFG AFVAIGGGKE GLVHISQIAD KRVEKVTDYL
QMGQEVPVKV LEVDRQGRIR LSIKEATEQS QPAA
Resultados.
Casos para hacer:
Protein 1.
RLSWYDPDFQARLTRSNSKCQGQLEV YLKDGWHMVC
SQSWGRSSKQWEDPSQASKVCQRLNCGVPLSLGPFLV
TYTPQSSIICYGQLGSFSNCSHSRNDMCHSLGLTCLE
(results from some threading servers)
Protein 2.
MAEDGPQKQQLEMPLVLDQDLTQQMRLRVESLKQRGEKKQDGEKLI
RPAESVYRLDFIQQQKLQFDHWNVVLDKPGKVTITGTSQNWTPDLT
NLMTRQLLDPAAIFWRKEDSDAMDWNEADALEFGERLSDLAKIRKV
MYFLITFGEGVEPANLKASVVFNQL
Protein 3.
MINRTDCNENSYLEIHNNEGRDTLCFANAGTMPVAIYGVNWVESGNNVVT
LQFQRNLSDPRLETITLQKWGSWNPGHIHEILSIRIY
(results from some threading servers)
Protein 4.
MIDLSKTVFYTSIDIGSRYIKGLVLGKRDQEWEALAFSSVKSRGLDEGEIKDAIAFKESV
NTLLKELEEQLQKSLRSDFVISFSSVSFEREDTVIERDFGEEKRSITLDILSEMQSEALE
KLKENGKTPLHIFSKRYLLDDERIVFNPLDMKASKIAIEYTSIVVPLKVYEMFYNFLQDT
VKSPFQLKSSLVSTAEGVLTTPEKDRGVVVVNLGYNFTGLIAYKNGVPIKISYVPVGMKH
VIKDVSAVLDTSFEESERLIITHGNAVYNDLKEEEIQYRGLDGNTIKTTTAKKLSVIIHA
RLREIMSKSKKFFREVEAKIVEEGEIGIPGGVVLTGGGAKIPRINELATEVFKSPVRTGC
YANSDRPSIINADEVANDPSFAAAFGNVFAVSENPYEETPVKSENPLKKIFRLFKELME
Protein 5.
VATAKYGTPVIDGEIDEIWNTTEEIERKAVAMGSLDKNAT
AKVRVLWDENYLYVLAIVKDPVLNKDNSNPWEQDSVEIFI
DENNHKTGYYEDDDAQFRVNYMNEQTFGTGGSPARFKTAV
KLIEGGYIVEAAIKWKTIKPTPNTVIGFNIQVNDANEKGQ
RVGIISWSDPTNNSWRDPSKFGNLRLIK
