Predicción de Estructura Secundaria:
Características 1D
 

Las características 1D de una secuencia son aquellas que pueden ser representadas por un solo valor  asociado a cada aminoácido (B. Rost). Estos son, para la Estructura Secundaria (H -helix-, E -strand-, L -loop-, ...); para la accesibilidad (buried o exposed; o porcentaje de accesibilidad); para  la hidrofobicidad, etc. Las características  1D de una secuencia son muy útiles para la predicción de la estructura 3D.
 
 

AA :        Residuos de la secuencia
OBSsec: Estructura secundaria observada (E: sheet, H: helice)
OBSacc: Accesibilidad observada (e: exposed, b: buried)
PHDsec: Estructura secundaria predecida
PHDacc: Accesibilidad predecida

 

Programas y Servidores:

Tipo de predicción
Servidor
Servidor Multifuncional
PredictProtein
Servidor Multifuncional CBS Prediction Servers
Estructura secundaria
PredictProtein (PHDsec)
Estructura secundaria JPred
Estructura secundaria PsiPred
Hélices transmembrana
TMHMM:
Hélices transmembrana DAS
Barriles Beta transmembrana PRED-TMBB
Barriles Beta transmembrana ProfTMB (en PredictProtein)
Globularidad GLOBE (en PredictProtein)
Péptidos señal
SignalP
Desorden
DRIPPRED
Desorden DISEMBL
Desorden DISOPRED2


 


Ejercicios

¿Que características de la estructura secundaria decir de las siguientes secuencias?

1. Coger las siguientes secuencias polipeptídicas en formato fasta y enviarlas a los diferentes servidores de predicción de estructura secundaria (PHD, JPred, PsiPred). Comparar los resultados obtenidos entre ellos.

Después enviar la secuencia al servidor de predicción de péptidos señal (SignalP)


>APTE_DROME
MGVCTEERPVMHWQQSARFLGPGAREKSPTPPVAHQGSNQCGSAAGANNNHPLFRACSSSSCPDICDHST

>ARGR1_YEAST
MTSNSDGSSTSPVEKPITGDVETNEPTKPIRRLSTPSPEQDQEGDFEEEDDDDKFSVSTSTPTPTITKTK

Extraer esta secuencia de UniProt 

>P04286|FTSI_ECOLI

2.  Proponer una estructura secundaria para esta proteína y comparar con la entrada en UniProt
>ICSA_SHIFL/241-1102
SSLSVINKGTFAGGNGGAAYGYGYDGYGGNAITGDNLSVINNGAILGGNGGHWGDAINGS
NMTIANSGYIISGKEDDGTQNVAGNAIHITGGNNSLILHEGSVITGDVQVNNSSILKIIN
NDYTGTTPTIEGDLCAGDCTTVSLSGNKFTVSGDVSFGENSSLNLAGISSLEASGNMSFG
NNVKVEAIINNWAQKDYKLLSADKGITGFSVSNISIINPLLTTGAIDYTKSYISDQNKLI
YGLSWNDTDGDSHGEFNLKENAELTVSTILADNLSHHNINSWDGKSLTKSGEGTLILAEK
NTYSGFTNINAGILKMGTVEAMTRTAGVIVNKGATLNFSGMNQTVNTLLNSGTVLINNIN
APFLPDPVIVTGNMTLEKNGHVILNNSSSNVGQTYVQKGNWHGKGGILSLGAVLGNDNSK
TDRLEIAGHASGITYVAVTNEGGSGDKTLEGVQIISTDSSDKNAFIQKGRIVAGSYDYRL
KQGTVSGLNTNKWYLTSQMDNQESKQMSNQESTQMSSRRASSQLVSSLNLGEGSIHTWRP
EAGSYIANLIAMNTMFSPSLYDRHGSTIVDPTTGQLSETTMWIRTVGGHNEHNLADRQLK
TTANRMVYQIGGDILKTNFTDHDGLHVGIMGAYGYQDSKTHNKYTSYSSRGTVSGYTAGL
YSSWFQDEKERTGLYMDAWLQYSWFNNTVKGDGLTGEKYSSKGITGALEAGYIYPTIRWT
AHNNIDNALYLNPQVQITRHGVKANDYIEHNGTMVTSSGGNNIQAKLGLRTSLISQSCID
KETLRKFEPFLEVNWKWSSKQYGVIMNGMSNHQIGNRNVIELKTGVGGRLADNLSIWGNV
SQQLGNNSYRDTQGILGVKYTF


3. Mirar comportamiento de estructura secundaria (quitar opcion Blast en JPred) + hélices trasmembrana + peptido señal (SinalP) + globular(GLOBE-PredictProtein) y comparar los resutados con el PDB (probar también con DSSPcont).
>2PRC:L|PDBID|CHAIN|SEQUENCE
ALLSFERKYRVRGGTLIGGDLFDFWVGPYFVGFFGVSAIFFIFLGVSLIGYAASQGPTWDPFAISINPPDLKYGLGAAPL
LEGGFWQAITVCALGAFISWMLREVEISRKLGIGWHVPLAFCVPIFMFCVLQVFRPLLLGSWGHAFPYGILSHLDWVNNF
GYQYLNWHYNPGHMSSVSFLFVNAMALGLHGGLILSVANPGDGDKVKTAEHENQYFRDVVGYSIGALSIHRLGLFLASNI
FLTGAFGTIASGPFWTRGWPEWWGWWLDIPFWS


4. Tratar como la anterior y extraer conclusiones sobre la posibilidad de que ésta sea también una proteína transmembrana.
¿podemos aprender algo de cómo sospechar que una proteína es transmembranar?
>Unknown
MQPPPDEARRDMAGDTQWSRPECQAWTGTLLLGTCLLYCARSSMPICTVSMSQDFGWNKK
EAGIVLSSFFWGYCLTQVVGGHLGDRIGGEKVILLSASAWGSITAVTPLLAHLSSAHLAF
MTFSRILMGLLQGVYFPALTSLLSQKVRESERAFTYSIVGAGSQFGTLLTGAVGSLLLEW
YGWQSIFYFSGGLTLLWVWYVYRYLLSEKDLILALGVLAQSRPVSRHNRVPWRRLFRKPA
VWAAVVSQLSAACSFFILLSWLPTFFEETFPDAKGWIFNVVPWLVAIPASLFSGFLSDHL
INQGYRAITVRKLMQGMGLGLSSVFALCLGHTSSFCESVVFASASIGLQTFNHSGISVNI
QDLAPSCAGFLFGVANTAGALAGVVGVCLGGYLMETTGSWTCLFNLVAIISNLGLCTFLV
FGQAQRVDLSSTHEDL

5. Mirar en servidores de estructura secundaria, hélices transmembrana y SignalP, proponer estructura secundaria para ella.
>UniProt/Swiss-Prot|Q5JWF8|CT134_HUMAN Hypothetical protein C20orf134 precursor
MASTALLALCSTGAFSGLAVEAGAGVCHATPIYAGHSWHQATFRLNVAGSTLSRYLRDLL
VAANPDLLQQALPRKAITHLKKRSCYVSLDFEGDLRDPARHHPASFSVGNGCCVCLSSER
FRCPEPIFQPGLLGQAEQGLPALAFRALQKMPKTLRTRLADTVVLAGGSTLFPGFAERLD
KELEAQCRRHGYAALRPHLVAKHGRGMAVWTGGSMVASLHSFQRRWITRAMYQECGSRLL
YDVFN

6. Mirar en servidores de estructura secundaria y desorden.
>1BET:_|PDBID|CHAIN|SEQUENCE
GEFSVCDSVSVWVGDKTTATDIKGKEVTVLAEVNINNSVFRQYFFETKCRASNPVESGCRGIDSKHWNSYCTTTHTFVKA
LTTDEKQAAWRFIRIDTACVCVLSRKA


7.
Envía la siguiente secuencia a los servidores de predicción de hélices transmembrana (TMHMM, PHD-TM)

>2_636 AA
MEGPAFSKPL KDKINPWGPL IILGILIRAG VSVQHDSPHQ VFNVTWRVTN LMTGQTANVT SLLGTMTDAF PKLYFDLCDL IGDDWDETGL GCRTPGGRKR ARTFDFYVCP GHTVPTGCGG PREGYCGKWG CETTGQAYWK PSSSWDLISL KRGNTPRNQG PCYDSSAVSS NIKGATPGGR CNPLVLEFTD AGKKASWDGP KVWGLRLYRS TGIDPVTRFS LTRQVLNIGP RVSIGPNPVI TDQLPPSRPV QIMLPRPPQP PPPGAASIVP ETAPPSQQPG TGDRLLNLVD GAYRALNLTS PDKTQECWLC LVAGPPYYEG VAILGTYSNH TSAPANCSVA SQHKLTLSEV TGQGLCVGAV PKTHQALCNT TQTSSRGSYY LVAPTGTMWA CSTGLTPCIS TTILNLTTDY CVLVELWPRV TYHSPSYVYG LFERSNRHKR EPVSLTLALL LGGLTMGGIA AGIGTGTTAL MATQQFQQLQ AAVQDDLREV EKSISNLEKS LTSLSEVVLQ NRRGLDLLFL KEGGLCAALK EECCFYADHT GLVRDSMAKL RERLNQRQKL FESTQGWFEG LFNRSPWFTT LISTIMGPLI VLLMILLFGP CILNRLVQFV KDRISVVQAL VLTQQYHQLK PIEYEP

 

>O06005|AAPA_BACSU

 

>MYDM_HUMAN (estudiar su relación evolutiva con sus hómologos)

PHD_TM output

 

8. Envía la siguiente secuencia a los servidores de predicción de fosforilación y glicosilación (NetOGly, NetPhos)

>3_41 AA
ASYDGHKLVAGYDFTPPSTPSTDDPNVCREYSYKLGTYGAP

NetOGlyc output

>4_153 AA
ASQKRPSQRHGSKYLATASTMDHARHGFLPRHRDTGILDSIGRFFGGDRGAPKNMYKDSHHPARTAHYGSLPQKSHGRTQ DENPVVHFFKNIVTPRTPPPSQGKGRKSAHKGFKGVDAQGTLSKIFKLGGRDSRSGSPKPELVISALIVESRR

NetPhos output

 


Gracias a David de Juan (CNIO) por la elaboracion de estas practicas