Programa Cursos Bioinformática CNB
2007-2008
Estructura de Proteínas
Florencio Pazos
CNB-CSIC
Día 1
- Introducción - Caracteristicas del espacio de estructuras
- Principales bases de datos "primarias" con información estructural
- RCSB - Repositorio central de estructuras de proteínas. Contiene los datos
estructurales "crudos" en formato PDB.
- PDBsum - Filtrado y "digestión" de los ficheros PDB para mostrar la
información estructural de una manera gráfica y conectada con otras bases de datos. Contiene además información estructural
"secundaria" (derivada del PDB).
- Búsqueda de estructuras por similitud de secuencia
(BLAST
contra PDB)
- Programas de visualización y manipulación de estructuras
- Ejercicio(s) propuesto(s)
- ¿Por qué esta secuencia corresponde a un mutante inactivo de una enzima?
- Imagínate que acabas de encontrar experimentalmente este mutante en tu laboratorio y estas preparando el correspondiente paper.
Genera una imagen con la explicación estructural de la inactividad de esa proteína (punto anterior) de calidad y claridad suficientes
para incluir en la publicación.
Día 2
- Clasificación y comparación de estructuras
- SCOP - Clasificación jerárquica de estructuras de proteínas (semimanual).
- Dali - Programa de comparación y superposición de estructuras de proteínas.
- DaliLite - Superposición de dos estructuras.
- Búsqueda de homologos estructurales
corriendo con Dali una estructura contra todas las de la base de datos.
- FSSP - Clasificación estructural
de proteínas
generada automáticamente al aplicar Dali a todos los pares de estructuras.
- Otro servidor para alineamientos estructurales:
MAMMOTH (A. Ramirez-Ortiz, CBM), para el que tambien
hay disponible una version para alineamientos estructurales multiples
(Mammoth_mult).
- Ejercicio(s) propuesto(s)
- Compara las estructuras de Rac aislado
(PDB: 1mh1) y de Rac interaccionando con un effector, una toxina que modula su función (PDB: 1he1).
¿Cuales son las principales diferencias estructurales? ¿Podrían estas diferencias explicar el effecto de la toxina?
(Sugerencia: alinea estructuralmente las dos cadenas para ver las diferencias).
- Predicción de estructura secundaria y otras características 1D.
- Presentación (PDF)
- Principales servidores de predicción de estructura secundaria y otras características 1D
- PredictProtein - Estructura secundaria (PHDsec/PROF), accesibilidad al solvente (PHDacc),
helices transmembrana (PHDhtm), y muchas otras predicciones.
- PSIPRED - Estructura secundaria (PSIPRED),
helices transmembrana (MENSAT), y otras predicciones.
- JPred - Estructura secundaria. Basado en "consenso": corre
varios programas y busca coincidencia entre los resultados.
- TMHMM - Helices transmembrana
- Pongo metaserver - Helices transmembrana y peptidos señal. Por consenso.
- COIL - Regiones coiled-coil
- TMBpro - Predicción de barriles beta transmembrana.
- CBS Prediction Servers - Modificaciones posttraduccionales (glicosilaciones,
fosforilaciones, ...), peptidos señal, caracteristicas inmunogénicas, ...
- DISOPRED2 - Predicción de regiones desordenadas/desestructuradas
- DisEMBL - Predicción de regiones desordenadas/desestructuradas
- GlobPlot - Localizacion de zonas desestructuradas y dominios globulares
- Ejercicio(s) propuesto(s)
- Predice la estructura secundaria de alguna de
estas secuencias con PSIPRED y/o
JPred
- Comprueba si estas secuencias tienen helices transmembrana, peptidos señal y regiones desestructuradas.
Genera un primer modelo topológico para estas proteínas con esa información.
Día 3
Predicción de estructura tridimensional de proteínas
- Presentación (PDF)
- Servidores de modelado por homología - Cuando la secuencia problema tiene un homologo claro de estructura conocida (molde).
Estos servidores suelen realizar todo el proceso de manera automática, desde la búsqueda del molde hasta la generación del modelo
final (PDB).
- Servidores de reconocimiento de plegamiento (threading, diseño por homología remota) -
Cuando la secuencia problema no tiene un homólogo de estructura conocida.
Generalmente solo reportan el
alineamiento problema/molde y/o un PDB con los C-alfa de del modelo implícito (sin cadenas laterales ni loops). Se pueden usar servidores de modelado por
homología (punto anterior) "forzandolos" con ese alineamiento para generar un modelo final completo (PDB). Tambien se pueden añadir las
cadenas laterales al modelo de C-alfas con Maxsprout (los loop seguirían faltando).
- HHPred - Reconocimiento de homología remota basado en comparaciones de perfiles
HMM para el target y el template (ambos basados en los correspondientes alineamientos multiples).
- 123D+ - Basado en coincidencia de estructura secundaria, perfiles de secuencia
y potenciales de contacto.
- Meta-servidores - Corren varios programas de threading y buscan consenso entre los resultados
- Sistemas híbridos (mini-threading + Ab initio) - Reconocimiento del plegamiento para pequeños fragmentos de la secuencia
cuyas estructuras son luego ensambladas por métodos ab initio.
- Phyre - Muy bueno y facil de usar
- Robetta - Version simplificada del sistema
Rosetta, el mejor sistema para predicción de
estructura de proteínas. Sin embargo requiere registrarse y hay colas de meses para correr las predicciones.
- Localización de dominios estructurales - Sobre todo para los programas de reconocimiento de plegamiento, es muy
importante enviarles por separado los posibles dominios estructurales que pueda haber en nuestra secuencia. A veces estos dominios
se detectan simplemente con
BLAST
(hits en distintas zonas de la secuencia), por los patrones de estructura secundaria y/o otras caracteristicas 1D
(helices transmembrana, regiones desestructuradas, ...), o porque estos dominios ya hayan sido detectados
y anotados en bases de datos como Pfam o
Interpro.
Pero tambien hay servidores específicos.
- Servidores de evaluación de modelos - Evaluan la calidad de modelos 3D según diversos criterios
- Ejercicio propuesto y practicas
- Práctica guiada sobre el uso
de Swissmodel (D. Juan, CNIO).
- Quieres obtener un modelo tridimensional para esta proteína. ¿Se puede hacer por
"modelado por homología"? Si es así genera el modelo usando uno o mas de los servidores listado arriba. Visualiza y evalua
la calidad de los modelos propuestos.
- Y esta otra secuencia, ¿se puede modelar por homología? Si no es así intenta alguno de
los servidores de reconocimiento de plegamiento (threading).
- Como estos servidores pueden tardar bastante tiempo en
enviar los resultados (por email) aquí están los resultados precalculados para algunos de ellos:
FFAS3,
123D+,
Phyre,
3DPSSM,
SPARKS4
- Dada la relativa baja fiabilidad de los programas de threading, se suelen correr varios y buscar coincidencias entre los
resultados. ¿Como se puede comprobar hasta que punto los plegamientos que estan asignando estos programas son similares?
- Vamos a intentar generar un modelo 3D completo para uno de esos modelos de threading "forzando" en SwissModel
este alineamiento propuesto por uno de los programas (FFAS3)
Resultados:
Bibliografía
Florencio Pazos Cabaleiro
Computational Systems Biology Group (CNB-CSIC)
pazos@cnb.csic.es
http://pdg.cnb.uam.es/
Tlf. +34.91.5854669