Hidrofobicidad y antipatía de hidrofobicidad (ej 15)

Hidrofobicidad

La hidrofobicidad es singular porque es una interacción por omisión y consiste en la tendencia de las sustancias no polares a formar clatratos en una disolución acuosa para excluir las moléculas de agua. En concreto, las interacciones entre las moléculas hidrofóbicas favorecen que se produzcan puentes de hidrógeno entre las moléculas de agua desplazadas, resultando así en una disminución de la energía libre del sistema. 

La hidrofobicidad es muy importante en el plegamiento de la proteína. Sin embargo, es difícil establecer un criterio de hidrofobicidad para asignarle un valor de hidrofobicidad a un residuo (ya que solamente se tiene que tener en cuenta la cadena lateral del aminoácido). De esta forma, existen diferentes escalas hidrofóbicas, siendo las que obtienen mejores resultados la escala ALTFT y ALTLS. 

Para todos los cálculos llevados a cabo en el programa desarrollado para esta actividad se puede seleccionar como escala de hidrofobicidad entre las escalas ABODR, ALTFT y ALTLS. Además, permite la entrada de una escala de hidrofobicidad elegida por el usuario (aceptando valores negativos), para lo que es necesario cargar un archivo desde un bloc de notas con la estructura de columnas indicada en la figura 1. Se ha comprobado el funcionamiento mediante la introducción de la escala CHOTH (fichero adjunto). .

Figura 1. Ejemplo de tipo de archivo para la entrada de una nueva escala de hidrofobicidad.

Una parte del programa realizado para esta actividad permite calcular el perfil hidrofóbico según el formalismo básico, un algoritmo que permite llevar a cabo una ponderación de la hidrofobicidad de un residuo, al asignarle como valor de hidrofobicidad la media de la suma de las hidrofobicidades de los residuos colindantes encontrados en el interior de una ventana. Gracias a esta ponderación se puede producir una reducción importante del ruido.

Para esta ponderación se emplea la función formalismo_basico, que permite seleccionar la secuencia de aminoácidos, la escala de hidrofobicidad y la semiventana que se va a utilizar, de manera que todos los parámetros pueden ser controlados por el usuario.

Gracias al uso del programa se puede llevar a cabo la producción de un perfil hidrofóbico. En el eje Y se representa el valor de hidrofobicidad ponderado de cada residuo y en el eje X el número del residuo. Mediante el uso de un tamaño de ventana adecuado (8-9 residuos en el caso de hélices alfa y 3-4 residuos para láminas beta), se puede llevar a cabo una predicción de la asociación de determinados residuos a una estructura secundaria u otra siempre que ésta tenga una hidrofobicidad suficiente como para que esa zona del perfil resulte en un pico distinguible respecto al ruido. Sin embargo, en este caso se parte de una proteína de la cual se conoce su estructura tridimensional y los residuos asociados a cada estructura secundaria, de forma que el estudio se puede centrar en hallar aquellas estructuras secundarias que tienen un alto grado de hidrofobicidad. 

Para realizar el estudio, se llevó a cabo una superposición de la distribución de la estructura secundaria, obtenida de la página PDBSum, del PDB asignado respecto al perfil hidrofóbico obtenido.  Se usó un tamaño de semiventana de 2 para detectar las láminas beta hidrofóbicas y un tamaño de semiventana de 4 para detectar las hélices alfa hidrofóbicas. La variación del tamaño de la semiventana se realiza para ajustarse al tamaño promedio de cada una de las estructuras.

A continuación, se muestran las gráficas con los resultados:
  • El perfil hidrofóbico con un tamaño de semiventana de 2 para el estudio de las láminas beta. Las que han sido asociadas a un pico y, por tanto, se pueden considerar con un alto grado de hidrofobicidad, se encuentran marcadas con una flecha azul. Del total de 13 láminas beta, mediante este estudio, 8 de ellas se pueden considerar hidrófobas.
Figura 2. Asociación de las láminas beta hidrofóbicas mediante comparación de la distribución de estructuras secundarias y el perfil hidrofóbico obtenido con el programa.

  • El perfil hidrofóbico con un tamaño de semiventana de 4 para el estudio de las hélices alfa. Las que han sido asociadas a un pico y, por tanto, se pueden considerar con un alto grado de hidrofobicidad, se encuentran marcadas con una flecha azul. Del total de 10 hélices alfa, mediante este estudio, 5 de ellas se pueden considerar hidrófobas. 


Figura 3. Asociación de las cadenas alfa hidrofóbicas mediante comparación de la distribución de estructuras secundarias y el perfil hidrofóbico obtenido con el programa.

  • Para demostrar que el tamaño de semiventana es muy importante para realizar el estudio, a continuación se muestra una gráfica obtenida con un tamaño de semiventana de 7. Como se puede observar, así es imposible encontrar ningún tipo de asociación. Esto se debe a que un tamaño de ventana tan alto impide que los picos se puedan asociar a una única estructura.
Figura 4. Perfil hidrofóbico obtenido con una semiventana de 7.


Por términos generales, las hélices o láminas asociadas a una alta hidrofobicidad se encontrarán dirigidas hacia el interior de la proteína y no expuestas hacia la superficie, donde estarían en contacto con la disolución. Esto se ha demostrado con la cuarta hélice de la proteína, constituida por los residuos Gln99-Tyr114, que ha sido considerada como hidrófoba en el estudio y que se observa cómo se encuentra hacia el interior de la proteína en la figura 5, obtenida por Rasmol.

Figura 5. Se muestra la cuarta hélice alfa de la proteína, caracterizada como hidrófoba por el estudio, de color negro en la zona interior de la proteína.

Anfipatía de hidrofobicidad

La anfipatía de hidrofobicidad se refiere a la presencia, en una misma estructura, de residuos con grados de hidrofobicidad muy dispares. Es importante destacar que no existe una relación directa entre la hidrofobicidad de una estructura secundaria y su anfipatía de hidrofobicidad, es decir, una estructura muy hidrofóbica no tiene por qué tener un valor de anfipatía elevado, ya que el valor se debe a las diferencias de hidrofobicidad de los residuos.

Para llevar a cabo el estudio de la anfipatía de hidrofobicidad se han desarrollado dos funciones, Stroud y Eisenberg, explicadas en el ejercicio 2, que permiten el cálculo de la intensidad de Stroud y el momento de Eisenberg, respectivamente.

El programa se ha desarrollado de tal manera que el usuario es capaz de seleccionar la secuencia de aminoácidos, la escala de hidrofobicidad, el valor de la semiventana y la distancia angular. 

En este caso, para llevar a cabo el estudio de la anfipatía de una determinada estructura secundaria, hay que ajustar tanto el valor de la semiventana como el valor de la distancia angular. Las hélices alfa se evalúan con un tamaño de semiventana de 4 y una distancia angular de 100, mientras que las láminas beta con un tamaño de semiventana de 2 y una distancia angular de entre 160º y 180º. Después de hacer una evaluación de las distancias angulares, se ha observado que la mejor resolución de picos se consigue con un valor de 160º. Mediante el uso conjunto de estos parámetros se puede tener en cuenta la periodicidad de la estructura secundaria y así estudiar adecuadamente su anfipatía.
  • A continuación se muestra la asociación de las láminas beta que se pueden considerar anfipáticas tras el uso tanto de los momentos de Eisenberg como de las potencias de Fourier de Stroud. En este caso, el espectro de Stroud tiene un nivel de ruido menor. Del total de 13 láminas beta, se pueden considerar 5 de ellas anfipáticas.
Figura 6. Se muestra el estudio de asociación de las láminas beta de la proteína que son anfipáticas. En la gráfica superior se representan los momentos de Eisenberg y en la inferior la intensidad de Stroud.

  • Sin embargo, para el estudio de las hélices alfa no se han conseguido unos resultados que permitan asociar una hélice con un alto grado de anfipatía, ya que existen grandes diferencias entre la gráfica de los momentos de Eisenberg y la de las intensidad de Stroud. Se ha llevado a cabo una variación de la longitud de la semiventana y se muestran los mejores resultados obtenidos (tamaño semiventana 4). En el caso de que se considerara una única gráfica, sí se podrían llevar a cabo asociaciones, pero no serían válidas según la otra gráfica. Debido a esto, no se ha realizado la asociación usando una única gráfica.

Figura 6. Se muestra la asociación de las cadenas alfa de la proteína que son anfipáticas. En la gráfica superior se representan los momentos de Eisenberg y en la inferior la intensidad de Stroud.

Aunque no se va a representar ninguna imagen de una estructura anfipática de la proteína para observar su localización, esta anfipatía se puede encontrar en muchas situaciones diferentes, como las de los siguientes ejemplos:
  • Una proteína de membrana que da lugar a la formación de un poro. Las hélices alfa que se encuentren formando el poro van a tener una cara hacia el poro con un alto grado de polaridad y una cara hidrofóbica hacia el interior de la membrana. De esta forma, van a tener un grado de anfipatía elevado.
  • Una lámina beta o hélice alfa que se encuentre expuesta hacia la superficie de la proteína puede tener una cara polar, expuesta, y una cara hidrofóbica hacia el interior. De manera que el grado de anfipatía es también elevado.

Uso de bases de datos (ej 3)

En esta actividad se llevó a cabo la búsqueda del término pp1 holoenzyme en distintas bases de datos con el objetivo de comparar y analizar los resultados de búsqueda obtenidos en cada una de ellas. Además, se va a llevar a cabo una comparación de los formatos PDB, UniProt, GenPept y FASTA. 

Protein Data Bank (PDB)

El PDB es un repositorio de información de las estructuras tridimensionales tanto de proteínas como de ácidos nucleicos.[1] El PDB permite tanto la búsqueda de estos datos como el análisis y la visualización de los resultados.[1]

Al realizar la búsqueda en el PDB del término pp1 holoenzyme, solamente se muestran tres resultados. Todos estos resultados se refieren a la subunidad catalítica PP1-alfa unida a dos subunidades reguladoras distintas:


  • Uno de los resultados es el PDB asignado, que se corresponde a la holoenzima formada al unirse al inhibidor NIPP1. 
  • Los otros dos resultados se corresponden a las dos formas del cristal utilizado para el análisis de la estructura tridimensional por difracción de rayos X de la subunidad catalítica unida a la subunidad reguladora 10 de PP1 (de Rattus norvegicus).
Sin embargo, la secuencia primaria correspondiente a la subunidad catalítica alfa de estos 3 PDB es la misma. 


Al hacer una búsqueda por similaridad en la secuencia de aminoácidos con un cutoff del 95% se han obtenido un total de 27 cadenas que se corresponden a distintos PDB de las subunidades catalíticas alfa y gamma de PP1 de humano y de Mus musculus. 

La secuencia primaria del PDB se puede extraer cómo se ha realizado en las actividades anteriores por análisis de todos los átomos del PDB. Sin embargo, el propio PDB recoge la secuencia primaria de la proteina en el campo SEQRES. En este campo se recoge la secuencia de aminoácidos en líneas formadas por trece aminoácidos en código de tres letras. Además, en cada línea se indica su número, la cadena polipeptídica a la que pertenece y el número total de aminoácidos de esa cadena.

Un ejemplo de la primera línea del PDB asignado es:


SEQRES   1 A  306  GLY HIS MET GLY SER LEU ASN LEU ASP SER ILE ILE GLY          

Universal Protein Resource (UniProt)

UniProt es un recurso muy extenso para secuencias de proteínas.[2] Dentro de las bases de datos de UniProt cabe destacar UniProt Knowledgebase (UniProtKB), que recoge una gran cantidad de datos sobre información funcional de proteínas[3] y permite llevar a cabo búsquedas de una gran cantidad de información, desde secuencias de aminoácidos hasta datos taxonómicos de una proteína.

La búsqueda de pp1 holoenzyme en UniProtKB dio lugar a un total de 27 resultados de proteínas que se encuentran en distintos organismos y ninguno de ellos se corresponde con la holoenzima de pp1. Algunos de los resultados se refieren a la subunidad reguladora 14B y a la subunidad catalítica 2A de pp1 encontradas en distintos organismos (Mus musculus, Homo sapiens, Rattus norvegicus). Mientras que otros resultados son proteínas tan dispares como el factor de unión 3 de la interleuquina o la serina/treonina proteína quinasa del protooncogen RAF. 

Al realizar la búsqueda de pp1 se obtiene un total de 3.859 resultados. La mayoría de los resultados mostrados en las primeras páginas se refieren a distintas subunidades reguladoras y catalíticas de PP1 encontradas en distintos organismos.

No se ha encontrado el archivo de UniProt característico de la holoenzima asignada, pero sí se ha encontrado el archivo que se refiere a la subunidad catalítica alfa de PP1. La secuencia de aminoácidos de ambos archivos difiere al principio de la secuencia, ya que el archivo PDB no tiene los seis primeros residuos, y al final de la secuencia, ya que el archivo PDB tampoco contiene los aminoácidos finales. Así, el número de aminoácidos del archivo de UniProt contiene un total de 330 aminoácidos, mientras que el archivo PDB tiene un total de 306 aminoácidos.

En el formato de esta base de datos, la secuencia de aminoácidos se encuentra al final del archivo tras una línea de la que caben destacar las siguientes columnas:
  • Dos cadenas de caracteres 'SQ' y 'SEQUENCE' que especifican que a continuación se muestra la secuencia de aminoácidos.
  • El número de aminoácidos.
  • El peso molecular de la proteína.
A continuación se muestra un ejemplo de este tipo de línea:

SQ   SEQUENCE   330 AA;  37512 MW;  60C37E1AD9831DAC CRC64

A partir de la línea recién descrita se encuentra la secuencia de aminoácidos en grupos de 10 aminoácidos separados por un espacio, como se puede observar en el siguiente ejemplo:

MSDSEKLNLD SIIGRLLEVQ GSRPGKNVQL TENEIRGLCL KSREIFLSQP ILLELEAPLK

National Center for Biotechnology Information (NCBI)

El NCBI almacena y actualiza constantemente una gran cantidad de información referente a secuencias genómicas, artículos científicos u otros datos biotecnológicos de interés. En concreto, para el estudio de proteínas presenta la base de datos Protein formada por una gran colección de secuencias de proteínas procedentes de traducciones de regiones codificantes de otras bases de datos como GenBank y de registros procedentes de bases de datos como SwissProt. 

Al realizar la búsqueda de pp1 holoenzyme en la base de datos Protein se obtuvieron un total de 86 resultados entre los que se incluyen como resultados únicos las distintas cadenas polipeptídicas que se ven englobadas en un mismo PDB.

Aunque se pueden descargar las secuencias en otros formatos, el que emplea esta base de datos es el formato GenPept, donde la secuencia de aminoácidos se encuentra al final del archivo tras una línea denominada 'ORIGIN'. 

La estructura de las líneas que definen la secuencia de aminoácidos es la siguiente:
  • El número del primer aminoácido de la línea.
  • La secuencia de aminoácidos en grupos de 10 aminoácidos en formato de una letra separados por un espacio.
Un ejemplo de esta estructura:

        1 ghmgslnlds iigrllevqg srpgknvqlt eneirglclk sreiflsqpi lleleaplki

Formato FASTA

Todas las bases de datos comentadas anteriormente permiten descargar la secuencia de aminoácidos de la proteína en este formato. 

En este formato se observan dos partes bien diferenciadas:
  • La primera línea, donde se indica el número de acceso, el nombre en el PDB y el título del archivo.
  • En el resto del archivo se muestra la secuencia de aminoácidos de la proteína en código de una letra y sin espacios.
Un ejemplo de esta estructura:

GHMGSLNLDSIIGRLLEVQGSRPGKNVQLTENEIRGLCLKSREIFLSQPILLELEAP

Bibliografía


Predicción puentes disulfuro (ej 14)

Para la realización de esta actividad se ha desarrollado un programa que es capaz de predecir entre qué residuos de cisteína se producen puentes disulfuro. Para la predicción se lleva a cabo un cálculo de las distancias existente entre todos los átomos de azufre de todas las cisteínas de la proteína. Se establece un valor umbral de manera que, si la distancia es menor de ese valor, se considera que se produce un puente disulfuro entre estos residuos. Mediante el estudio del campo 'SSBOND' de distintos PDB, donde se indica la distancia existente entre los residuos de cisteína que participan en el enlace, se ha determinado que el valor umbral adecuado es de 2.1 angstrom. 

Mediante este procedimiento tan sencillo se ha conseguido predecir el 100% de los enlaces disulfuro intra e intercatenarios del PDB adjudicado y las otras cinco proteínas que se han analizado (2QWQ, 2YK1, 2ZUP, 4INS, 9WGA). 

A continuación se muestran los resultados devueltos por el programa:

Proteína asignada (3V4Y)

Según el PDB, no tiene ningún enlace disulfuro.

Figura 1. Resultado de la predicción producida por el programa para 3V4Y.

 2QWQ

Según el PDB, se forma un único puente disulfuro entre el residuo 171 de la cadena 'A' y el residuo 876 de la cadena 'B'. 

Figura 2. Resultado de la predicción producida por el programa para 2QWQ.

 2YK1

Según el PDB, se forman los siguientes puente disulfuro:
  • Entre los residuos 22 y 92 de la cadena H.
  • Entre los residuos 140 y 196 de la cadena H. 
  • Entre los residuos 23 y 88 de la cadena L.
  • Entre los residuos 134 y 193 de la cadena L.
Figura 3. Resultado de la predicción producida por el programa para 2YK1.

2ZUP

Según el PDB, se forman los siguientes puente disulfuro:
  • Entre el residuo 30 de la cadena A y el residuo 104 de la cadena B.
  • Entre los residuos 41 y 44 de la cadena B.

Figura 4. Resultado de la predicción producida por el programa para 2ZUP.

4INS

Según el PDB, se forman los siguientes puentes disulfuro:
  • Entre los residuos 6 y 11 de la cadena A.
  • Entre el residuo 7 de la cadena A y el residuo 7 de la cadena B.
  • Entre el residuo 20 de la cadena A y el residuo 19 de la cadena B.
  • Entre los residuos 6 y 11 de la cadena C.
  • Entre el residuo 7 de la cadena C y el residuo 7 de la cadena D.
  • Entre el residuo 20 de la cadena C y el residuo 19 de la cadena D.
Figura 5. Resultado de la predicción producida por el programa para 4ins.

12GS

Según el PDB, no tiene ningún puente disulfuro.

Figura 6. Resultado de la predicción producida por el programa para 12GS.


Mutación Phe por Tyr (ej 13)

El programa desarrollado permite realizar el reemplazamiento de la primera fenilalanina del PDB por una tirosina. A continuación se comenta cómo se ha realizado este programa:

  • La diferencia entre la fenilalanina y la tirosina es la presencia en ésta última de un átomo de oxígeno unido al CZ del residuo. Para calcular qué posición tendría este átomo en la proteína, primero se calculó la distancia media que existe entre el CZ y el oxígeno en las tirosinas de la proteína. A continuación, se tuvo en cuenta la coplanaridad del anillo para calcular la dirección y el sentido del vector que hay que sumar a las coordenadas de CZ para obtener las coordenadas del oxígeno. Finalmente, se sumó al CZ un vector con la dirección y sentido del vector formado desde el CG al CZ. 

Figura 1. Fenilalanina y la nomenclatura de sus átomos.

  • Se llevó a cabo la modificación de los campos de los átomos de la fenilalanina para que sean reconocidos como átomos de la tirosina en el Rasmol.
  • Se introdujeron todos los campos del nuevo átomo de oxígeno para que fuera reconocido como átomo de la tirosina en el Rasmol.
  • El programa permite guardar la proteína sin mutar y mutada y los comandos adecuados para después observar este aminoácido y su entorno antes de realizar la mutación y después. Así, se puede llevar a cabo una evaluación de las distorsiones estéricas producidas por este cambio.


A continuación se muestran una serie de parejas de imágenes (figura 1) del entorno con el cambio realizado o no, obtenidas gracias al uso del programa desarrollado.

Figura 1. Observación del entorno del residuo antes (A) y después (B) de la modificación.

Aunque en algunas imágenes puede parecer que el átomo de oxígeno introducido puede causar impedimentos estéricos importantes, el átomo más próximo al átomo de oxígeno se encuentra a 2.925 angstrom (calculado con set picking distance de Rasmol). Teniendo en cuenta que para la formación de un puente disulfuro es necesaria una distancia de en torno a 2 angstrom, un valor más elevado, se podría decir que la introducción del átomo de oxígeno no va a producir cambios estructurales importantes en la proteína.


Alineamiento de estructuras (RMSD) (ej 12)

Un alineamiento estructural consiste en un tipo de alineamiento basado en la comparación de la forma tridimensional El objetivo de estos alineamientos consiste en establecer la equivalencia entre dos o más estructuras según su forma y conformación tridimensional.[1]

Un parámetro importante en este tipo de alineamiento es el RMSD (Root Mean SquareDeviation o desviación de la media cuadrática), que es una distancia media cuadrática mínima entre las estructuras básicas de las proteínas superpuestas.[1] Este valor RMSD puede ser utilizado para estudiar el grado de divergencia de las estructuras alineadas. A mayor valor RMSD, mayores son las diferencias. 

Este parámetro se ha utilizado para comparar el grado de homología estructural de las tres primeras cisteínas del PDB asignado. 

Para ello, el programa lleva a cabo un cálculo de las distancias internas existentes entre todos los átomos que las forman y crea una tabla con estas distancias. A continuación, se lleva a cabo una comparación de las tablas de distancias internas entre las tres cisteínas y se realiza el cálculo del valor RMSD según la siguiente fórmula:


Siendo d1i-j la distancia entre los átomos i-j de la primera cisteína, d2i-j la distancia entre los átomos i-j de la segunda cisteína y n el número de distancias internas que se están teniendo en cuenta.  

Los resultados obtenidos se muestran en la tabla 1. El valor de RMSD más elevado se produce entre la segunda y la tercera cisteína. 

Tabla 1. Valores de RMSD calculados por el programa.

Si se realiza una comparación de las cisteínas en Rasmol (figura 1), se pueden comprobar los resultados obtenidos por el RMSD. Aunque no ha sido posible obtener unas imágenes en Rasmol que permitan llevar a cabo una valoración visual más precisa, por la posición relativa del átomo disulfuro respecto al resto de carbonos, se puede observar como la mayor diferencia se encuentra entre las cisteínas 2ª y 3ª, al igual que indica el valor de RMSD, y como la primera y la segunda cisteína son muy parecidas.

Figura 1. Representación tridimensional de las tres primeras cisteínas del PDB asignado.



[1] Alineamiento de estructuras. 
http://www.marcoregalia.com/STUFF/UDISTRITAL/Bioinformatica/Actividades/Resumenes%20Clases/alineamientoEstruct.html

Proyección de los carbonos alfa (ej 11)

El programa desarrollado para esta actividad es capaz de proyectar en el plano XY (siendo el eje Z el perpendicular al plano "o a la pantalla") de los diez primeros carbonos alfa de una proteína y, a continuación, se hacen las transformaciones necesarias para alinear el primer y el décimo carbono en el eje Z, en el origen de coordenadas del plano XY. Todas las transformaciones necesarias para llevar a cabo esto se aplican a todos los carbonos. Por último, el resultado de las transformaciones se puede comprobar en Rasmol, desde el propio programa desarrollado.

Hay que mencionar que todas las funciones se han desarrollado en base a una librería (dynmatrix) que permite operar con matrices con facilidad.

El programa se ha desarrollado de tal manera que se puede observar cada una de las transformaciones por pasos. Aprovechando esta característica del programa, se van a comentar las transformaciones necesarias junto a los resultados obtenidos con el PDB asignado:

  • El primer paso consiste en trasladar el primer átomo de carbono hasta el origen de coordenadas. Esto se lleva a cabo gracias a la función traslacion (en la librería BioTools), que tiene en cuenta las coordenadas del primer carbono para hallar cuál es la variación en cada una de las dimensiones necesaria para llevarlo hasta el origen de coordenadas. El resultado del primer paso se muestra en la figura 1.
Figura 1. Representación en el plano XY de los diez primeros carbonos alfa tras la primera transformación del programa.

  • El segundo paso consiste en una rotación en torno al eje X hasta que el primer y el último carbono alfa se encuentran en el plano XZ. La función empleada es rotacionX (en la librería BioTools), que realiza la rotación de los carbonos respecto al eje X hasta que el eje (parámetro de entrada), formado por el primer y el último carbono, está contenido en el plano XZ. El resultado del segundo paso se muestra en la figura 2.
Figura 2. Representación en el plano XY de los diez primeros carbonos alfa tras la segunda transformación del programa

  • Por último, se hace una rotación en torno al eje Y hasta que el primer y el último carbono se encuentren justo en el origen de coordenadas, consiguiendo así el alineamiento buscado. La función empleada es rotacionY (en la librería BioTools), que realiza la rotación de los carbonos respecto al eje Y hasta que el eje (parámetro de entrada), formado por el primer y el último carbono, coincide con OZ. El resultado del tercer y definitivo paso se muestra en la figura 3. 

Figura 3. Representación en el plano XY de los diez primeros carbonos alfa tras la tercera transformación del programa


Además, como se ha comentado anteriormente, el programa permite llamar a Rasmol para comprobar que la transformación se ha llevado a cabo adecuadamente. En el caso del PDB asignado, el resultado ha sido exitoso (figura 4).

Figura 4. Representación en Rasmol de los resultados obtenidos. A la izquierda se muestra la representación con el primer átomo y el último carbono en el eje perpendicular al plano de la pantalla. A la derecha se muestra una visión lateral.


Esterodiagrama (ej 10)

Para la realización de la actividad se han desarrollado un conjunto de funciones, incluidas en la librería BioTools y comentadas en la actividad 2, que permiten calcular las coordenadas transformadas de cualquier átomo a partir de las coordenadas originales en formato TPunto. Las funciones permiten llevar a cabo las siguientes transformaciones: traslación, rotación en torno a un eje deseado, la rotación frente al eje X, Y o Z y el escalamiento de las coordenadas de un átomo.

En concreto, para la realización del estereodiagrama se ha desarrollado un programa que representa en Rasmol una región de 3.5 angstrom en torno al primer residuo de fenilalanina del fichero PDB asignado, antes y después de llevar a cabo una rotación de 5 ó -5º en torno al eje Y (a elección del usuario, que puede necesitar la rotación un ángulo u otro). Esta rotación da lugar a dos imágenes que, observadas de forma conjunta, dan lugar a una visualización en la que se aprecia cierta tridimensionalidad.

La imagen resultante del programa es la siguiente:

Figura 1. Esteriodiagrama obtenido. La imagen A consistiría en la representación de la región de la primera fenilalanina del PDB asignado sin rotar y la imagen B representa la misma región rotada -5º en torno al eje Y.


Representación de Ramachandran (ejercicio 9)

En el programa desarrollado para esta actividad se han implementado tres funcionalidades. Para lograrlas ha sido necesario desarrollar un conjunto de funciones, incluidas en BioTools, que permiten calcular de forma automática las distancias interatómicas, los ángulos de enlace y los ángulos de torsión a partir de las coordenadas, en TPunto, obtenidas desde un TPDB. Además, se han desarrollado otras dos funciones que permiten modificar una tabla de datos y representarla en un gráfico. 

Calculadora

Permite introducir los átomos del PDB que se deseen y permite seleccionar entre realizar el cálculo de las distancias intermoleculares, el ángulo que forman tres átomos (siendo uno de ellos el central) o el ángulo de torsión formado por cuatro átomos. 

Se ha comprobado que la calculadora obtiene una muy buena aproximación a los resultados esperados obtenidos con Rasmol, aunque con variaciones en los decimales.

Comprobación de la corrección de los cálculos

Se ha introducido una tabla en la que se muestran los valores de los ángulos de torsión Phi y Psi esperados (calculados con set picking torsion de Rasmol) de los 5 primeros residuos de la proteína y, por otro lado, se calculan estos mismos ángulos de torsión con las funciones desarrolladas. 

Como se puede observar en la siguiente imagen extraída del programa (figura 1), los valores de los ángulos son muy parecidos a los calculados con Rasmol, aunque con diferencias del orden de décimas o de centésimas.


Figura 1. Comparación de los ángulos de torsión de los 5 primeros residuos de la proteína calculados con Rasmol (esperado) y el programa desarrollado (calculado).

Ramachandran

En una proteína, los enlaces entre el N y el C alfa y el C alfa con el C del esqueleto son relativamente libres de rotar.[1] Los ángulos de torsión Phi y Psi describen estas rotaciones del esqueleto del polipéptido. En concreto, el ángulo Phi describe la rotación entre el N y el C alfa, mientras que el ángulo Psi describe la rotación entre el C alfa y el C del esqueleto.[2] Sin embargo, hay determinadas combinaciones de ambos ángulos no permitidas debido a que pueden resultar en importantes impedimentos estéricos. 

La representación de Ramachandran permite observar las regiones permitidas y no permitidas de la combinación de ambos ángulos. Esto es en muchas ocasiones utilizado como indicador de la calidad de la estructura tridimensional obtenida.[2] Además, los ángulos de torsión son uno de los parámetros estructurales más importantes para controlar el plegamiento de las proteínas hasta el punto de que se postula que siendo capaces de predecir estos ángulos para una proteína particular, sería posible predecir su plegamiento en tres dimensiones. La razón es que estos ángulos aportan la flexibilidad necesaria para que el esqueleto del polipéptido adopte un determinado plegamiento.[2]

En este programa se han calculado todos los ángulos de torsión de la proteína y se han representado según el diagrama de Ramachandran. Antes de comentar los resultados, la comprobación de que el diagrama obtenido con el programa es correcto, se ha comparado con el creado gracias a la herramienta online Rampage: Assessment of the Ramachandran Plot, que permite introducir la proteína de interés en formato PDB y devuelve el diagrama de Ramachandran. Como se puede apreciar en la siguiente imagen, la distribución de los puntos en ambos diagramas de Ramachandran es idéntica, de manera que se puede confirmar que el programa funciona correctamente.


Figura 2. A la izquierda se muestra el diagrama de Ramachandran obtenido con la herramienta online y a la derecha el obtenido con el programa desarrollado.

Además, esta herramienta online permite evaluar la calidad de la estructura tridimensional e indica que en este caso todas las combinaciones de ángulos se encuentran en la región favorecida o permitida.

Se ha realizado una búsqueda de las regiones del diagrama que se corresponden a una determinada estructura secundaria (figura 3)[3] y al superponer con el diagrama obtenido por el programa, se puede observar como la mayor parte de los residuos se encuentran formando hélices alfa. Este resultado concuerda con la estructura tridimensional de la proteína, que es predominantemente alfa. También se observa un porcentaje elevado de láminas beta, lo que también concuerda con la estructura tridimensional resuelta de la proteína.

Figura 3. Correspondencia de los ángulos de torsión con el tipo de estructura secundaria del que forma parte el residuo.[3] 

De hecho, esta proporción de los residuos que forman parte de un tipo de estructura secundaria u otro se puede observar que es muy parecido al predicho con el gráfico de distribución de estructuras secundarias obtenido en PDBSum (figura 4).

 Figura 4. Gráfico de distribución de la estructura secundaria de la proteína obtenido en PDBSum.[4] 

El programa se ha desarrollado de tal manera que permite la representación del diagrama de Ramachandran de varias proteínas a la vez. Así, se ha representado sobre el diagrama del fichero PDB asignado otro fichero PDB (4moy) diferente correspondiente a la misma proteína (holoenzima PP1) para comprobar si hay variaciones importantes en la distribución de los ángulos. 

El resultado se muestra en la figura 5. Como se puede observar, la distribución de ángulos es muy similar, aunque existen pequeñas diferencias. A grandes rasgos, parece que la distribución de estructuras secundarias entre ambas proteínas es muy parecida. De hecho, si se toma la distribución de 4moy de PDBSum y se compara con la del PDB asignado, ambas son idénticas (figura 6)


 Figura 5. Diagramas de Ramachandran del PDB asignado (amarillo) y de 4moy (azul).


 Figura 6. Comparación de la distribución de las estructuras secundarias del PDB asignado (arriba) y de 4moy (abajo).

Bibliografía

[1] Ramachandran Plot. 
http://www.cryst.bbk.ac.uk/PPS95/course/3_geometry/rama.html

[2] Torsion Angles and the Ramachandran Plot. 
http://www.proteinstructures.com/Structure/Structure/Ramachandran-plot.html

[3] The Three-Dimensional Structure of Proteins.
http://www.bioinfo.org.cn/book/biochemistry/chapt07/171.jpg


Conectividad del primer residuo de F (ej 8)

Para la realización de este ejercicio se ha utilizado un objeto tipo TProcess que permite hacer una llamada desde el programa desarrollado a Rasmol. Además, el programa es capaz de cargar la proteína de interés en Rasmol y crear y guardar una serie de comandos que permiten visualizar la los átomos que se encuentran a una distancia menor a 5 angstrom de la fenilalanina. De manera que se observa la Phe en la posición central y los átomos que la rodean en una esfera de 5 angstrom de radio. 

Tanto el archivo de la proteína como los comandos son guardados por el programa y es necesario indicar qué Rasmol se desea abrir. Solamente se ha conseguido que este programa sea capaz de abrir el Rasmol 2.7.1. que se encuentra adjunto al cuaderno de actividades. 

Se ha comprobado el correcto funcionamiento del programa y a continuación se muestran las imágenes obtenidas.

Figura 1. Las imágenes obtenidas con Rasmol tras el uso del programa desarrollado. Los átomos que se muestran han sido seleccionados por el comando creada por el programa al llamar a Rasmol.

Factores de temperatura (ej 7)

Para la realización de este ejercicio se ha implementado la función writePDB que permite la escritura de todos los campos que definen a un átomo en un PDB con la misma estructura de texto. Como resultado devuelve un texto en formato TStrings que se puede introducir en un memo para después guardarlo en un archivo que puede ser leído e interpretado por Rasmol.

En concreto, el programa desarrollado lleva a cabo la creación de un archivo donde se recogen todos los campos que caracterizan a los carbonos alfa de la proteína y permite guardarlos en un archivo. A continuación, lleva a cabo la creación de los comandos necesarios para que Rasmol represente estos carbonos alfa en modo spacefill y estén coloreados según sus factores de temperatura. El propio programa es capaz de llamar a Rasmol y producir la apertura de la proteína junto a los comandos de interés.

Los factores de temperatura, también llamados factores B, describen el desplazamiento de las posiciones atómicas respecto al valor de la media. Cuanto más flexible sea este átomo, mayor será su desplazamiento respecto a la media. Normalmente, las áreas de la proteína que tienen unos mayores valores de factor B se corresponden a regiones con una alta flexibilidad en su estructura tridimensional.[1] En la mayoría de los programas, como en Rasmol, un factor de temperatura elevado está asociado a un color rojo y un factor de temperatura bajo al color azul, mientras que los factores intermedios se encuentran en una gama entre ambos colores. 

Todas las proteínas presentan una flexibilidad inherente que les permite llevar a cabo su función gracias a la interacción con otras moléculas u proteínas.[2] Generalmente, la interacción entre una proteína y una molécula se produce por aquellas regiones en las que la flexibilidad es mayor. Sin embargo, como se va a observar en este ejercicio, esta interacción no es siempre en las zonas más flexibles de la proteína. 

Debido a que, como se ha comentado en la revisión bibliográfica, la regulación de la especificidad y localización de la proteína de estudio es llevada a cabo principalmente a través de la interacción con una serie de subunidades reguladoras, un estudio de los factores de temperatura de la proteína asignada puede ser muy interesante.

La imagen resultante al ejecutar el programa se muestra en la figura 1. La distribución de los factores de temperatura de la figura 1A muestra que la parte superior de la figura tiene un grado de flexibilidad muy bajo, mientras que la parte inferior tiene un grado de flexibilidad mayor, con tres protuberancias en los que la flexibilidad es aún mayor. Esta mayor flexibilidad podría indicar que son las zonas en las que se produce la interacción, que son zonas con menos restricciones al estar expuestas hacia el exterior o tener otra función que aún se desconoce. Para comprobar si se corresponden con zonas de interacción con otras moléculas ya descritas, se va a realizar una comparación con los residuos encontrados en la bibliografía que participan en la interacción con subunidades reguladoras.


Figura 1. Representación de la proteína en Rasmol obtenida a través del programa desarrollado. La figura B es una imagen de la visualización desde abajo de la figura A.


El extremo protuberante formado por los aminoácidos Asn271-Asp277, que ha sido asociado a la interacción con subunidades reguladoras, tiene un factor de temperatura elevado, como se muestra en la figura 2. Esto quiere decir que para que la interacción se produzca,debe haber un ajuste de la posición de los átomos de la proteína (modelo del ajuste inducido).

Figura 2. En la figura A se representan todos los carbonos alfa coloreados según su factor de temperatura, mientras que en la figura B se han destacado los carbonos alfa de Asn271-Asp277. Como se puede observar, están asociados a factores de temperatura elevados.

Sin embargo, esta asociación no se ha encontrado en el caso de la hendidura de unión al motivo RVxF, que participa en la interacción con subunidades reguladoras como NIPP1 o MYPT1. En este caso, los átomos de la hendidura no tenían un factor de temperatura elevado, como se puede observar en la figura 3. Esto podría indicar que la distribución de átomos de átomos de la hendidura de unión al motivo RVxF y el motivo RVxF se ajusta perfectamente y no es necesaria la flexibilidad de esta zona. De esta forma, se ajustaría mejor al modelo llave-cerradura. 


Figura 3. En la figura A se representan todos los carbonos alfa coloreados según su factor de temperatura, mientras que en la figura B se han destacado los carbonos alfa de la hendidura de unión al motivo RVxF. Como se puede observar, están asociados a factores de temperatura bajos.


El mismo resultado se ha encontrado en los residuos que interactúan con la hélice alfa de NIPP1. De hecho, estos residuos se encuentran en la zona más estática de la proteína, como se puede observar en la figura 4.

Figura 4. En la figura A se representan todos los carbonos alfa coloreados según su factor de temperatura, mientras que en la figura B se han destacado los carbonos alfa que interaccionan con la hélice alfa de NIPP1. Como se puede observar, están asociados a factores de temperatura bajos.


Lo mismo ocurre con los átomos del bolsillo hidrofóbico de PP1 que interactúa con los residuos del extremo C-terminal de NIPP1, los residuos asociados tienen unos factores de temperatura muy bajos, como se puede observar en la figura 5.



Figura 5. En la figura A se representan todos los carbonos alfa coloreados según su factor de temperatura, mientras que en la figura B se han destacado los carbonos alfa del bolsillo hidrófobico de PP1 que interaccionan con el extremo C-terminal de NIPP1. Como se puede observar, están asociados a factores de temperatura bajos.


Bibliografía


[1] The Protein Databank (PDB): File Format and Content

[2]  Teilum, K., Olsen, J. G. & Kragelund, B. B. Functional aspects of protein flexibility. Cell. Mol. Life Sci. 66, 2231–47 (2009).