Desarrollar una
función biotools (que denominaremos writePDB) que permita reconstruir una línea de
texto con el formato correcto de una línea ATOM de un PDB. Emplear esta función
para escribir un programa que genere un fichero PDB, a partir de una estructura
TPDB previamente importada, que contenga solamente los carbonos alfa de la
proteína. Comprobar que el fichero *.pdb
creado puede ser visualizado con RASMOL (u otro visor equivalente) y crear a
partir de él una imagen GIF del esqueleto covalente de la proteína en modo spacefill, coloreada según sus factores
de temperatura. Identificar, sobre esta imagen, los residuos más desordenados
de la proteína y elaborar finalmente un breve informe sobre su localización en
la estructura.
Para esta actividad se ha desarrollado una
aplicación en Pascal denominada actividad_7.exe,
cuya interfaz aparece en la Figura 1.
Este programa posee tres partes claramente diferenciadas, correspondientes con
tres procedimientos distintos:
- Al botón “Cargar Proteína” se ha asociado el código necesario para que se cargue en un objeto Memo el fichero *.pdb correspondiente, la ruta de este fichero en un objeto Edit y que la información contenida en este quede organizada en un TPDB.
- Al botón “Ver Cα” se ha asociado un código necesario para que a partir de la representación interna de la proteína en forma de TPDB se genere la línea ATOM de un fichero *.pdb valida que contenga solo los carbonos α de la proteína. Por otro lado, también permite guardar este fichero en el directorio deseado con la extensión .pdb.
- Al botón “Ver en RasMol” se le ha asociado el algoritmo necesario para visualizar el nuevo fichero generado en el paso anterior en modo Spacefill, con los átomos coloreados según sus factores de temperatura, utilizando la función ejecutar de la librería biotools, que se comenta con mayor profundidad en la Actividad 8.
Para generar la línea ATOM de un fichero *.pdb primero tenemos que tener en cuenta cómo está organizada la información en esta línea (Figura 2).
![]() |
Figura 2: Organización de la información contenida en el campo ATOM en un fichero *.pdb [2]. |
Esta información aparece ordenada siguiendo un encolumnado muy riguroso que debe ser respetado para que los programas que van a utilizarla puedan interpretarla de la manera adecuada. Por ello, para generar esta línea ordenada para cada carbono α de la L-DOPA descarboxilasa humana en la forma de apoenzima (apoDDC humana) se han creado dos funciones en la librería biotools:
- alinear: el primer problema con el que podemos toparnos es que independientemente del número de letras que contengan los datos que tienen que aparecer en cada una de las columnas de una línea ATOM, el encolumnado tiene que respetarse. Esto quiere decir que cuanto menor sea el número de letras que ocupa un dato, mayor tiene que ser el número de espacios en blanco que lo separa del siguiente dato, de modo que la suma de los caracteres en blanco y de los caracteres que componen este dato permanezca constante. Por otro lado, algunas columnas tienen que encontrarse justificadas a la izquierda y otras a la derecha. Estos dos problemas se solventan con esta función, que requiere los siguientes argumentos:
- Una cadena de caracteres (tipo string), que contiene los datos que se quiere ajustar al encolumnado de la línea ATOM.
- Una variable de tipo entero mediante la que se especifica el número de caracteres que debe ocupar esta columna, incluyendo los caracteres ocupados por la cadena introducida y los caracteres en blanco que hay que introducir para ajustar el encolumnado.
- Una variable de tipo string que indica si la cadena tiene que justificarse a la derecha o a la izquierda. Este parámetro no es obligatorio introducirlo y por defecto la cadena se justifica a la derecha, aunque si se cambia su valor a ‘izquierda’ entonces la cadena se justifica a la izquierda.
- Por último, la salida de la función es de tipo string.
- writePDB: esta función requiere como argumento un TAtomPDB, el tipo del campo atom[i] de un TPDB, donde i es un átomo cualquiera de la proteína, y devuelve una cadena de caracteres (tipo string) consistente en la línea ATOM del átomo i. En esta función también hay que tener en cuenta ciertas cosas para que se respete el encolumnado de la línea ATOM. Por ejemplo, en ocasiones hay que añadir espacios en blanco entre dos columnas, pero lo más crítico es el hecho de que las coordenadas atómicas tienen que expresarse siempre con tres cifras decimales, independientemente de si estos son ceros o no. Esto también ocurre con el factor de temperatura de cada átomo, que tiene que representarse con dos cifras decimales. Para solventar este problema se utiliza la función de Pascal formatfloat, que requiere dos argumentos. El primero es una cadena en la que se especifica el formato de salida (de tipo string también) que queramos del valor introducido en el segundo argumento.
Para observar el nuevo fichero generado en RasMol con el esquema Spacefill y el modelo de color Temperature se ha escrito un pequeño script que pueda ser interpretado por RasMol (Figura 4) [4] y el resultado aparece representado en la Figura 5. Este modelo de color se basa en el factor de temperatura o factor-B de cada átomo, consistente en el desplazamiento de sus coordenadas atómicas de la posición media determinada [5]. Esto se traduce en que un valor elevado de factor de temperatura, representado en RasMol mediante colores cálidos, indica que esta región de la proteína es más flexible que otra región con un menor factor de temperatura (representado en RasMol con colores fríos).
![]() |
Figura 4: script con las instrucciones para representar el fichero calpha.pdb en RasMol con el esquema Spacefill y el modelo de color Temperature.
|
![]() |
Figura 5: Representación de los carbonos α de la apoDDC humana mediante el esquema Spacefill y el modelo de color Temperature.
|
Es frecuente que la interacción entre un
ligando y una proteína ocurra a través de los residuos más flexibles y, por
tanto, con un mayor factor de temperatura. En la Figura 6 se han señalado los carbonos α de los residuos que forman
parte del centro activo de la cadena A de la DDC humana. Estos aparecen
fundamentalmente en verde-amarillento, salvo los residuos aspartato 271 y
treonina 246, que aparecen de un tono más azulado. El color verde-amarillento
indica que efectivamente la posición de estos átomos es variable, tal y como
cabría esperar y como se ha visto en la actividad 1 cuando se analizaron los 5
estados conformacionales en los que se puede encontrar el centro activo. Sin
embargo, existen zonas más flexibles en la proteína.
En las actividades 1 y 6 hemos visto que la
interacción entre la subunidad A y la B se produce a través del bucle 1 (residuos
del 66 al 84) de la subunidad A y los bucles 2 (residuos del 300 al 310) y 3 (residuos
del 323 al 357) de la subunidad B y en especial se ha comentado que al bucle 3
se le conoce como bucle flexible, debido a que está implicado en el cambio
conformacional de la proteína cuando pasa de forma apo- a holo-. Además, el
bucle 1 de la subunidad B también interacciona con los bucles 2 y 3 de la
subunidad A. La Figura 7 muestra el
factor de temperatura de estos bucles. Como cabría esperar, se trata de zonas
muy flexibles de la proteína, y algunos de estos residuos también están
implicados en la catálisis como puede verse en la Figura 6. Solamente algunos residuos de la parte inferior aparecen
en color azul (zona rígida de la proteína) y se corresponden con residuos del
bucle 1 de la subunidad B. No obstante, como también se ha visto en la
actividad 6, en el fichero *.pdb
faltan muchos residuos que se corresponden precisamente con el bucle flexible.
Esto se debe a que son zonas tan flexibles de la proteína, responsables del
desplazamiento del dominio L de la proteína cuando pasa de la forma apo- a la
forma holo-, que no se ha conseguido resolver su estructura tridimensional aún.
Como ya se ha comentado en la actividad 6, los residuos con un mayor factor de
temperatura de estos bucles son aquellos residuos adyacentes a las zonas no
resueltas de la proteína.
Por otra parte, en la Figura 7 se observa en el modo Backbone
carbonos α con un factor de temperatura muy elevado, que no se corresponden con
ninguno de estos bucles. Los carbonos α de los extremos superior e inferior de
la figura se corresponden con el extremo C-terminal de cada una de las
subunidades (Figura 8), mientras que
la otra zona de la proteína en la que se observa un elevado factor de
temperatura se corresponde con un giro que contiene una mezcla de estructura
propia de giro β y de ninguna estructura secundaria (Figura 8.b). Cabe destacar que, tal y como se ha comentado en la
actividad 1, el homodímero es asimétrico [6], dado que átomos idénticos en las
dos cadenas poseen distinto factor de temperatura y estructura secundaria, tal
y como muestra la Figura 8.
Bibliografía
- Apuntes de clase de la asignatura “Ingeniería de Proteínas” del Grado en Bioquímica.
- PDB Contents Guide.
- http://www.accefyn.com/RasMol/PDB.htm. Fecha de acceso: 19 de junio de 2019.
- RasMol V2_7_2_1 Manual in Spanish.
- Trueblood, K. N., Bürgi, H. B., Burzlaff, H., Dunitz, J. D., Gramaccioli, C. M., Schulz, H. H., ... & Abrahams, S. C. (1996). Atomic dispacement parameter nomenclature. Report of a subcommittee on atomic displacement parameter nomenclature. Acta Crystallographica Section A: Foundations of Crystallography, 52(5), 770-781.
- Giardina, G., Montioli, R., Gianni, S., Cellini, B., Paiardini, A., Voltattorni, C. B., & Cutruzzolà, F. (2011). Open conformation of human DOPA decarboxylase reveals the mechanism of PLP addition to Group II decarboxylases. Proceedings of the National Academy of Sciences, 108(51), 20514-20519.