Predicción de enlaces disulfuro


Elaborar una aplicación informática que permita predecir (“asignar”) los posibles enlaces disulfuro presentes en una proteína a partir de sus datos estructurales contenidos en el PDB. Realizar un breve muestreo con media docena de proteínas y comentar los resultados obtenidos en términos de aciertos positivos, aciertos negativos, falsos positivos y falsos negativos.


Para esta actividad se ha creado la aplicación Free Pascal ssbonds_predictor.exe, en la que se ha empleado la función SSbond de la librería biotools. Esta función primero toma un fichero de proteína *.pdb, extrae los enlaces disulfuro existentes en la proteína a partir del campo SSBOND del fichero *.pdb y realiza una predicción de los posibles enlaces disulfuro en la proteína. Para ello, primero crea una matriz de distancias entre todos los átomos de azufre de residuos de cisteína de la proteína. Esta matriz podría imaginarse como una tabla bidimensional en la que estos átomos se ordenarían por orden de aparición en la secuencia primaria en la primera fila y la primera columna, mientras que las demás celdas de la tabla contendrían la distancia atómica entre los dos átomos presentes en una fila y columna concreta, de modo que la diagonal principal de la tabla se correspondería con la distancia entre un átomo consigo mismo y estaría llena de ceros. Una vez elaborada esta tabla, solo se considera que forman un enlace disulfuro aquellos átomos que se encuentren a una distancia menor que una distancia umbral que también fija el usuario. La longitud de este enlace es de 2,05 Å [3], por lo que este es el valor que se ha considerado por defecto como valor umbral.

La Figura 1 muestra la interfaz de este programa. Cuando se cliquea el botón “Predecir S-S” se ejecuta la función, que requiere los siguientes argumentos:
  • p: es de tipo TPDB. Esta función es capaz de cargar un fichero de proteína en el objeto Memo1 y tomar los datos necesarios para construir la variable p de tipo TPDB.
  • Edit1: este objeto es de tipo TEdit y tiene una propiedad Text en la que se va a guardar la ruta en el ordenador del fichero *.pdb seleccionado.
  • Edit2: este objeto es de tipo TEdit y en su propiedad Text a almacenarse la mínima distancia entre dos átomos de azufre de dos residuos de cisteína en una proteína para que se considere que estén enlazados. Por defecto tiene un valor de 2,05 Å.
  • OpenDialog1: este objeto de tipo TOpenDialog va a permitir que se abra una ventana con la que el usuario va a buscar el fichero de proteína entre los directorios del ordenador.
  • Memo1: en este objeto tipo TMemo va a almacenarse el fichero *.pdb seleccionado.
  • Memo2: en este objeto tipo TMemo va a almacenarse la lista de los enlaces S-S presentes en el fichero de proteína. Esta información se obtiene del campo SSBOND del fichero.
  • Memo3: en este objeto tipo TMemo va a almacenarse la lista de los enlaces S-S predichos.


Figura 1: Interfaz del ejecutable ssbonds_predictor.exe.

En esta actividad vamos a comprobar la robustez de esta herramienta predictiva, analizando si es capaz de predecir todos los enlaces disulfuro de una proteína, o si comete errores, por ejemplo, afirmando que existe un enlace covalente entre dos átomos de azufre de cisteína que en realidad no están enlazados (falso positivo) o pasando por alto un enlace disulfuro confirmado (falso negativo). Cabe destacar que esta herramienta posee un elemento subjetivo, que es el valor de distancia interatómica umbral por debajo de la cual los átomos se encuentran enlazados, que es fijada por el usuario. Sin embargo, la elección de este parámetro no es arbitraria, sino que se basa en la bibliografía existente.

En primer lugar, se ha ejecutado el programa con media docena de proteínas, algunas de ellas con puentes disulfuro y otras sin ellos, seleccionando como distancia umbral el valor de 2,05 Å (Figura 2). Como puede verse, este programa predice con mucha exactitud los enlaces disulfuro presentes en las proteínas cuando se toma este valor umbral. Los enlaces disulfuro predichos coinciden a la perfección con los contenidos en el campo SSBOND del fichero *.pdb, a excepción del fichero 9WGA.pdb. En este fichero aparecen 32 enlaces disulfuro (Figura 3), mientras que el programa ssbonds_predictor.exe solo ha predicho 28. Esto se debe a que hay cuatro enlaces disulfuro con una longitud ligeramente superior al umbral de 2,05 Å, pero siempre inferior a 2,10 Å, por lo que este sería un buen umbral a considerar.






Figura 2: Resultados de la ejecución del programa ssbonds_predictor.exe con los ficheros 1AFD.pdb1BUD.pdb2QWQ.pdb2ZUP.pdb9WGA.pdb 3RBL.pdb.

Figura 3: Enlaces disulfuro presentes en la proteína 9WGA.pdb.


Las Figuras 2 y 3 aportan información interesante sobre estas proteínas. En primer lugar, nos muestran cómo en realidad los enlaces disulfuro no son un fenómeno muy frecuente en la naturaleza. Para probar esta herramienta predictiva ha sido necesario seleccionar ficheros *.pdb muy concretos en los que se sabía que se iban a encontrar enlaces disulfuro y, como muestra la Figura 2.f, la L-DOPA descarboxilasa humana en la forma de apoenzima (apoDDC humana), proteína objeto de estudio en este cuaderno, no presenta ningún enlace disulfuro.

Por otro lado, en el caso de proteínas con estructura cuaternaria, los enlaces disulfuro pueden formarse entre cisteínas que pertenecen a la misma subunidad (enlaces intracatenarios) o distintas subunidades (enlaces intercatenarios). Estas figuras muestran cómo normalmente los enlaces disulfuro son intracatenarios, aunque en el caso del fichero 2QWQ.pdb (Figura 2.c) observamos un único enlace intercatenario.
Por otra parte, llama la atención la gran cantidad de enlaces disulfuro que presenta la proteína 9WGA.pdb (Figura 3) cuando se ha comentado que estos enlaces son poco frecuentes en las proteínas. Esta proteína se trata de una lectina, un grupo de proteínas que reconocen de manera específica hidratos de carbono. Las lectinas poseen un dominio de unión a estas moléculas muy rico en residuos de cisteína altamente conservados que forman enlaces disulfuro intracatenarios entre ellos. Además, los enlaces disulfuro suelen abundar en proteínas que se secretan al espacio extracelular, como es el caso de las lectinas [4].

Como ya se ha explicado, esta herramienta predictiva va a funcionar solo en el caso de que se utilice un valor de umbral razonable, como 2,05 Å o 2,10 Å. Para demostrarlo, podemos seleccionar un valor de umbral absurdamente grande, por ejemplo, 10 Å. No es posible que dos átomos a una distancia de 10 Å estén enlazados covalentemente. Según los resultados reflejados en la Figura 4 la apoDDC humana contendría 21 enlaces disulfuro, lo cual no es cierto, dado que su fichero *.pdb carece de campo SSBOND. Otra característica que puede deducirse de la Figura 4.b es la asimetría del homodímero que ya se ha comentado varias veces a lo largo de este cuaderno [5]. La subunidad A tiene una estructura más compacta parecida a la de la holoDDC de riñón de cerdo, por lo que resulta lógico que existan más átomos de azufre de residuos de cisteína que estén a una distancia menor de 10 Å entre sí que en la subunidad B. Además, si nos fijamos en la distancia entre aquellos enlaces disulfuro predichos en la Figura 4.b que están presentes en ambas subunidades, tampoco coincide la distancia que los separa (diferencias en las distancias de aproximadamente 1 Å), apoyando la teoría de la asimetría del homodímero.

Figura 4: a) Resultados de la ejecución del programa ssbonds_predictor.exe con el fichero 3RBL.pdb, seleccionando un valor umbral de 10 Å. b) Enlaces S-S predichos cuando el valor del umbral es de 10 Å.

Bibliografía

  1. Apuntes de clase de la asignatura “Ingeniería de Proteínas” del Grado en Bioquímica.
  2. http://wiki.freepascal.org/. Fecha de acceso: 19 de junio de 2019.
  3. https://en.wikibooks.org/wiki/Structural_Biochemistry/Chemical_Bonding/_Disulfide_bonds. Fecha de acceso: 19 de junio de 2019.
  4. https://www.uniprot.org/help/disulfid. Fecha de acceso: 19 de junio de 2019.
  5. Giardina, G., Montioli, R., Gianni, S., Cellini, B., Paiardini, A., Voltattorni, C. B., & Cutruzzolà, F. (2011). Open conformation of human DOPA decarboxylase reveals the mechanism of PLP addition to Group II decarboxylases. Proceedings of the National Academy of Sciences108(51), 20514-20519.