El estudio, liderado por la Universidad de Oviedo y el Battelle Center for Mathematical Medicine, ha consistido en el diseño de un algoritmo de predicción de la estructura terciaria de las cadenas de aminoácidos, un aspecto fundamental para abordar distintas enfermedades
El grupo de Problemas Inversos, Optimización y Aprendizaje Automático de la Universidad de Oviedo, dirigido por el profesor Juan Luis Fernández Martínez, en colaboración con el profesor Andrzej Kloczkowski del Batelle Center of Mathematical Medicine, dependiente del Nationwide Children Hospital de Columbus (Ohio), ha diseñado un conjunto de algoritmos que permiten mejorar el conocimiento de la estructura terciaria de las proteínas, es decir, el conocimiento preciso de las coordenadas de sus átomos mediante modelos numéricos, un aspecto clave en el diseño de fármacos y en el estudio de numerosas enfermedades. Este trabajo forma parte de la tesis doctoral de Óscar Álvarez, que se desarrolla en el Departamento de Química Física y Analítica de la Universidad de Oviedo. Los resultados han visto la luz en "Journal of Bioinformatics and Computational Biology".
Las proteínas son moléculas formadas por cadenas de aminoácidos y una pieza fundamental en el funcionamiento del organismo de los seres vivos. Solo 20 aminoácidos forman parte de las proteínas, pero este reducido número da lugar a millones de proteínas y solo se conoce la estructura terciaria de un reducido número de ellas, ya que los análisis experimentales necesarios poseen un elevado coste económico. Debido al impacto del proyecto genoma, hay más de 12 millones de proteínas secuenciadas, mientras que solo se conocen alrededor de 80.000 estructuras.
La determinación experimental de las estructuras proteicas mediante cristalografía de rayos X o espectroscopia RMN es lenta, cara y laboriosa. Determinar la estructura de una sola proteína por métodos experimentales cuesta varios miles de dólares y semanas de trabajo, mientras que hacerlo computacionalmente es rápido y su coste es muy bajo. De hecho, cada dos años se organiza la competición internacional CASP (Critical Assessment of Protein Structure Prediction) para mejorar dichos métodos numéricos, así como los algoritmos involucrados.
El conocimiento de la estructura de las proteínas es un tema de gran relevancia científica y económica, dado que las proteínas realizan una enorme cantidad de funciones diferentes: estructural, inmunológica, enzimática, transducción de señales, protectora o defensiva, etcétera. Las proteínas se sintetizan dependiendo de cómo se encuentren regulados los genes que las codifican, por lo que son susceptibles a señales o factores externos. El conjunto de las proteínas expresadas en una circunstancia determinada se denomina proteoma. Muchas de las enfermedades están asociadas a plegamientos de las proteínas ("misfoldings").
El diseño de nuevos fármacos necesita del conocimiento de la estructura terciaria para poder así modificar sus funciones. Esta predicción se realiza mediante métodos bio-informáticos que utilizan modelos físicos de la interacción entre las diferentes cadenas de proteínas para determinar su energía, así como métodos de optimización que intentan minimizar su energía de conformación. "Las proteínas siguen principios variacionales, es decir, de mínimo esfuerzo", afirma el profesor Fernández-Martínez, que asegura que las técnicas de optimización deberían ser enseñanza obligatoria en todas las ramas científicas.
El profesor Fernández-Martínez explica además que las técnicas que han utilizado en esta investigación "se basan en reducir la dimensión de modo drástico. Normalmente se habla de la maldición de la dimensionalidad, es decir, no es posible muestrear más de 10 dimensiones, y este número se reduce a no más de 5 en el caso de los problemas que solemos tratar. Luego utilizamos un algoritmo que se inspira en el vuelo de las abejas en búsqueda de alimento para encontrar dicha estructura terciaria. Algunos de estos métodos los habíamos probado ya en la optimización de reservorios petrolíferos. Como se puede ver, todo está conectado".
Este proyecto de colaboración surgió en 2013 durante una visita del profesor Fernández-Martínez al centro de modelización del hospital de Ohio. Para el investigador, "la estructura de investigación bio-sanitaria en los hospitales de Estados Unidos es un modelo: ingenieros, físicos, matemáticos, biólogos, bioquímicos y médicos trabajando conjuntamente contra las enfermedades. Estamos a años luz, pero esta organización también se adoptará aquí, o el sistema de salud quedará desfasado".
Publicaciones
Alvarez-Machancoses O., Fernández-Martínez J.L., Fernández-Brillet C., Cernea A., Fernández-Muñiz Z., Kloczkowski A., 2018. Principal Component Analysis in Protein Tertiary Structure Prediction, J. Bioinf. Comp. Biol., doi.:10.1142/S0219720018500051.
Alvarez-Machancoses O., Fernández-Martínez J.L., Fernández-Brillet C., Cernea A., Fernández-Muñiz Z., Kloczkowski A., On the use of Principal Component Analysis and Particle Swarm Optimization in Protein Tertiary Structure Prediction. ICAISC 2018.
Alvarez-Machancoses O., Fernández-Martínez J.L., Cernea A., Fernández-Muñiz Z., Kloczkowski, A., 2018. Protein Tertiary Structure Prediction via SVD and PSO Sampling. Springer International Publishing AG, part of Springer Nature 2018 I. Rojas and F. Ortuño (Eds.): IWBBIO 2018, LNBI 10813, pp. 1–10, 2018. https://doi.org/10.1007/978-3-319-78723-7_18