Paraules clau:
Diseño computacional de proteínas; Dianas terapéuticas; Linux; Python
Descripció del contingut i pla d'activitats:
La estudiante se integrará dentro de nuestra línea de investigación sobre diseño computacional de proteínas para
interactuar contra dianas terapéuticas de interés. Durante este trabajo exploraremos cómo los métodos recientes
de inteligencia artificial para predicción de estructura de proteínas nos pueden ayudar a predecir mejor qué
proteínas tienen mayor probabilidad de unirse exitosamente a la diana. Nos centraremos en proteínas de diseño
contra el dominio RBD de SARS-CoV-2, para el cuál disponemos de datos (computacionales y experimentales)
tanto de proteínas diseñadas por otros laboratorios como en el nuestro; y por lo tanto proporciona un marco ideal
para trabajar en la optimización de las metodologías computacionales. Concretamente las actividades a desarrollar
son las siguientes:
- Realizar cálculos de predicción de estructura de complejos proteína-proteína con AlphaFold2.
- Analizar distintos parámetros de las predicciones, como la fiabilidad o similitud estructural al modelo.
- Calcular propiedades físico-químicas de las superficies de interacción teniendo en cuenta la estructura de
los modelos de diseño y los modelos de predicción estructural.
- Realizar cálculos de predicción de estructura de complejos con pares de ligandos compitiendo por el
receptor. Análisis posterior de las estructuras y predicción de ranking de afinidades.
Overview (resum en anglès):
De novo protein design has reached a new height in recent years thanks to new computational
procedures, such as AlphaFold2, an artificial intelligence (AI) that predicts the three-dimensional
structure of proteins from an amino acid sequence. This method allows for the design of proteins
with high structural precision and complexity, capable of performing functions of medical and
biotechnological relevance.
This work aims to explore how the latest artificial intelligence methods, specifically AlphaFold2, can
improve the prediction of protein tertiary structures and determine which proteins are more likely
to successfully bind to therapeutic targets of interest, such as the RBD domain of SARS-CoV-2.
Additionally, it aims to optimize current computational methodologies.
Specifically, the prediction of structures of protein-protein complexes and ligand complexes
competing for the same receptor has been carried out, analyzing various parameters regarding the
quality of the prediction and the physicochemical properties of the proteins. This approach aims to
optimize the computational methodology and develop a ranking of the affinities of proteins that
could bind to the RBD receptor.
The proteins studied have been designed both by other laboratories in previously published studies
and by the Protein Design and Modeling group at the Institute of Molecular Biology of Barcelona
(IBMB), for which experimental data are available. This provides an ideal framework for working on
the optimization of computational methodologies.