Actividades
Actividad 1.
Construcción de un mapa del mecanismo molecular de la infección por SARS-CoV-2 a partir de lo que se conoce sobre sus interacciones con proteínas humanas (12) y los pathways de señalización y metabólicos humanos tomados de los repositorios KEGG, Reactome y Wikipathways. Para ello se mapearán dichos genes en los pathways definiendo un subconjunto de estos repositorios que será el primer mapa del mecanismo molecular de la infección por SARS-CoV-2. Nuestra participación en el consorcio Disease Maps (https://disease-maps.org/) que está trabajando en un esfuerzo internacional para la generación de un mapa detallado de la enfermedad (https://covid.pages.uni.lu/map_curation) nos permite ir actualizando las predicciones según las nuevas versiones estén disponibles.
Actividad 2.
Búsqueda de dianas de fármacos con potencial actividad sobre el mapa de Covid-19. Se utilizarán datos públicos de actividad génica (unas 11000 muestras con más de 20.000 medidas de expresión génica del proyecto GTEx https://www.gtexportal.org) como base para que un algoritmo de aprendizaje automático (machine learning) “aprenda” las relaciones entre proteínas que son dianas de fármacos con indicación para otra enfermedad (extraídos de DrugBank, en https://www.drugbank.ca/) y la actividad del mapa de la Covid-19, resultado de la aplicación del modelo mecanístico. Para ello se aplicará un algoritmo Multi-Input (las dianas de los fármacos) Multi-Output (los circuitos de señalización del mapa de Covid-19) basado en Sparse Variational Gaussian Processes (SVGP). Se utilizará SHapley Additive exPlanations (SHAP) para estimar las relevancias de las dianas dadas por el modelo. Los modelos MIMO tienen en cuenta las complejas interacciones entre las variables involucradas en el proceso de aprendizaje.
Los métodos se implementan en Phython (3.6) usando una serie de librerías: Scikit-learn [0.20.0] para empaquetar las demás librerías, evaluar la eficiencia del modelo y hacer las particiones de los datos en el entrenamiento. GPflow [1.3.0] una libreria de SVGP escalable que funciona sobre TensorFlow [1.11.0] para implementar los modelos finales (optimizados para Big Data y GPU). SHAP [0.24.0] para extraer la relevancia de las dianas en la predicción del comportamiento del mapa de la enfermedad.