Conocer los genes de las bacterias que forman parte del microbioma humano, el conjunto de microbios que habitan en nuestro interior, es importante porque estos genes pueden explicar los mecanismos de la infección bacteriana o de cohabitación con el huésped, la resistencia a los antibióticos o, más en general, las muchas influencias -positivas o negativas- que el microbioma tiene en la salud humana.
Por sorprendente que pueda parecer, desconocemos buena parte de las funciones de los genes de los microbios. Este vacío de conocimiento puede considerarse como “materia oscura genómica” de los microbios, y ni la genómica comparativa ni las técnicas de laboratorio actuales han podido desentrañarla.
Este desafío ha sido abordado por una colaboración científica internacional entre el Instituto de Investigación Biomédica (IRB Barcelona) y otros dos institutos de investigación, el IJS en Ljubljana (Eslovenia) y el RBI en Zagreb (Croacia), y cuyos hallazgos se han publicado en Microbiome, la revista de referencia internacional en estudios del microbioma. Fran Supek, biólogo computacional líder del Laboratorio Genome Data Science del IRB Barcelona, ha dirigido el trabajo y el primer autor de la publicación es Vedrana Vidulin, un científico informático vinculado a los centros de Eslovenia y Croacia.
Método de predicción inteligente
Los investigadores han desarrollado una nueva metodología computacional capaz de examinar miles de metagenomas a la vez e identificar la señal evolutiva que puede predecir la función de muchos genes de los microbios.
La metagenómica es el estudio del material genético, el cual es obtenido directamente de muestras ambientales
Este método, que analiza el «big data» de microbiomas humanos (de intestino y piel, por ejemplo) y otros metagenomas (del suelo o del océano, por ejemplo), se basa en un tipo especial de algoritmo de aprendizaje automático: puede generar «árboles de decisión» para predecir cientos de funciones genéticas diferentes a la vez, encontrando vínculos entre genes y al mismo tiempo prediciendo las funciones que desarrollan en la célula microbiana.
“Esto hace que el algoritmo no se confunda con el ruido en los datos metagenómicos, lo que significa que es muy preciso y puede proponer de forma fiable un papel biológico para una gran cantidad de genes de función desconocida. Además, curiosamente, también propone muchas funciones adicionales para los genes que ya se conocían”, destaca Supek.
El hallazgo más importante que surge de esta investigación es que el análisis de microbiomas humanos y otros datos metagenómicos, como los del océano o el suelo, permite a los investigadores asignar cientos de funciones genéticas que estaban fuera del alcance de los métodos actuales de la genómica computacional. “En otras palabras, los metagenomas permiten a los científicos ver lo que los genomas no pueden mostrarles”, dice el investigador croata, recientemente premiado con una beca del Consejo Europeo de Investigación (ERC en sus siglas en inglés).
La diversidad es la clave
Los investigadores han encontrado que diferentes tipos de entornos pueden predecir diferentes tipos de funciones génicas. Por ejemplo, los metagenomas del océano pueden usarse para predecir qué genes usan las bacterias para la fotosíntesis, mientras que esto, señalan los investigadores, no podría haberse descubierto a partir de las bacterias que habitan el intestino humano. Por otro lado, el microbioma intestinal ha sido muy útil para predecir genes importantes para la patogénesis, para cierto metabolismo del alcohol, o la biosíntesis de ciertos aminoácidos, mientras que estas funciones hubieran sido difíciles de descubrir estudiando microbiomas procedentes del medio ambiente.
Los autores concluyen que, mediante la aplicación de aprendizaje automático, un conjunto grande y diverso de entornos permite aprender sobre muchas funciones génicas diferentes en microbios. “Los métodos computacionales como éste están arrojando luz sobre la «materia oscura” (la cantidad enorme de genes en bacterias y en arqueas cuya función todavía no se comprende) en genomas microbianos”, señala Supek.
Estos miles de predicciones computacionales necesitarán ser validadas en experimentos, y una vez que esto ocurra, podrían descubrirse nuevos genes relevantes para explicar cómo las bacterias dan forma a los ecosistemas que nos rodean y también a nuestro ecosistema interior, el microbioma humano.
El estudio ha recibido financiación del programa FP7 “Future and Emerging Technologies” y del Consejo Europeo de Investigación a través de una ERC Starting Grant a Fran Supek.
Artículo de referencia:
*The evolutionary signal in metagenome phyletic profiles predicts many gene functions, Vedrana Vidulin, Tomislav Šmuc, Sašo Džeroski and Fran Supek. Microbiome (2018) 6:129 Doi