Así funciona la herramienta de IA que podría identificar cómo actúan los genes sin experimentos de laboratorio

El sistema, denominado GSFM y publicado en la revista Patterns, se entrenó con cientos de miles de investigaciones independientes y demostró capacidad para detectar dianas terapéuticas y biomarcadores en múltiples enfermedades

Guardar
Google icon
Ilustración digital futurista con un cerebro digital brillante a la izquierda y una célula humana estilizada a la derecha, unidos por nodos y líneas luminosas
Investigadores de la Icahn School of Medicine at Mount Sinai crean el GSFM, sistema inspirado en ChatGPT para analizar agrupaciones de genes humanos (Imagen Ilustrativa Infobae)

Un equipo de la Icahn School of Medicine at Mount Sinai desarrolló un modelo de inteligencia artificial capaz de mapear cómo actúan los genes en conjunto dentro de las células humanas, una herramienta que busca profundizar la comprensión de la biología celular y las enfermedades, y que podría aportar mejores diagnósticos, biomarcadores y terapias, según informó el portal científico Phys.org.

El sistema, denominado modelo de base de conjuntos génicos (GSFM, por sus siglas en inglés) —presentado en la revista científica Patterns se entrenó con información proveniente de cientos de miles de esfuerzos de investigación independientes, a partir de millones de agrupaciones de genes extraídas de investigaciones publicadas y bases de datos de expresión génica. La propuesta se inspira en los modelos de lenguaje de gran escala como ChatGPT: así como esos sistemas aprenden el significado de las palabras según su contexto, el modelo aprende cómo cambia el comportamiento de los genes según el “contexto” celular.

PUBLICIDAD

“Los genes rara vez actúan solos. En cambio, participan en múltiples procesos biológicos y forman distintas agrupaciones moleculares según dónde y cuándo estén activos en la célula. Un solo gen puede desempeñar diferentes funciones en distintos entornos, del mismo modo que una palabra puede tener distintos significados en distintas oraciones”, explicó Avi Ma’ayan, profesor de ciencias farmacológicas y director del Mount Sinai Center for Bioinformatics de la Icahn School of Medicine at Mount Sinai.

“Así como los modelos modernos de lenguaje aprenden el significado de las palabras a partir del contexto, nos preguntamos si la IA podría aprender del mismo modo el ‘significado’ de los genes. Nuestro GSFM fue diseñado exactamente para eso”, añadió.

PUBLICIDAD

Infografía visualiza un cerebro digital conectado a una célula con ADN, explicando cómo la IA interpreta genes para mejorar diagnósticos y terapias.
Esta infografía ilustra cómo la inteligencia artificial aprende el lenguaje de los genes, revelando su funcionamiento en contextos celulares y prediciendo relaciones para diagnósticos y terapias futuras (Imagen Ilustrativa Infobae)

Cómo se entrenó y evaluó el modelo

El modelo fue diseñado para reconocer patrones en la manera en que los genes se agrupan y funcionan a lo largo de miles de contextos biológicos. Esa estructura ofrece un marco de referencia para interpretar con mayor eficacia datos multiómicos complejos.

Para construirlo, los investigadores compilaron millones de conjuntos génicos tomados de estudios científicos publicados y de bases de datos de expresión génica. El entrenamiento siguió una lógica similar a la de un rompecabezas: al sistema se le entregaba una parte de un conjunto génico y debía predecir las piezas faltantes.

Con el tiempo, la herramienta aprendió patrones subyacentes sobre cómo los genes se agrupan e interactúan. Luego se comparó con otros enfoques y mostró un desempeño sólido, incluida la capacidad de identificar relaciones entre gen y gen, y entre gen y función, antes de que esas relaciones fueran confirmadas experimentalmente.

La evaluación se realizó con un corte temporal: el modelo se entrenó con conjuntos génicos procedentes de publicaciones aparecidas hasta una fecha definida y después se examinó si podía anticipar descubrimientos descritos en estudios publicados posteriormente.

“La organización de los genes dentro de las células sigue siendo una de las grandes preguntas no resueltas de la biología. El GSFM ayuda a abordar este problema al aprender de millones de agrupaciones génicas derivadas de investigaciones publicadas y de conjuntos de datos de expresión génica”, señaló el profesor.

(Imagen Ilustrativa Infobae)
La herramienta ayuda a descubrir el papel de genes poco estudiados y sugiere potenciales biomarcadores y nuevas dianas terapéuticas para enfermedades (Imagen Ilustrativa Infobae)

Genes oscuros, enfermedades y nuevas dianas terapéuticas

Según el portal, el modelo puede ayudar a identificar la función de genes poco comprendidos sin necesidad inmediata de experimentos de laboratorio, resaltar genes implicados en procesos patológicos y sugerir nuevas dianas terapéuticas y biomarcadores. También puede funcionar como un sistema reutilizable de conocimiento para múltiples tareas de análisis de datos biomédicos, entre ellas un mejor análisis de enriquecimiento de conjuntos génicos.

Ese análisis de enriquecimiento es una herramienta de uso extendido en la investigación en biología molecular, y el sistema podría reforzar su rendimiento al mejorar la interpretación de agrupaciones génicas. Para los investigadores, la plataforma funciona como un nuevo “mapa” de cómo colaboran los genes en distintos contextos biológicos.

“Mientras que modelos anteriores de IA biológica dependen de datos de expresión génica, nuestro GSFM está entrenado de manera singular con conjuntos génicos, un tipo distinto de información biológica y en gran medida poco aprovechado”, afirmó Ma’ayan. “Este enfoque permite al modelo integrar datos diversos de muchas enfermedades, métodos experimentales y condiciones de investigación, y crear una representación unificada de las relaciones entre genes a lo largo de la biología”.

Esa capacidad, de acuerdo con el portal, podría mejorar la interpretación de datos obtenidos con tecnologías ómicas y permitir nuevos conocimientos tanto de bases de datos ya existentes como de conjuntos de datos futuros.

El equipo planea ampliar el sistema al combinarlo con otros modelos fundacionales de IA. Uno de los objetivos es integrarlo con modelos basados en lenguaje para generar explicaciones en lenguaje natural sobre las funciones de los genes. Otra línea futura apunta a su integración con sistemas entrenados en farmacología, con la meta de largo plazo de predecir cómo interactúan los medicamentos con las células y respaldar el diseño de nuevas terapias.

PUBLICIDAD

PUBLICIDAD