IA de código abierto predice mil millones de proteínas y expande el universo de AlphaFold

0
3
IA de código aberto prevê 1 bilhão de proteínas e expande o universo do AlphaFold

Investigadores del Biohub, instituto biomédico vinculado a la Chan Zuckerberg Initiative, presentaron el 27 de mayo de 2026 el ESM Atlas, una base de datos con más de mil millones de estructuras de proteínas predichas por inteligencia artificial, además de miles de millones de secuencias. El conjunto supera en más de 800 millones de entradas a la base de AlphaFold, actualmente la más usada por la comunidad científica.

Las predicciones fueron realizadas por ESMFold2, modelo que, según el Biohub, supera el desempeño de AlphaFold3, la versión más reciente del sistema de Google DeepMind. El lanzamiento reúne tres piezas: ESMC, un modelo de lenguaje que representa proteínas entrenado con cerca de 2.800 millones de secuencias de todo el árbol de la vida; ESMFold2, que convierte esas representaciones en estructuras 3D con resolución atómica; y el propio ESM Atlas, que vuelve navegables 6.800 millones de secuencias.

Abierto, incluso para uso comercial

El punto que más distingue al proyecto es su apertura total: ESMFold2 es de código abierto y no tiene restricciones para uso comercial. En la práctica, cualquier laboratorio, startup o empresa puede usarlo sin pagar licencia, lo que tiende a ampliar la adopción mucho más allá de los grandes centros que ya cuentan con equipamiento. La recepción fue positiva, aunque con reservas técnicas: para algunos investigadores, ESM Atlas funciona como complemento, no como sustituto, de la base de AlphaFold, que reúne más de 200 millones de estructuras, y existen dudas sobre cómo maneja el modelo estructuras muy inusuales.

Estas predicciones podrían ayudar a revelar plegamientos y funciones de proteínas completamente nuevos.

Christine Orengo, bióloga computacional, University College London

En el artículo que acompaña el lanzamiento, el equipo usó ESMFold2 para diseñar nuevos anticuerpos y proteínas que se unen a objetivos asociados con cánceres y enfermedades inmunológicas; cuando fueron sintetizadas y probadas, una buena parte funcionó como el modelo preveía. Para la ciencia brasileña, el mensaje es concreto: la barrera de entrada para la investigación de punta en biología estructural bajó, y lo que define quién la aprovecha ya no es el acceso al modelo, sino la capacidad de validar resultados en laboratorio.

Nuestro prisma

La gran diferencia no es solo la escala, sino la licencia: un modelo de punta totalmente abierto, sin restricción de uso comercial, es exactamente el tipo de infraestructura que da a los laboratorios brasileños la oportunidad de competir sin pagar peaje a una big tech.

Fuentes: Nature — Move over, AlphaFold: open-source model predicts shape of 1 billion proteins · Scientific American — New protein-folding AI vastly expands on AlphaFold's efforts · Lab Manager — Open-Source ESMFold2 Model Predicts One Billion Protein Structures

Recibe Radar de IA todos los días

Las noticias de inteligencia artificial que importan — con nuestro prisma y siempre con las fuentes. Gratis.

Sin spam. Cancela cuando quieras.