Datalab lanzó lift, un modelo de visión con pesos abiertos y 9B parámetros orientado a transformar PDFs e imágenes en JSON estructurado según esquemas definidos.
La propuesta apunta a un problema recurrente en flujos de documentos: extraer campos de archivos visuales sin perder la estructura exigida por sistemas internos, bases de datos o automatizaciones.
Qué diferencia a lift
- Usa decodificación restringida por esquema para mantener la salida en una estructura JSON válida.
- Fue entrenado para devolver null cuando se solicita un campo ausente, en vez de llenar vacíos con información inventada.
- Según el resumen de la fuente, alcanzó un 90,2% de precisión de campo en un benchmark con 225 documentos.
En la práctica, esto puede reducir etapas manuales en tareas como lectura de formularios, notas, informes y documentos digitalizados, siempre que el usuario defina con claridad qué campos espera recibir.
Para los equipos brasileños que trabajan con muchos PDFs, el punto central no es solo automatizar la lectura, sino obtener una salida estructurada que pueda validarse e integrarse con sistemas existentes.
Nuestro prisma
El lanzamiento importa porque acerca los modelos abiertos a un uso corporativo concreto: transformar documentos en datos accionables. En Brasil, donde los procesos todavía dependen mucho de PDFs, la capacidad de abstención puede ser tan relevante como la extracción en sí.
Fuente: MarkTechPost
Recibe Radar de IA todos los días
Las noticias de inteligencia artificial que importan — con nuestro prisma y siempre con las fuentes. Gratis.






