Baidu abre Unlimited OCR para la lectura de documentos largos

0
18
Baidu abre Unlimited OCR para leitura de documentos longos

Baidu abrió el código de Unlimited OCR, un modelo MoE de 3B parámetros orientado a la lectura y el análisis de documentos extensos. Según el resumen de la publicación original, el sistema puede procesar decenas de páginas en una sola pasada por el modelo.

El punto técnico central es Reference Sliding Window Attention, o R-SWA. El enfoque mantiene constante la caché KV, con el objetivo de evitar que la memoria y la latencia crezcan a medida que la salida se hace mayor durante el parsing de documentos largos.

Qué cambia en la práctica

  • La lectura de documentos largos puede volverse más previsible en consumo de memoria.
  • Los flujos de OCR para múltiples páginas pueden exigir menos división manual del material.
  • La licencia MIT facilita pruebas e integración por parte de equipos que trabajan con modelos abiertos.

En el benchmark OmniDocBench v1.5, Unlimited OCR alcanzó 93,23 puntos, superando la línea base DeepSeek OCR en 6,22 puntos, de acuerdo con la fuente original. Ese resultado sugiere un avance en un área crítica: transformar documentos complejos en texto estructurable para su uso por sistemas de IA.

Para empresas e instituciones brasileñas, el interés está menos en el anuncio en sí y más en la posibilidad de reducir cuellos de botella en acervos, contratos, informes y documentos digitalizados. Aun así, la adopción práctica depende de pruebas locales con formatos, idioma y calidad de digitalización encontrados en Brasil.

Nuestro prisma

El OCR eficiente para documentos largos es relevante en Brasil porque muchos procesos todavía dependen de PDF, digitalizaciones y archivos extensos. Un modelo abierto con licencia MIT puede ampliar la experimentación local, siempre que se valide con datos reales en portugués.

Fuente: MarkTechPost

Recibe Radar de IA todos los días

Las noticias de inteligencia artificial que importan — con nuestro prisma y siempre con las fuentes. Gratis.

Sin spam. Cancela cuando quieras.