Modelos

Tutorial usa NVIDIA Canary-1B-v2 para ASR y subtítulos SRT

Por

24 de junio de 2026

Un tutorial publicado por MarkTechPost muestra cómo usar NVIDIA Canary-1B-v2 para montar un pipeline multilingüe de reconocimiento automático de voz, traducción de voz y exportación de subtítulos en formato SRT en Python.

El flujo descrito carga el modelo en un entorno con GPU, prepara el audio en mono a 16 kHz y ejecuta ASR en inglés. Después, el mismo pipeline traduce la voz al francés, alemán, español e italiano.

Qué cubre el pipeline

Preparación de audio a 16 kHz mono antes de la inferencia.
Reconocimiento automático de voz en inglés.
Traducción de voz al francés, alemán, español e italiano.
Extracción de marcas de tiempo por palabra y por segmento.
Exportación de subtítulos traducidos como archivo SRT.

En la práctica, el tutorial organiza tareas que suelen aparecer separadas en flujos de medios: transcripción, traducción, marcado temporal, procesamiento por lotes, prueba con audios largos y medición de velocidad de inferencia.

Para lectores brasileños, el punto central es la automatización de etapas usadas en subtitulado, localización de contenido y procesamiento de audio. El resumen no informa soporte para portugués, por lo que la aplicación directa al pt-BR dependería de validaciones adicionales.

Nuestro prisma

La relevancia está en mostrar un camino técnico integrado para transformar voz en texto, traducción y subtítulos, reduciendo el trabajo manual en pipelines de medios. Para Brasil, importa como referencia de arquitectura, aunque el material citado no confirma soporte para portugués.

Fuente: MarkTechPost

Recibe Radar de IA todos los días

Las noticias de inteligencia artificial que importan — con nuestro prisma y siempre con las fuentes. Gratis.

Tutorial usa NVIDIA Canary-1B-v2 para ASR y subtítulos SRT

Qué cubre el pipeline

Recibe Radar de IA todos los días

RECOMENDACIONES DEL EDITOR

ENTRADAS POPULARES

Los chatbots de IA aún tienden a la izquierda en preguntas...

Blip dice que la IA resuelve hasta el 90% de las...

Radar de modelos de IA 2026: todos los modelos con precios,...

CATEGORÍA POPULAR

Qué cubre el pipeline

Recibe Radar de IA todos los días

Artículos relacionadosMás del autor

Un tutorial usa Open-SWE-Traces de NVIDIA para crear datos de fine-tuning

Baidu abre Unlimited OCR para la lectura de documentos largos

Google pierde investigadores de IA frente a empresas rivales

RECOMENDACIONES DEL EDITOR

ENTRADAS POPULARES

Los chatbots de IA aún tienden a la izquierda en preguntas...

Blip dice que la IA resuelve hasta el 90% de las...

Radar de modelos de IA 2026: todos los modelos con precios,...

CATEGORÍA POPULAR

Artículos relacionados Más del autor