Google anunció la integración de la función “Computer use” en Gemini 3.5 Flash, lo que permite que agentes de inteligencia artificial visualicen la pantalla y ejecuten acciones en computadoras, navegadores y aplicaciones.
La novedad ya está disponible para desarrolladores y empresas a través de la API de Gemini y de la plataforma Gemini Enterprise Agent. El foco inicial está en el uso corporativo, especialmente en automatización de procesos, análisis de datos y pruebas de software.
Qué cambia en la práctica
- Los agentes pueden hacer clic en botones, llenar formularios, desplazarse por páginas y navegar entre sistemas internos.
- La herramienta amplía la lógica de navegación con agentes para funcionar sobre cualquier pantalla.
- Las empresas pasan a tener una opción más para automatizar tareas digitales repetitivas u operativas.
Para el lector brasileño, el cambio importa porque muchas rutinas de trabajo todavía dependen de interacción manual con sistemas, hojas de cálculo, navegadores y aplicaciones internas. Si se adopta con criterio, la tecnología puede reducir etapas repetitivas, pero también exige gobernanza sobre permisos, seguridad y supervisión.
El avance da continuidad a funciones de navegación con agentes ya incorporadas por Google, como Auto Browse en Chrome Enterprise, y coloca a Gemini 3.5 Flash en una disputa más directa en el campo de los agentes capaces de operar interfaces digitales.
Nuestro prisma
La función señala un cambio relevante: la IA deja de solo responder y pasa a actuar en ambientes digitales. En Brasil, el impacto dependerá menos del hype y más de la capacidad de las empresas para integrar esos agentes con seguridad en sus procesos reales.
Fuente: Canaltech
Recibe Radar de IA todos los días
Las noticias de inteligencia artificial que importan — con nuestro prisma y siempre con las fuentes. Gratis.





