¿Qué es la ventana de contexto (context window)?

La ventana de contexto (context window) es la cantidad máxima de texto, medida en tokens, que un modelo de lenguaje puede tener en cuenta a la vez para generar una respuesta. Incluye tanto lo que el usuario escribe como lo que el modelo lleva respondido en la conversación: si se supera ese límite, el contenido más antiguo deja de influir en la salida.

El tamaño de la ventana define qué tan largo puede ser un documento, un código o una conversación que el modelo procesa sin perder el hilo. Los modelos actuales manejan ventanas muy amplias: Google Gemini ofrece hasta un millón de tokens, mientras que Claude y GPT trabajan con cientos de miles. Una ventana grande permite resumir libros enteros o analizar bases de código completas, aunque procesar más tokens encarece y ralentiza cada consulta, y los modelos pueden prestar menos atención a la información que queda en el medio de un contexto muy largo.

Preguntas frecuentes

¿En qué se mide la ventana de contexto?

En tokens, las unidades en que el modelo divide el texto. Un token equivale aproximadamente a 4 caracteres o a unas tres cuartas partes de una palabra en inglés; en español la proporción suele ser algo menor.

¿Una ventana de contexto más grande significa mejor memoria?

No del todo. Permite procesar más texto de una sola vez, pero la ventana se vacía al terminar la sesión: no es memoria permanente. Para recordar entre conversaciones se usan otras técnicas, como bases de datos o memoria explícita.