El campo de la inteligencia artificial produjo en cinco años más jerga que la mayoría de las disciplinas en cincuenta. Términos como 'alucinación', 'token', 'RAG' y 'vibe coding' aparecen en noticias, reuniones corporativas y conversaciones técnicas, pero rara vez alguien se detiene a explicarlos. Este glosario resuelve eso: 60 términos centrales, explicados en español, sin matemáticas y sin condescendencia.
A — F: Fundamentos y modelos
- AGI (Inteligencia General Artificial): un sistema de IA que pueda realizar cualquier tarea intelectual que realiza un humano, en cualquier dominio. Todavía no existe. Los modelos actuales son buenos en muchas tareas, pero no tienen una comprensión general del mundo. Los investigadores debaten si la AGI será posible y cuándo.
- Alucinación: cuando una IA genera con confianza información factualmente incorrecta: inventa una cita bibliográfica, atribuye una frase a alguien que nunca la dijo o describe un evento que no ocurrió. No es una mentira intencional; es un artefacto de la forma en que funcionan los modelos: predicción estadística de tokens.
- Benchmark: un conjunto de pruebas estandarizadas para medir el desempeño de un modelo de IA. MMLU prueba conocimiento general en 57 disciplinas; HumanEval mide generación de código; MATH mide razonamiento matemático. Los benchmarks son útiles, pero pueden ser 'memorizados': un modelo puede entrenarse para obtener buen resultado en la prueba sin tener una habilidad real.
- Contexto / Context window: cuánto texto puede procesar un modelo de una sola vez, tanto la conversación anterior como el documento cargado. En 2024, 100.000 tokens eran impresionantes. En 2026, Claude tiene una ventana de 200.000 tokens. Piensa en la ventana de contexto como la memoria de corto plazo de la IA.
- Embedding: una representación numérica (vector) de un texto, imagen o dato. Los modelos de embedding convierten palabras en coordenadas dentro de un espacio matemático donde las palabras semánticamente cercanas quedan geométricamente próximas. Es la base de los sistemas de búsqueda semántica y RAG.
- Fine-tuning: entrenar un modelo base con datos específicos para especializarlo en una tarea o dominio. Un LLM genérico puede ser ajustado con textos jurídicos brasileños para convertirse en un asistente jurídico. Es más caro y complejo que el prompt engineering, pero necesario en casos de uso muy específicos.
- Foundation Model / Modelo fundacional: un modelo entrenado con un enorme volumen de datos genéricos que sirve de base para especializaciones. GPT-4o, Claude Sonnet 4 y Gemini 2.5 son modelos fundacionales: entrenados con miles de millones de textos para luego ser ajustados o usados directamente.
G — M: Generación e interacción
- GPT (Generative Pre-trained Transformer): la arquitectura y la familia de modelos de OpenAI. GPT significa 'Transformador Generativo Preentrenado'. GPT-4, GPT-4o y GPT-5 son versiones de esta familia. El término a veces se usa de manera informal para cualquier modelo de lenguaje.
- Hallucination: ver Alucinación.
- LLM (Large Language Model / Modelo grande de lenguaje): un modelo de IA entrenado con texto a gran escala, capaz de generar, resumir, traducir y responder preguntas en lenguaje natural. ChatGPT, Claude y Gemini son interfaces de LLMs.
- MCP (Model Context Protocol): protocolo creado por Anthropic en 2024 que estandariza cómo los modelos de IA se conectan con herramientas y fuentes de datos externas. Es como un USB para IA: permite que cualquier sistema se conecte a cualquier modelo sin integración personalizada.
- Multimodal: un modelo o sistema capaz de procesar más de una modalidad de datos: texto, imagen, audio, video. GPT-4o y Gemini 2.5 son multimodales: puedes enviar una foto y hacer una pregunta sobre ella.
- Prompt / Prompt Engineering: prompt es la instrucción o mensaje que envías a un modelo de IA. Prompt engineering es la práctica de formular esas instrucciones de manera que se obtengan mejores respuestas. Incluye técnicas como chain-of-thought, few-shot y role prompting.
N — R: Redes y razonamiento
- RAG (Retrieval-Augmented Generation): técnica que combina búsqueda en una base de conocimiento con generación de texto. Cuando preguntas a Claude sobre un documento específico, el sistema busca los fragmentos relevantes y los incluye en el contexto antes de generar la respuesta. Reduce alucinaciones porque ancla la respuesta en textos reales.
- Red neuronal: sistema computacional inspirado vagamente en el cerebro, compuesto por capas de nodos conectados que procesan información. No es un cerebro: es una función matemática muy compleja. Las redes neuronales son la base de los modelos modernos de IA.
- Reasoning Model / Modelo de razonamiento: modelos entrenados para pensar en pasos antes de responder, mostrando una cadena de razonamiento (chain-of-thought). o3 de OpenAI, Claude con razonamiento activado y DeepSeek R1 son ejemplos. Son más lentos que los modelos estándar, pero más precisos en problemas complejos.
- RLHF (Reinforcement Learning from Human Feedback): técnica que entrena modelos de lenguaje usando preferencias humanas. Humanos comparan respuestas del modelo e indican cuál es mejor; el modelo aprende a producir respuestas más preferidas. Así aprendió ChatGPT a ser útil y seguro.
S — Z: Seguridad, agentes y tendencias
- Token: la unidad básica de procesamiento en LLMs. Una palabra en inglés suele ser 1 token; en español, palabras largas pueden ser 2-3 tokens. El costo de las APIs de IA se mide por tokens (entrada + salida). 1.000 tokens equivalen aproximadamente a 750 palabras en inglés.
- Tool Use / Function Calling: capacidad de un modelo para invocar funciones externas: búsqueda web, ejecución de código, consulta a bases de datos, durante una conversación. Es lo que transforma un chatbot en un agente capaz de actuar en el mundo.
- Transformer: la arquitectura de red neuronal que revolucionó el procesamiento del lenguaje natural en 2017 (paper 'Attention Is All You Need'). Todos los LLMs modernos, GPT, Claude, Gemini y DeepSeek, se basan en transformers. El elemento central es el mecanismo de atención, que permite al modelo ponderar la relevancia de cada parte del texto al generar la siguiente palabra.
- Vibe coding: escribir software describiendo lo que quieres en lenguaje natural y dejando que la IA genere el código. El término fue acuñado por Andrej Karpathy en 2025. Es real y funciona para proyectos simples y medianos, pero el código generado por IA aún necesita revisión para sistemas críticos.
- Zero-shot vs Few-shot: zero-shot es cuando el modelo resuelve una tarea sin ejemplos previos, solo con la instrucción. Few-shot es cuando proporcionas uno o más ejemplos de cómo quieres que se formatee la respuesta. Few-shot suele producir resultados más consistentes en tareas específicas.
Términos del Marco Legal y la regulación
- Algoritmo de alto riesgo: definición del PL 2338/2023. Los sistemas de IA que afectan decisiones en crédito, empleo, salud, seguridad pública o educación se clasifican como de alto riesgo y quedan sujetos a obligaciones adicionales de transparencia y evaluación.
- ANPD (Autoridad Nacional de Protección de Datos): organismo federal brasileño responsable de fiscalizar la LGPD y, posiblemente después del Marco Legal de la IA, también la regulación de sistemas de IA.
- Evaluación de Impacto Algorítmico (AAIA): documento obligatorio para sistemas de alto riesgo que describe los datos usados, el objetivo del modelo, los riesgos identificados y las medidas de mitigación adoptadas.
- LGPD e IA: la Ley General de Protección de Datos (Ley 13.709/2018) ya se aplica a sistemas de IA que procesan datos personales. El Marco Legal de la IA complementa, no sustituye, la LGPD.
Recursos para seguir aprendiendo
Para ir más allá del glosario: los cursos de DeepLearning.AI de Andrew Ng (en inglés, con subtítulos en portugués) explican los fundamentos técnicos de forma accesible. Google ofrece el curso 'Introducción a la IA generativa' traducido al portugués en Google Cloud Skills Boost. Anthropic mantiene documentación pública sobre cómo funcionan sus modelos en anthropic.com/research.
Este glosario se actualiza mensualmente con nuevos términos que entran en el vocabulario del campo. Suscríbete al newsletter de Jornal da IA para recibir las actualizaciones directamente por correo electrónico, sin tener que volver al sitio para revisar.
Nuestro prisma
El vocabulario de la IA creció demasiado rápido. Quien no entiende los términos queda dependiente de quien los traduce, y esa traducción no siempre es honesta. Este glosario existe para que puedas leer cualquier noticia de IA sin depender de intermediarios.
Fuentes: DeepLearning.AI · Anthropic Research · Google Cloud Skills Boost
Recibe Radar de IA todos los días
Las noticias de inteligencia artificial que importan — con nuestro prisma y siempre con las fuentes. Gratis.






