En enero de 2025, DeepSeek R1 llegó a la cima de las tiendas de aplicaciones y derribó acciones de empresas estadounidenses de IA por miles de millones de dólares en valor de mercado. El motivo: una startup china había creado un modelo de razonamiento competitivo con o1 de OpenAI por una fracción del costo declarado de entrenamiento, cerca de US$ 6 millones frente a estimaciones de cientos de millones para modelos estadounidenses equivalentes.
Desde entonces, la empresa lanzó V3, R1-0528 y otros modelos que siguen avanzando. A mediados de 2026, DeepSeek tiene una presencia relevante en el mercado de API, popularidad creciente entre desarrolladores y una propuesta difícil de ignorar: calidad cercana al estado del arte por un costo significativamente menor. Esta comparación analiza qué hace diferente, en realidad, el modelo chino, y dónde los riesgos son reales.
Benchmarks: dónde DeepSeek supera a los estadounidenses
En MMLU (Massive Multitask Language Understanding), DeepSeek V3 y R1 compiten directamente con GPT-4o y Claude Sonnet 4 en los resultados publicados. En HumanEval (generación de código), DeepSeek R1 supera a GPT-4o en algunos subconjuntos de Python y matemática.
Para usuarios en portugués, el escenario tiene más matices. Pruebas de generación de texto en PT-BR muestran que DeepSeek produce contenido coherente y bien estructurado, pero con algunas particularidades del portugués europeo mezcladas con el brasileño. ChatGPT y Claude, entrenados con más datos en portugués de Brasil, tienden a ser más naturales en expresiones idiomáticas, jerga de negocios y formatos de documentos locales.
Qué hace diferente DeepSeek (y mejor)
- Razonamiento en cadena visible: DeepSeek R1 muestra el proceso de razonamiento por defecto, lo que facilita identificar dónde el modelo se equivocó o acertó.
- Costo de API: US$ 0,27 por millón de tokens de entrada en V3, aproximadamente 10 veces más barato que GPT-4o para la misma tarea.
- Open-weights: los pesos del modelo son públicos. Esto significa que cualquier persona puede descargar y ejecutar DeepSeek localmente, sin enviar datos a ningún servidor.
- Matemática y lógica: en razonamiento matemático formal, R1 está entre los mejores modelos disponibles y supera a Claude en algunos escenarios específicos.
- Código: benchmarks de generación de código muestran a DeepSeek competitivo o superior a GPT-4o en Python científico y manipulación de datos.
Preocupaciones reales sobre privacidad y censura
Las preocupaciones sobre DeepSeek son concretas y no deben descartarse. Los servidores del servicio en línea están en China, sujetos a la PIPL (ley china de datos) y potencialmente accesibles para el gobierno. Para empresas brasileñas que trabajan con datos sensibles, como información financiera, datos de salud, secretos industriales o datos personales regulados por la LGPD, no se recomienda usar la interfaz web de DeepSeek.
En cuanto a la censura, el modelo en línea se niega a responder preguntas sobre eventos políticamente sensibles para el gobierno chino, como Tiananmen, Taiwán y Xinjiang. En temas técnicos, de negocios o científicos, no se observa censura relevante. Pero el riesgo de sesgo político en análisis de geopolítica existe y debe considerarse.
La solución para empresas que quieren usar DeepSeek sin los riesgos de privacidad es ejecutar el modelo localmente vía Ollama. Con una computadora con GPU adecuada (mínimo 8 GB de VRAM para versiones menores), DeepSeek puede ejecutarse íntegramente en tu propio hardware, sin enviar ningún dato a servidores externos, chinos o estadounidenses.
Otros modelos chinos: Qwen y GLM
Qwen 2.5 de Alibaba es multimodal (texto, imagen, código) y tiene un desempeño fuerte en programación. También es open-weights, disponible en Hugging Face para uso local. GLM-4 de la Universidad de Tsinghua es el modelo más fuerte en chino, pero tiene desempeño competitivo en inglés y razonable en portugués. Ambos siguen la misma lógica de open-weights y costo de API por debajo del mercado estadounidense.
Cuándo usar DeepSeek vs ChatGPT vs Claude en Brasil
- Tareas de código y matemática sin datos sensibles: DeepSeek R1 vía API, con mejor relación costo-beneficio.
- Escritura larga y profesional en PT-BR: Claude Sonnet 4, más natural en el contexto brasileño.
- Investigación con acceso a la web: ChatGPT con búsqueda habilitada o Gemini Deep Research.
- Procesamiento de alto volumen con datos no sensibles: API de DeepSeek por una fracción del costo.
- Uso local sin internet, sin enviar datos: DeepSeek ejecutándose vía Ollama en hardware propio.
- Datos sensibles o regulados (LGPD, secreto profesional): Claude o ChatGPT, servidores estadounidenses con contratos de privacidad claros.
Cómo probar DeepSeek hoy
El acceso más rápido es vía chat.deepseek.com, que ofrece uso gratuito con límites. Para usarlo vía API, el registro en platform.deepseek.com genera créditos gratuitos suficientes para pruebas. Para ejecutarlo localmente, instala Ollama (ollama.ai) y ejecuta 'ollama run deepseek-r1' en la terminal; el modelo menor (7B parámetros) funciona en CPU comunes, mientras que el mayor (70B) necesita GPU dedicada.
La cobertura de modelos chinos en portugués todavía es escasa. Jornal da IA sigue el avance de DeepSeek y otros modelos globales con análisis en PT-BR; suscríbete al boletín para no perderte ningún lanzamiento relevante.
Nuestro prisma
DeepSeek no es simplemente otro modelo. Es la prueba de que el monopolio estadounidense en IA de frontera terminó, y eso tiene consecuencias directas para precios, privacidad y opciones disponibles para el usuario brasileño.
Fuentes: DeepSeek · Hugging Face · Ollama
Recibe Radar de IA todos los días
Las noticias de inteligencia artificial que importan — con nuestro prisma y siempre con las fuentes. Gratis.






