¿El próximo DeepSeek V4 repetirá la historia o la superará? DeepSeek una vez sorprendió a la industria de la inteligencia artificial al demostrar que no se necesitan 100 millones de dólares y un almacén de Nvidia H100 para construir un LLM de vanguardia que rivalice con ChatGPT.
Pero después de que el revuelo se desvaneciera silenciosamente, DeepSeek está a punto de regresar con la versión 4. Cubriremos la fecha de lanzamiento de DeepSeek v4, las novedades y lo que puede esperar, para que no se pierda hacia dónde se dirigen las cosas.
Parte 1. ¿Qué es DeepSeek?
DeepSeek es un laboratorio chino de investigación de IA fundado en Hangzhou, China, que ha pasado los últimos años desafiando a gigantes de la IA como ChatGPT de OpenAI. Crea y lanza grandes modelos de lenguaje (LLM) bajo licencias de código abierto, y lo que sigue llamando la atención es lo mucho que ofrece por lo poco que cuesta ejecutarlo.
La compañía apareció en los titulares mundiales a principios de 2025 cuando lanzó DeepSeek R1, un modelo de razonamiento que coincidía con el o1 de OpenAI en los puntos de referencia de matemáticas y codificación, cuyo entrenamiento supuestamente costó alrededor de $ 6 millones. Como referencia, se estimó que entrenar al GPT-4 costó más de 100 millones de dólares. Esa noticia borró 600 mil millones de dólares de la capitalización de mercado de NVIDIA en un solo día.
A pesar de ese comienzo explosivo, el impulso de DeepSeek AI se desaceleró a lo largo del año. Su participación en el mercado de modelos de código abierto cayó de alrededor del 50% a principios de 2025 a menos del 25% a finales de año. Perdió la mitad de su posición en el mercado en doce meses.
Versión actual y próximo modelo V4
A medida que los competidores se pusieron al día rápidamente, regresaron en diciembre de 2025 con dos nuevos modelos bajo DeepSeek V3: DeepSeek-V3.2 y DeepSeek-V3.2-Speciale , ambos disponibles de forma gratuita en la web, la aplicación y la API.
Ahora, según se informa, DeepSeek se está preparando para DeepSeek V4. Se espera que aborde los puntos débiles de versiones anteriores y áreas en las que DeepSeek se ha quedado claramente por detrás de sus competidores multimodales, como el procesamiento de contenidos visuales. , búsqueda por IA y memoria de contexto largo .
Parte 2. Fecha de lanzamiento de DeepSeek V4 y lo que sabemos hasta ahora
Mientras muchos han estado esperando, la propia compañía no ha confirmado la fecha de lanzamiento de DeepSeek V4. A principios de marzo, DeepSeek V4 Lite apareció brevemente en la plataforma, lo que generó una anticipación aún mayor. Algunos informes y discusiones iniciales sugieren que podría llegar en abril de 2026.
Sin embargo, hay detalles filtrados sobre la arquitectura y los puntos de referencia internos que dan una idea más clara de para qué se está construyendo V4:
- Codificación: Se dice que el rendimiento de codificación de DeepSeek V4 alcanza alrededor del 81% en SWE-bench Verified, frente al 69% de V3, aunque aún no se ha realizado una verificación independiente. Con una ventana de contexto de 1 millón de tokens, el modelo puede procesar bases de código completas en una sola pasada.
- Memoria a largo plazo: V4 se basa en la arquitectura de memoria Engram, que separa el recuerdo de hechos del razonamiento activo. Los puntos de referencia internos afirman que la precisión de Needle-in-a-Haystack es del 97 % a una escala de un millón de tokens.
- Multimodal: A diferencia de los modelos anteriores de DeepSeek que eran solo de texto, V4 integra texto, imagen y video de forma nativa durante el entrenamiento previo, no como un complemento.
Incluso con este desarrollo, todavía no hay acciones de DeepSeek disponibles en las principales bolsas como NASDAQ o NYSE. DeepSeek es una startup privada china de IA, totalmente financiada y propiedad de High-Flyer, un fondo de cobertura cuantitativo chino. No tiene ninguna cotización pública y no ha anunciado ningún plan para hacerlo.
Precio esperado de DeepSeek V4
Se espera que V4 cueste $0,30 por millón de tokens de entrada y 0,50 $ por millón de tokens de salida . Eso es ligeramente más alto que V3.2 pero aún muy por debajo de los precios de GPT y Claude para sus modelos insignia. La plataforma de chat DeepSeek AI sigue siendo gratuita para usuarios individuales.
La tecnología detrás de DeepSeek V4
Detrás de todo lo que promete DeepSeek V4, hay un conjunto de actualizaciones arquitectónicas que lo hacen posible.
1. Arquitectura MODELO1
Los informes sugieren que MODEL1 es el nombre en clave interno de V4. Combina el marco de entrenamiento mHC con una caché de valores clave (KV) rediseñada a través de la memoria Engram. El resultado es un modelo de billones de parámetros que se ejecuta en hardware que habría sido inadecuado para modelos mucho más pequeños hace unos años. Se suma a la eficiencia del sistema de DeepSeek V4 con una reducción del 40 % en el uso de memoria y una inferencia 1,8 veces más rápida a través de la decodificación Sparse FP8.
2. Decodificación escasa del 8PM
V4 se ejecuta en FP8 de forma predeterminada, que es un formato de procesamiento más ligero y rápido . Para tareas que necesitan más precisión, como razonamiento complejo o matemáticas, puede cambiar automáticamente a FP16. Puedes realizar tareas cotidianas rápidamente sin sacrificar la precisión cuando hay mucho en juego.
3. Módulo de memoria Engram
Si los LLM estándar suelen mantener el recuerdo de hechos y el razonamiento activo en la misma red neuronal, el engrama los divide. El razonamiento permanece en la GPU para un procesamiento rápido, mientras que el almacenamiento factual se comprime y se recupera solo cuando es necesario .
4. Conexiones residuales optimizadas mHC
Una de las principales razones por las que el V4 puede escalar sin aumentar los costos es el mHC. Mejora la forma en que la información se mueve entre capas, con solo aproximadamente un 6,7 % de sobrecarga de entrenamiento adicional. Como resultado, obtienes un modelo más capaz sin el aumento de costos que normalmente esperarías a esta escala . El precio de la API de DeepSeek V4 también puede seguir siendo competitivo a pesar de su tamaño.
Parte 3. Comparación de modelos DeepSeek:R1, V3 y V4
Entonces, ¿cómo se compara DeepSeek V4 con sus predecesores? Hemos colocado los tres modelos uno al lado del otro para que le resulte más fácil ver qué ha cambiado realmente en cada generación.
| R1 | V3 | V4 | |
| Parámetros | 671 000 millones en total, 37 000 millones activos | 671 000 millones en total, 37 000 millones activos | 1 billón (estimado) |
| Ventana contextual | 128.000 tokens | 128.000 tokens | 1 millón de tokens |
| Parámetros de codificación | Comparable a OpenAI o1 | 69 % verificado por SWE-bench | 81 % verificado por SWE-bench (estimado) |
| Características del razonamiento | Modelo de razonamiento de cadena de pensamiento puro | Híbrido; razonamiento destilado de R1 | Híbrido; razonamiento más profundo de contexto largo a través de Engram |
| Multimodal | Solo texto | Solo texto | Texto, imagen, vídeo (nativo) |
| Precios de API (entrada) | $0,55/millón de tokens | $0,14–$0,28/millones de tokens | $0,30/millón de tokens |
Parte 4. Cómo utilizar DeepSeek en su flujo de trabajo creativo
DeepSeek AI no es sólo un chatbot sobre el que haces preguntas. Puede asumir un papel mucho más importante en todo el proceso creativo, como la creación de contenido y la codificación, y asumir el trabajo pesado de las tareas que consumen la mayor parte de su tiempo.
Para creación de contenido
- Generar artículos y guiones estructurados: Proporcione a DeepSeek un tema, un público objetivo y una dirección aproximada. Devuelve un borrador estructurado con encabezados, flujo y puntos de conversación ya implementados. Tu trabajo consiste simplemente en perfeccionar y añadir tu propia voz, no en empezar desde una página en blanco.
- Lluvia de ideas y esquemas: ¿Atrapado en por dónde empezar? Introduzca su idea general en DeepSeek y solicite ángulos, ganchos o variaciones de contorno. Te brinda algo concreto ante lo cual reaccionar, lo cual casi siempre es más rápido que construir desde cero.
Convierte tus ideas en vídeos más rápido con Filmora
Si eres un creador con videos como objetivo final, combina DeepSeek con un editor de video con IA como Wondershare Filmora puede ser la combinación perfecta que podrías haber pedido. Filmora incluye funciones de generación y edición en un solo lugar, para que el guión que acabas de crear en DeepSeek pueda pasar directamente a producción.
Y aunque las capacidades de video nativo de V4 aún están pendientes, Filmora llena ese vacío hoy. Algunas de las características de Filmora que pueden ayudar en tu flujo de trabajo son:
- Guión a vídeo:toma el guión escrito y lo convierte automáticamente en un borrador de vídeo, con metraje, ritmo y cortes incluidos. Dale el guión que DeepSeek AI acaba de escribir y Filmora se encarga del resto.
- Texto a vídeo:¿comenzar a partir de una idea aproximada en lugar de un guión terminado? Escribe un mensaje y Filmora generará un video corto directamente a partir de él que puedes refinar y desarrollar en su línea de tiempo multipista.
También puedes encontrar más herramientas y funciones, o usar AI Mate Editing de Filmora como tu asistente que te guía a través de las ediciones, genera ideas y maneja pequeñas tareas por ti. Como está integrado en un editor de vídeo, todo el proceso permanece en un solo lugar, por lo que puedes pasar de la idea a la exportación final.
Descarga segura
Para codificación y desarrollo
Con una mejor memoria de contexto largo y resultados comparativos más sólidos, también podemos ver a DeepSeek V4 como una alternativa más barata a Claude en términos de capacidad de codificación. Sus capacidades pueden respaldar directamente su flujo de trabajo de desarrollo en algunas áreas clave:
- Depuración y generación de código :Pega tu código roto con una descripción de lo que debería hacer. DeepSeek identifica el problema, lo explica y devuelve una versión corregida. Si está trabajando en un código nuevo, también puede describir la función que necesita y dejar que escriba un primer borrador funcional.
- Trabajar con grandes bases de código: La ventana de contexto de 1 millón de tokens de V4 significa que puede cargar varios archivos a la vez y pedirle a DeepSeek que rastree errores entre dependencias, explique cómo interactúan los componentes o refactorice un módulo con el código base completo en mente.
- Automatizar tareas repetitivas: DeepSeek puede escribir scripts para tareas que repite manualmente, como organización de archivos, formato de datos, generación de informes y llamadas API. Describe lo que estás haciendo y obtendrás algo utilizable en la primera pasada la mayor parte del tiempo.
Parte 5. Comparación de DeepSeek con otros modelos de IA
Según las filtraciones que conocemos hasta ahora, así es como podemos esperar que DeepSeek V4 se compare con las versiones insignia de otros modelos de IA a partir de 2026.
| DeepSeek V4 | GPT-5.4 | Géminis 3.1 Pro | Claude Opus 4.6 | |
| Código abierto | ||||
| Habilidades de razonamiento | Fuerte con memoria Engram que mejora el razonamiento de contexto prolongado | 92,8% GPQA | 94,3% GPQA | 91,3% GPQA |
| Codificación Agentica | ~81 % verificado por SWE-bench (estimado) | 80 % verificado por SWE-bench | 80,6 % verificado por SWE-bench | 80,8 % verificado por SWE-bench |
| Ventana contextual | 1 millón de tokens | 272.000 tokens (estándar); 1 millón de tokens (Codex) | 1 millón de tokens | 1 millón de tokens |
| Entrada (por 1 millón de tokens) | $0,3 | $2,5 | $2 | $5 |
| Salida (por 1 millón de tokens) | $0,5 | $15 | $12 | $25 |
| Mejor para | Cargas de trabajo de API sensibles a los costos, codificación y flexibilidad de código abierto | Versatilidad, uso de la computadora, trabajo del conocimiento | Razonamiento a nivel de doctorado, investigación, precio-rendimiento | Codificación compleja, flujos de trabajo agentes, empresa |
| Ecosistema | Código abierto, autohospedable | Las mayores integraciones de terceros | Integración profunda de Google Workspace | Sólidas herramientas de desarrollo (Cursor, Claude Code) |
En cifras de referencia brutas, los cuatro modelos están más cerca de lo que sugiere el marketing, entre 1 y 2 puntos porcentuales tanto en razonamiento como en codificación. Las diferencias se reducen principalmente al costo y la flexibilidad.
Específicamente en el enfrentamiento entre DeepSeek y ChatGPT, la brecha es más visible en los precios. DeepSeek V4 es aproximadamente 8 veces más barato que GPT-5.4 para un rendimiento de codificación similar. ChatGPT sigue liderando el tamaño y la versatilidad del ecosistema, pero DeepSeek cierra la brecha de calidad significativamente manteniendo los costos bajos.
Parte 6. DeepSeek V4 Reddit y reacciones de la comunidad
Puede que DeepSeek V4 aún no esté disponible, pero una búsqueda rápida de DeepSeek V4 en Reddit muestra que la comunidad de desarrolladores lo ha estado analizando durante meses, con r/DeepSeek actualmente tiene 65.000 visitantes semanales.
La mayoría de las reacciones muestran entusiasmo, mientras que otros se muestran escépticos de que las noticias de DeepSeek V4 sean tan prometedoras como lo sugieren las filtraciones. Después de todo, la mayoría de las cifras de referencia ampliamente citadas se remontan a una publicación eliminada de Reddit (incluida la puntuación del 81 % en SWE-bench) y a un tweet no verificado, no a un documento oficial de DeepSeek V4 ni a pruebas independientes.
Pero si lo hacen, DeepSeek V4 puede convertirse en el modelo de código abierto más capaz disponible a un precio que hace que cualquier otro modelo de vanguardia sea más difícil de justificar.
Conclusión
Hemos desglosado todo sobre DeepSeek V4. El modelo tiene un caso prometedor para desafiar a los gigantes del código cerrado y ayudarlo a trabajar en sus proyectos a una fracción del costo. Pero hasta que salga más información oficial, trate todo lo que ha leído aquí sobre V4 como una pista prometedora, no como un hecho confirmado todavía.
Preguntas frecuentes
-
¿Cuándo saldrá DeepSeek V4?
La estimación más reciente de la fecha de lanzamiento de DeepSeek V4 apunta a abril de 2026. Anteriormente, se especuló con una ventana anterior, pero desde entonces el lanzamiento se retrasó debido a lo que supuestamente es la falla del hardware Huawei Ascend 910B durante el entrenamiento, lo que obligó a un giro de la arquitectura hacia las GPU NVIDIA.
-
¿Qué diferencia a DeepSeek V4 de V3?
Varias actualizaciones clave que diferencian a V4 de V3 son un salto de 128K a una ventana de contexto de 1 millón de tokens, soporte multimodal nativo y una nueva arquitectura de memoria Engram que separa la recuperación de hechos del razonamiento activo. También escala hasta un billón de parámetros y mantiene bajos los costos de inferencia a través de la decodificación Sparse FP8.
-
¿Es DeepSeek V4 mejor que ChatGPT?
En los puntos de referencia sin procesar, V4 y GPT-5.4 están a un par de puntos porcentuales entre sí tanto en tareas de razonamiento como de codificación. Donde DeepSeek avanza es en el costo. Se estima que el V4 es aproximadamente 8 veces más barato por token. Sin embargo, dado que DeepSeek V4 aún no se ha lanzado, es un poco difícil tomar una decisión definitiva.
-
¿Puedes utilizar DeepSeek V4 gratis?
Se espera que la plataforma de chat DeepSeek siga siendo gratuita para usuarios individuales, como lo ha sido con versiones anteriores.