DeepSeek puso a China en el mapa de la IA. El peligro es que aquella revolución se quede en flor de un día
Publicado el 26/08/2025 por Diario Tecnología Artículo original
DeepSeek R1 estaba comiéndose el mundo a principios de año. Este modelo chino, aparentemente salido de la nada, provocó una verdadera conmoción en la industria de la IA, pero desde entonces apenas ha habido movimiento. En realidad ha habido uno, pero lo inquietante es precisamente cuál ha sido ese movimiento.
Hola, DeepSeek V3.1. La startup anunció la semana pasada el lanzamiento de DeepSeek V3.1, una nueva versión que destacaba por ser un híbrido mejorado de DeepSeek V3 (respuesta rápida) y de DeepSeek R1 (razonamiento). Había además buenas noticias en cuanto a su rendimiento: según los benchmarks publicados por sus responsables, era sensiblemente superior al de sus predecesores.
Mejoras visibles (pero no dramáticas). En la "tarjeta del modelo" (Model Card) que sus responsables ofrecen en Hugging Face, DeepSeek V3.1 (en modo razonamiento) demostró comportarse ligeramente mejor que DeepSeek R1-0528, —su anterior versión, más potente— en áreas como la programación o en las pruebas matemáticas, pero algunos usuarios que lo han probado allí comentan que salvo en esas áreas, el modelo es peor y "se comporta de forma pobre a la hora de seguir instrucciones o prompts proporcionados por los usuarios". Otros lo confirman y aseguran que es útil para programadores, pero no para otros ámbitos. También tiene limitaciones en su soporte multimodal, y se centra en el texto en lugar de aportar más opciones para otro tipo de interacción, por ejemplo a partir de mensajes de voz, imagen, vídeo o audio.
Un modelo chino para chips chinos. Pero aún más interesante era que DeepSeek V3.1 ha sido diseñado y puesto en marcha con un objetivo claro: evitar la dependencia de chips extranjeros. La precisión FP8 utilizada hace que este modelo pueda comportarse muy bien en los chips de IA chinos de próxima generación. La estrategia parece muy interesante para la startup, que podría así contar con un modelo muy alineado con las prioridades del gobierno chino. Esto es: usar en la medida de lo posible modelos locales para chips locales.
¿Y R1, qué? A partir de ahí surgen algunas dudas. La primera, la que afecta a DeepSeek R1, el modelo con el que la startup "rompió" el mercado a principios de año. La empresa ha eliminado todas las referencias a este modelo en la característica de "pensamiento profundo", lo que ha generado dudas sobre la potencial aparición de su esperado sucesor, un hipotético DeepSeek R2.
Pierde usuarios. Pero mientras ese teórico modelo llega —si es que lo hace— la empresa se enfrenta a una amenaza más inmediata. Como señalan en SCMP, DeepSeek está perdiendo usuarios (o al menos, relevancia) en los últimos meses. En el primer trimestre del año su cuota de mercado en el ámbito de los modelos de IA Open Source usados en la plataforma en nube PPIO era de un espectacular 99%. Sin embargo, en el segundo trimestre ese porcentaje ha bajado al 80%.
Competencia feroz. Esa caída relevancia tiene una razón obvia: sus competidores locales están apretando. Y mucho. Entre ellos está la familia de modelos Qwen de Alibaba, pero también otros como Kimi-K2-Instruct, de la startup MoonShoot AI —en la que también ha invertido Alibaba—, que está convirtiéndose en uno de los modelos más populares de las últimas semanas.
Retrasos y desaceleración. Precisamente el foco en poder aprovechar al máximo futuros chips chinos parece ser la razón de que ese hipotético DeepSeek R2 se esté retrasando. Al menos esa es la hipótesis que barajan en Financial Times, donde revelaron que la startup ha fracasado a la hora de intentar entrenarlo con chips de Huawei. La situación ha hecho que estén entrenándolo con chips de NVIDIA, y que estén usando los Huawei Ascend para la etapa de inferencia, esto es, la interacción con el modelo vía web o API por parte de los usuarios.
Pero esta actitud es "muy china". Puede que en países occidentales estemos acostumbrados a un ritmo mucho más frenético y que esperemos constantes actualizaciones y mejoras con la mirada puesta en el corto plazo. En China la filosofía suele ser la contraria, y las empresas adoptan una estrategia a largo plazo aunque se pierdan beneficios inmediatos. Mantener un perfil bajo es también habitual entre esas compañías, que intentan no hacer mucho ruido... hasta que lo hacen, como ya demostró DeepSeek. Así pues, habrá que seguir muy atentos a la actividad de esta startup, porque a buen seguro estará trabajando para seguir siendo uno de las protagonistas del panorama de la IA.
Imagen | Tim Reckmann
En Xataka | DeepSeek ha insinuado que ya no necesita los chips de NVIDIA. Creemos saber a quién se los está comprando