DeepSeek mantiene pendiente la puesta en marcha de su esperado modelo R2 a pesar del lanzamiento de GPT-5, debido a problemas técnicos persistentes relacionados con la plataforma hardware utilizada durante su entrenamiento. En un primer momento, el equipo de desarrollo confiaba en la potencia de los chips Huawei Ascend para entrenar el R2, pero diversas dificultades técnicas llevaron a cambiar a chips NVIDIA para el entrenamiento, manteniendo los Huawei Ascend únicamente en las tareas de inferencia. Esta decisión refleja las limitaciones todavía presentes en la integración completa del hardware nacional con modelos de inteligencia artificial de alta demanda computacional.
Desafíos técnicos en Huawei Ascend y el desarrollo del modelo R2
Huawei ha enviado un equipo de ingenieros para ayudar a DeepSeek a optimizar la integración del chipset Ascend en el proceso de desarrollo del R2, aunque los avances han sido lentos. El principal cuello de botella identificado es la gestión térmica, que limita la capacidad operativa de los chips Huawei Ascend. Además, la estabilidad insuficiente de la plataforma bajo cargas intensivas de entrenamiento, el soporte software y hardware todavía inmaduro, junto con velocidades de comunicación entre chips inferiores a las ideales, dificultan la viabilidad completa del sistema para DeepSeek.
A pesar de estas dificultades, la colaboración entre DeepSeek y Huawei continúa para asegurar la compatibilidad del modelo R2 con el hardware Ascend durante las fases de inferencia. No obstante, la transición y adaptación resultan complejas, evidenciando las diferencias entre las exigencias de entrenamiento de modelos de alto rendimiento y las capacidades actuales del ecosistema hardware nacional.
Además de los retos técnicos, la demora en el lanzamiento apunta a expectativas internas no satisfechas. El CEO de DeepSeek, Liang Wenfeng, no parece estar conforme con los benchmarks actuales del R2, lo que ha alargado considerablemente los tiempos de desarrollo. La limitación en recursos computacionales añade una presión extra sobre la empresa para acelerar tanto el entrenamiento como el despliegue del modelo, incrementando la dificultad para cumplir con los plazos previstos.
La combinación de factores técnicos y operativos parece ser la principal causa del retraso en la llegada del DeepSeek R2, en un momento donde otros desarrollos de IA avanzan con rapidez a nivel global. El futuro de este proyecto dependerá en gran medida de la capacidad para superar los cuellos de botella en hardware y optimizar la asignación de recursos en fases clave del proceso.
- Huawei Mate X7 revoluciona el mercado con arquitectura Xuanwu y cámara tope de gama a 1760€ - 5 diciembre, 2025
- OnePlus Pad Go 2 revelado con potente MediaTek Dimensity 7300 y pantalla LCD 2.8K de 12 pulgadas - 5 diciembre, 2025
- Antigravity revoluciona el sector con la primera dron panorámico de YingShi, Liu Jingkang confirma retos superados y satisfacción - 5 diciembre, 2025