Mensajes de BlockBeats, 4 de abril, según el último informe del medio tecnológico estadounidense The Information: la startup china de IA DeepSeek, próximamente publicará su nuevo modelo insignia de próxima generación V4, que funcionará por completo sobre chips desarrollados por Huawei, y se considera un hito importante para impulsar el proceso de autonomía de los semiconductores en China.
Se espera que V4 se publique en las próximas semanas y que funcione por completo en chips de Huawei. Para ello, DeepSeek ha colaborado durante varios meses con Huawei y con el fabricante de diseño de chips Hualong/寒武纪, reescribiendo partes del código subyacente del modelo para lograr compatibilidad con los chips nacionales.
Cabe destacar que, en esta ocasión, DeepSeek no abrió permisos de pruebas anticipadas de V4 a NVIDIA, sino que solo invitó a empresas nacionales de chips a participar en la optimización temprana, rompiendo con la práctica habitual de la industria.
Alibaba, ByteDance, Tencent y otras grandes tecnológicas chinas ya han comprado por adelantado los chips Ascend 950PR más recientes de Huawei, con un volumen de pedidos de decenas de miles de unidades, con el plan de desplegar V4 mediante servicios en la nube e integrarlo en sus propias aplicaciones de IA. El aumento de la demanda ha impulsado el precio de este chip en aproximadamente 20%.
V4 emplea una arquitectura de expertos mixtos (MoE), con un total de parámetros de aproximadamente 1 billón, y activa aproximadamente 37 mil millones de parámetros por cada inferencia, pudiendo admitir entradas multimodales de texto, imágenes y código mientras mantiene baja latencia.
El año pasado, DeepSeek publicó los modelos de bajo costo V3 y R1, lo que provocó una fuerte caída global de acciones tecnológicas y llevó al mercado a cuestionar si las empresas de IA estadounidenses necesitan gastar decenas de miles de millones de dólares en comprar capacidad de cómputo. Por ello, V4 ha recibido gran atención internacional.