DeepSeek hace de código abierto TileKernels, biblioteca de kernels de GPU para el entrenamiento e inferencia de modelos grandes

Mensaje de Noticias de Gate, 23 de abril — DeepSeek ha hecho de código abierto TileKernels bajo la licencia MIT, una biblioteca de kernels de GPU escrita en TileLang para el entrenamiento y la inferencia de modelos de lenguaje de gran tamaño. TileLang es un lenguaje específico de dominio desarrollado por el equipo tile-ai para expresar kernels de GPU de alto rendimiento en Python. DeepSeek afirmó que la mayoría de los kernels de la biblioteca ya han alcanzado límites de rendimiento del hardware en densidad de cómputo y ancho de banda de memoria, con partes ya desplegadas en operaciones internas de entrenamiento e inferencia.

La biblioteca consta de seis categorías de kernels: MoE (mezcla de expertos)gating y ruteo, que incluye selección de expertos Top-k, mapeo de token a experto y expandir/encoger fusionado con normalización de pesos; cuantización que admite formatos FP8, FP4 y E5M6 con cuantización por token, por bloque y por canal, incluyendo operaciones fusionadas de SwiGLU+cuantización; transposición de lotes; gating Engram con propagación fusionada hacia adelante/atrás de RMSNorm y reducción del gradiente de pesos; Manifold HyperConnection con normalización Sinkhorn y división/aplicación mixta; y interfaces de autograd de alto nivel que envuelven kernels de bajo nivel en capas entrenables.

Engram y Manifold HyperConnection son componentes propietarios de la arquitectura del modelo de DeepSeek, con detalles de implementación divulgados públicamente por primera vez. La biblioteca requiere GPUs de arquitectura NVIDIA SM90 o SM100 (H100/H200 o serie Blackwell), CUDA Toolkit 13.1 o superior, y PyTorch 2.10 o superior.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Aurise Foundation lanza el token de rendimiento en oro XAUE con $76M reserva inicial

Mensaje de Gate News, 23 de abril — La Aurise Foundation anunció el lanzamiento de XAUE, un token de rendimiento en oro basado en Ethereum, presentado como una capa de bóveda para Tether Gold (XAUT). Los socios del ecosistema Aurelion y Antalpha contribuyeron conjuntamente con 16,052 XAU, con un valor de aproximadamente $76 millones, como reserva inicial. XAUE

GateNewsHace15m

AVAX One Informa Resultados de Q1 2026: Tiene 14M de AVAX, Los Ingresos Se Duplican hasta $2.4M

Mensaje de Gate News, 23 de abril — AVAX One, una empresa de tesorería de criptomonedas que cotiza en Nasdaq, publicó resultados preliminares de Q1 2026, con los ingresos trimestrales duplicándose secuencialmente hasta aproximadamente $2.4 millones, impulsados por las recompensas de staking de Avalanche y el crecimiento de las operaciones de minería de Bitcoin. La empresa tiene apro

GateNewsHace15m

Lotus Integrates WisdomTree Money Market Fund to Establish Yield Floor in DeFi Lending

Gate News message, April 23 — Pre-launch DeFi lending protocol Lotus has integrated WisdomTree's Treasury Money Market Digital Fund (WTGXX) as part of the reserve framework backing LotusUSD, its core vault token. This marks one of the first instances of a money market fund being referenced within a

GateNewsHace54m

El lanzamiento del mercado de predicción de IA Delphi en la mainnet de Gensyn

Mensaje de Gate News, 23 de abril — El protocolo de mercado de predicción de IA Delphi se ha lanzado oficialmente en Gensyn, un protocolo de computación de IA, lo que permite que humanos y agentes de IA realicen operaciones de predicción en la misma plataforma. La liquidación se completa on-chain mediante oráculos de IA verificados. Gensyn anteriormente lanzó Delphi en su testnet en diciembre de 2025.

GateNewshace1h

La plataforma DeFi de Andre Cronje Flying Tulip lanza un cortacircuitos de retiros

Mensaje de Gate News, 23 de abril — La plataforma de finanzas descentralizadas (DeFi) de Andre Cronje, Flying Tulip, ha lanzado un mecanismo de «cortacircuitos» de retiros diseñado para retrasar o poner en cola los retiros durante salidas anormales de capital, limitando posibles pérdidas y brindando tiempo para la investigación. El mecanismo

GateNewshace1h

Pyth Network retirará la cadena de aplicaciones Pythnet más adelante en 2026 y termina con las recompensas de OIS

Mensaje de Gate News, 23 de abril — Pyth Network anunció que la cadena de aplicaciones Pythnet será retirada más adelante en 2026 tras la aprobación de la propuesta OP-PIP-100, mientras que la propuesta OP-PIP-103 ha establecido la tasa de distribución de recompensas del Oracle Integrity Staking (OIS) en cero, marcando el fin del mecanismo de recompensas de OIS que se lanzó a finales de 2024 y atrajo aproximadamente 1.000 millones de PYTH en staking acumulado.

GateNewshace1h
Comentar
0/400
Sin comentarios