DeepSeek відкриває TileKernels з відкритим кодом: бібліотека GPU-ядр для тренування й інференсу великих моделей

Повідомлення Gate News, 23 квітня — DeepSeek відкрив вихідний код TileKernels під ліцензією MIT: бібліотека GPU-ядр для обчислень, написана на TileLang для тренування та інференсу великих мовних моделей. TileLang — це предметно-орієнтована мова, розроблена командою tile-ai для вираження високопродуктивних GPU-ядр у Python. DeepSeek зазначив, що більшість ядер у цій бібліотеці вже наблизилися до граничних можливостей апаратного забезпечення за обчислювальною щільністю та пропускною здатністю пам’яті, причому частини коду вже розгорнуті у внутрішніх операціях тренування та інференсу.

Бібліотека містить шість категорій ядер: MoE (mixture of experts) gating і маршрутизація, включно з вибором експертів Top-k, відображенням токен—експерт і злитими операціями expand/shrink із нормалізацією ваг; квантування, що підтримує формати FP8, FP4 і E5M6 із квантуванням для кожного токена, для кожного блока та для кожного каналу, включно зі злитими операціями SwiGLU+квантування; batch transpose; Engram gating із злитим поширенням уперед/назад RMSNorm і зведенням градієнта ваг; Manifold HyperConnection із нормалізацією Sinkhorn і змішаним split/apply; а також високорівневі інтерфейси autograd, які обгортають низькорівневі ядра в навчальні шари.

Engram і Manifold HyperConnection є власницькими компонентами модельної архітектури DeepSeek, причому деталі реалізації вперше були розкриті публічно. Бібліотека вимагає GPU архітектури NVIDIA SM90 або SM100 (H100/H200 або серії Blackwell), CUDA Toolkit 13.1 або новішу версію, і PyTorch 2.10 або новішу версію.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Aurise Foundation запускає токен золотої дохідності XAUE з $76M початковим резервом

Повідомлення Gate News, 23 квітня — Aurise Foundation оголосила про запуск XAUE, токена золотої дохідності на базі Ethereum, позиціонованого як рівень сховища для Tether Gold (XAUT). Партнери екосистеми Aurelion і Antalpha спільно внесли 16,052 XAU, що становить приблизно $76 мільйон, як початковий резерв. XAUE

GateNews15хв. тому

AVAX One Публікує Результати за I квартал 2026 року: Утримує 14M AVAX, Виручка Подвоюється до $2.4M

Повідомлення Gate News, 23 квітня — AVAX One, криптовалютна казначейська компанія, котра котирується на Nasdaq, оприлюднила попередні результати за I квартал 2026 року: квартальна виручка подвоїлася послідовно приблизно до $2,4 млн, зумовлено зростанням винагород від стейкінгу в Avalanche та операцій з майнінгу Bitcoin. Компанія тримає приблизно

GateNews15хв. тому

Lotus інтегрує фонд WisdomTree Money Market, щоб створити мінімальну дохідність у DeFi-кредитуванні

Повідомлення Gate News, 23 квітня — Довгоочікуваний протокол DeFi-кредитування Lotus до запуску інтегрував Digital Fund Treasury Money Market від WisdomTree (WTGXX) як частину резервної структури, що підтримує LotusUSD — його ключовий токен депозитного сейфу. Це один із перших випадків, коли фонд грошового ринку згадується в разі «»

GateNews54хв. тому

Запуск Delphi AI Prediction Market на основній мережі Gensyn

Повідомлення Gate News, 23 квітня — протокол ринку прогнозів на базі ШІ Delphi офіційно запущено на Gensyn, протоколі обчислень на базі ШІ, що дає змогу людям і агентам ШІ здійснювати угоди з прогнозами на тій самій платформі. Розрахунки виконуються в ланцюжку через перевірені оракули ШІ. Gensyn раніше запустив D

GateNews1год тому

DeFi-платформа Андре Кроньє Flying Tulip запускає автоматичний вимикач для виведення коштів

Повідомлення Gate News, 23 квітня — децентралізована платформа з фінансів (DeFi) Андре Кроньє Flying Tulip запустила механізм автоматичного вимикача для виведення коштів, призначений для затримки або постановки в чергу виведень під час аномальних відпливів капіталу, обмежуючи потенційні збитки та надаючи час для розслідування. Механізм

GateNews1год тому

Pyth Network виведе з експлуатації застосунковий ланцюг Pythnet пізніше у 2026 році, завершує винагороди OIS

Повідомлення Gate News, 23 квітня — Pyth Network оголосила, що застосунковий ланцюг Pythnet буде виведено з експлуатації пізніше у 2026 році після ухвалення пропозиції OP-PIP-100, тоді як пропозиція OP-PIP-103 встановила ставку розподілу винагороди Oracle Integrity Staking (OIS) на нуль, ознаменувавши завершення механізму винагород OIS, який стартував наприкінці 2024 року та залучив приблизно 1 мільярд PYTH у сукупному стейкінгу

GateNews1год тому
Прокоментувати
0/400
Немає коментарів