DeepSeek Merilis TileKernels Secara Open Source, Pustaka Kernel GPU untuk Pelatihan dan Inferensi Model Besar

Pesan Gate News, 23 April — DeepSeek telah merilis TileKernels sebagai open source di bawah lisensi MIT, sebuah pustaka kernel GPU yang ditulis dalam TileLang untuk pelatihan dan inferensi model bahasa besar. TileLang adalah bahasa pemrograman khusus domain yang dikembangkan oleh tim tile-ai untuk mengekspresikan kernel GPU berperforma tinggi dalam Python. DeepSeek menyatakan bahwa sebagian besar kernel dalam pustaka tersebut telah mendekati batas performa perangkat keras pada kepadatan komputasi dan bandwidth memori, dengan sebagian yang sudah dideploy pada operasi pelatihan dan inferensi internal.

Pustaka ini terdiri dari enam kategori kernel: MoE (mixture of experts) gating dan routing, termasuk pemilihan expert Top-k, pemetaan token-ke-expert, dan expand/shrink terfusi dengan normalisasi bobot; kuantisasi yang mendukung format FP8, FP4, dan E5M6 dengan kuantisasi per-token, per-block, dan per-channel, termasuk operasi kuantisasi terfusi SwiGLU+; transpose batch; Engram gating dengan propagasi maju/mundur RMSNorm terfusi dan pengurangan gradien bobot; Manifold HyperConnection dengan normalisasi Sinkhorn dan split/terapkan campuran; serta antarmuka autograd tingkat tinggi yang membungkus kernel tingkat rendah menjadi lapisan yang dapat dilatih.

Engram dan Manifold HyperConnection adalah komponen proprietary dari arsitektur model DeepSeek, dengan detail implementasi yang untuk pertama kalinya diungkapkan secara publik. Pustaka ini memerlukan GPU arsitektur NVIDIA SM90 atau SM100 (H100/H200 atau seri Blackwell), CUDA Toolkit 13.1 atau lebih tinggi, serta PyTorch 2.10 atau lebih tinggi.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Aurise Foundation Meluncurkan Token Imbal Hasil Emas XAUE dengan $76M Cadangan Awal

Pesan Berita Gate, 23 April — Aurise Foundation mengumumkan peluncuran XAUE, token imbal hasil emas berbasis Ethereum yang diposisikan sebagai lapisan brankas untuk Tether Gold (XAUT). Mitra ekosistem Aurelion dan Antalpha secara bersama menyumbang 16,052 XAU, senilai kurang lebih $76 juta, sebagai cadangan awal. XAUE

GateNews15menit yang lalu

AVAX One Melaporkan Hasil Q1 2026: Memegang 14M AVAX, Pendapatan Melonjak Jadi $2,4M

Berita Gate, 23 April — AVAX One, perusahaan perbendaharaan cryptocurrency yang terdaftar di Nasdaq, merilis hasil sementara untuk Q1 2026, dengan pendapatan triwulanan yang berlipat dua secara berurutan menjadi sekitar $2,4 juta, didorong oleh imbal hasil staking Avalanche dan pertumbuhan operasi penambangan Bitcoin. Perusahaan ini memiliki sekitar

GateNews15menit yang lalu

Lotus Mengintegrasikan Dana Money Market WisdomTree untuk Menetapkan Yield Floor dalam Pinjaman DeFi

Gate News pesan, 23 April — Protokol pinjaman DeFi yang akan diluncurkan, Lotus, telah mengintegrasikan WisdomTree's Treasury Money Market Digital Fund (WTGXX) sebagai bagian dari kerangka cadangan yang mendukung LotusUSD, token brankas intinya. Ini menandai salah satu contoh pertama dana money market yang dirujuk dalam a

GateNews54menit yang lalu

Peluncuran Pasar Prediksi AI Delphi di Mainnet Gensyn

Gate News pesan, 23 April — protokol pasar prediksi AI Delphi telah resmi diluncurkan di Gensyn, sebuah protokol komputasi AI, memungkinkan manusia dan agen AI untuk melakukan perdagangan prediksi di platform yang sama. Penyelesaian dilakukan di-chain melalui oracle AI yang diverifikasi. Gensyn sebelumnya meluncurkan D

GateNews1jam yang lalu

Platform DeFi Andre Cronje Flying Tulip Meluncurkan Circuit Breaker Penarikan

Pesan Berita Gate, 23 April — platform keuangan terdesentralisasi Andre Cronje, Flying Tulip, telah meluncurkan mekanisme circuit breaker penarikan yang dirancang untuk menunda atau mengantre penarikan selama arus keluar modal yang tidak normal, membatasi potensi kerugian dan memberi waktu untuk investigasi. Mekanisme tersebut

GateNews1jam yang lalu

Pyth Network Akan Menonaktifkan Rantai Aplikasi Pythnet Nanti di 2026, Mengakhiri Imbalan OIS

Berita Gate, 23 April — Pyth Network mengumumkan bahwa rantai aplikasi Pythnet akan dinonaktifkan pada akhir 2026 setelah disahkannya proposal OP-PIP-100, sementara proposal OP-PIP-103 telah menetapkan tingkat distribusi imbalan Oracle Integrity Staking (OIS) menjadi nol, menandai berakhirnya mekanisme imbalan OIS yang diluncurkan pada akhir 2024 dan menarik sekitar 1 miliar PYTH dalam akumulasi staking

GateNews1jam yang lalu
Komentar
0/400
Tidak ada komentar