Theo giám sát Beating, DeepSeek đã mở mã nguồn TileKernels theo Giấy phép MIT, một thư viện lõi GPU viết bằng TileLang, hướng tới các tình huống huấn luyện và suy luận mô hình lớn. TileLang là một ngôn ngữ đặc dụng dùng Python để biểu diễn các lõi GPU hiệu suất cao, do nhóm tile-ai phát triển. DeepSeek cho biết phần lớn các lõi trong thư viện đã gần đạt đến giới hạn hiệu suất phần cứng về mật độ tính toán và băng thông bộ nhớ, một số đã được sử dụng trong huấn luyện và suy luận nội bộ.
Thư viện gồm sáu loại lõi chính: Điều khiển và định tuyến MoE (lựa chọn chuyên gia Top-k trong mô hình chuyên gia hỗn hợp, ánh xạ token tới chuyên gia, mở rộng/rút gọn hợp nhất và chuẩn hóa trọng số); lượng tử hóa (hỗ trợ định dạng FP8, FP4, E5M6 theo token, theo khối, theo kênh, bao gồm các phép lượng tử hóa kết hợp SwiGLU+); chuyển đổi theo lô; Điều khiển Engram (bao gồm hợp nhất RMSNorm trong truyền tiến/lùi và giảm trọng số); Manifold HyperConnection (bao gồm chuẩn hóa Sinkhorn và phân tách/hợp nhất hỗn hợp); và đóng gói các lõi nền thành các lớp có thể huấn luyện được qua giao diện autograd cao cấp. Trong đó, Engram và Manifold HyperConnection là các thành phần độc quyền trong kiến trúc mô hình DeepSeek, lần đầu tiên tiết lộ chi tiết thực hiện cùng mã nguồn này.
Yêu cầu chạy: GPU kiến trúc NVIDIA SM90 hoặc SM100 (tương ứng H100/H200 hoặc dòng Blackwell), Bộ công cụ CUDA 13.1 trở lên, PyTorch 2.10 trở lên.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
Anker Ra Mắt Chip AI Compute-in-Memory Đầu Tiên Thus, Giám Đốc Điều Hành Cam Kết Đầu Tư Không Giới Hạn Vào Công Nghệ Tiên Tiến
Tin Gate News, ngày 23 tháng 4 — Anker Innovation, một thương hiệu hàng đầu toàn cầu về điện tử tiêu dùng, đã giới thiệu chip âm thanh AI Compute-in-Memory (CIM) mạng nơ-ron đầu tiên của mình có tên Thus™ vào ngày 22 tháng 4. Giám đốc điều hành và nhà sáng lập Yang Meng đã công bố ba sáng kiến công nghệ lớn của công ty trong AI tại biên (edge AI): chip Thus™ chi
GateNews3phút trước
Các cựu lãnh đạo Meta ra mắt Sooth Labs, startup dự đoán sự kiện AI huy động $50M với định giá $335M
Tin từ cổng thông tin, ngày 23 tháng 4 — Sooth Labs, một phòng thí nghiệm nghiên cứu AI được thành lập bởi các cựu nhân viên Meta, đang huy động khoảng $50 triệu với định giá vào khoảng $335 triệu, trong đó Felicis Ventures dẫn dắt vòng gọi vốn. Yann LeCun và Jeff Dean, nhà khoa học trưởng của Google, tham gia với tư cách nhà đầu tư, trong khi M
GateNews14phút trước
Công ty Dữ liệu AI Mercor Bị Tấn Công Bởi Ít Nhất 7 Vụ Kiện Tập Thể Liên Quan Đến Rò Rỉ Dữ Liệu, Giám Sát Máy Tính
Tin tức cổng, ngày 23 tháng 4 — Công ty gán nhãn dữ liệu AI Mercor, được định giá $10 tỷ USD và có trụ sở tại San Francisco, trong vài tuần gần đây đang đối mặt với ít nhất bảy vụ kiện tập thể do vi phạm dữ liệu bên thứ ba. Công ty làm việc với các khách hàng bao gồm OpenAI, Anthropic và Meta, cung cấp dữ liệu phản hồi
GateNews38phút trước
SpaceX Ước Tính Quy Mô Thị Trường Có Thể Phục Vụ Tối Đa Lên Tới 28,5 Tỷ USD, Với 26,5T Đến Từ Ngành AI
Tin tức Gate, ngày 23 tháng 4 — Theo các tài liệu nội bộ, SpaceX ước tính quy mô thị trường có thể phục vụ tối đa (TAM) của mình ở mức 28,5 nghìn tỷ USD. Công ty dự báo rằng hơn 90% của thị trường, tương đương khoảng 26,5 nghìn tỷ USD, sẽ đến từ trí tuệ nhân tạo.
Trí tuệ nhân tạo doanh nghiệp dự kiến sẽ chiếm phần lớn cơ hội thị trường AI, đại diện cho khoảng 22,7 nghìn tỷ USD trong tổng TAM.
GateNews1giờ trước
《Sách Naval》Naval ra mắt Quỹ AI USVC, nhà đầu tư cá nhân cũng có thể đầu tư trước khi niêm yết OpenAI, Anthropic
Nhà đầu tư nổi tiếng ở Thung lũng Silicon Naval thuộc hệ sinh thái AngelList mới đây đã ra mắt một quỹ mới mang tên USVC, nhắm đến việc cho phép các nhà đầu tư phổ thông cũng có thể gián tiếp tham gia vào các công ty công nghệ chưa niêm yết nổi tiếng như OpenAI, Anthropic, xAI, Vercel, Crusoe, Sierra và Legora với ngưỡng tham gia thấp nhất là 500 đô la Mỹ.
Phía chính thức đã đóng gói nó như “Đầu tư để xây dựng các công ty của tương lai trước khi mọi thứ trở nên rõ ràng” và nhấn mạnh đây là một quỹ mở cho tất cả nhà đầu tư, không cần có điều kiện tư cách nhà đầu tư được công nhận/đủ điều kiện, nhằm biến tài sản đầu tư mạo hiểm trước đây chỉ thuộc về người giàu và người trong vòng, thành một sản phẩm mà ngay cả nhà đầu tư lẻ cũng có thể tiếp cận.
Chỉ cần 500 đô la là có thể đầu tư vào các công ty AI giai đoạn sớm
Cốt lõi của câu chuyện mà USVC truyền tải rất trực tiếp: khi ngày càng nhiều startup ngôi sao lựa chọn ở lại thị trường tư nhân trong thời gian dài, thì mức tăng trưởng định giá mang tính bùng nổ thực sự thường diễn ra trong I
ChainNewsAbmedia1giờ trước
Tesla sẽ mua công ty phần cứng AI với giá lên tới $2 tỷ
Tin tức Gate, ngày 23 tháng 4 — Tesla cho biết vào ngày 23 tháng 4 rằng họ đã đồng ý mua một công ty phần cứng trí tuệ nhân tạo với giá lên tới $2 tỷ đô la bằng cổ phiếu phổ thông Tesla và các khoản thưởng bằng cổ phiếu.
Khoảng $1,8 tỷ
GateNews1giờ trước