DeepSeek відкритий код TileKernels, публікує внутрішню бібліотеку ядер GPU для тренування та виведення моделей

BlockBeatNews

Згідно з моніторингом Beating, DeepSeek відкритий код TileKernels під ліцензією MIT, бібліотека GPU-ядр із написанням на TileLang, орієнтована на тренування та інференс великих моделей. TileLang — це предметно-орієнтована мова для вираження високопродуктивних GPU-ядр на Python, розроблена командою tile-ai. DeepSeek стверджує, що більшість ядер у бібліотеці вже наблизилися до апаратних меж у щільності обчислень та пропускній здатності пам’яті, частина з них вже використовується для внутрішнього тренування та інференсу.

Бібліотека містить шість основних типів ядер: керування та маршрутизація MoE (вибір Top-k експертів для гібридної моделі експертів, відображення токенів у експертів, злиття розширення/звуження та нормалізація ваг); кількісне зменшення (підтримка кількісних форматів FP8, FP4, E5M6 для токенів, блоків, каналів, злиття операцій SwiGLU+кількісне зменшення); батчове транспонування; керування Engram (злиття RMSNorm для прямого та зворотного поширення та зведення градієнтів ваг); Manifold HyperConnection (з Sinkhorn-нормалізацією та гібридним розбиттям/застосуванням); а також високорівневий інтерфейс autograd, що інкапсулює базові ядра у треновані шари. Серед них Engram і Manifold HyperConnection — це власні компоненти архітектури моделей DeepSeek, деталі яких вперше оприлюднені разом із кодом.

Для запуску потрібен GPU архітектури NVIDIA SM90 або SM100 (відповідає H100/H200 або серії Blackwell), CUDA Toolkit 13.1 або вище, PyTorch 2.10 або вище.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Anker Unveils First Compute-in-Memory AI Chip Thus, CEO Pledges Unlimited Investment in Advanced Tech

Повідомлення Gate News, 23 квітня — Anker Innovation, провідний глобальний бренд побутової електроніки, представила свій перший нейромережевий чип Compute-in-Memory (CIM) для AI-аудіо під назвою Thus™ 22 квітня. Генеральний директор і засновник Ян Мен розкрив три ключові технологічні ініціативи компанії в edge AI: чип Thus™ chi

GateNews3хв. тому

Колишні керівники Meta запускають Sooth Labs, стартап із прогнозування подій на основі ШІ, залучає $50M за $335M -оцінки

Повідомлення Gate News, 23 квітня — Sooth Labs, лабораторія досліджень ШІ, заснована колишніми співробітниками Meta, залучає приблизно $50 мільйонів за оцінки близько $335 мільйонів, причому Felicis Ventures очолює раунд. Янн Лекун і Джефф Дін, головний науковий співробітник Google, беруть участь як інвестори, тоді як Meta CTO Ендрю Босворт виступає радником, а

GateNews14хв. тому

Компанію з даних для ШІ Mercor обкладено принаймні 7 колективними позовами через витік даних, комп’ютерний нагляд

Повідомлення Gate News, 23 квітня — компанія з розмітки даних для ШІ Mercor, оцінена в $10 мільярд і базується в Сан-Франциско, протягом останніх тижнів стикається щонайменше з сімома колективними позовами через витоки даних від сторонніх осіб. Компанія співпрацює з клієнтами, зокрема OpenAI, Anthropic і Meta, надаючи дані з фідбеком для навчання моделей ШІ через найманих працівників. Витеклі дані включають відеоінтерв’ю підрядників, біометричні дані обличчя та скриншоти з комп’ютерів. Позови, подані у вівторок у Північній Каліфорнії, стверджують, що Mercor зібрала дані для перевірки фону претендентів на роботу та передала їх партнерам, порушивши федеральні нормативні акти. Позивачі також звинувачують компанію в моніторингу комп’ютерів підрядників і передачі даних клієнтам, використанні відеоінтерв’ю для навчання моделей ШІ та навчанні клієнтських моделей матеріалам, які потенційно належать іншим компаніям. Mercor заперечує ці звинувачення, заявляючи, що дотримується всіх застосовних законів, і найняла сторонніх експертів з цифрової криміналістики для розслідування інциденту. Девід Беввіно-Берв, колишній співробітник Goldman Sachs і один із позивачів, стверджує, що під час роботи в Mercor він бачив фінансові моделі та підказки (prompts), що містили маркери інституційних терміналів даних і реальні імена контрагентів, що вказує на наявність запатентованої інформації з інших фірм. Інший позивач, Тхітипун Срінарамвонг, стверджує, що керівники проєктів заохочували працівників використовувати реальні дані зі своїх основних робочих місць лише з анонімізацією, і що рецензенти критикували його подання як "занадто короткі та надто нечіткі", коли він навмисно приховував чутливу інформацію. Mercor вимагає від підрядників встановити програмне забезпечення для знімків екрана Insightful, яке працівники кажуть, може робити скриншоти щохвилини. Беввіно-Берв повідомляє, що Insightful зафіксував зображення приблизно 240 заявок, включно з його банківським рахунком і порталами медичного страхування, без попереднього повідомлення про те, що моніторинг поширюватиметься на роботу, яка виходить за межі діяльності, пов’язаної з Mercor. Meta призупинила партнерство з Mercor і розпочала розслідування. У 2025 році Mercor залучала 30,000 підрядників.

GateNews38хв. тому

SpaceX оцінює загальний доступний ринок у $28,5 трлн: $26,5 трлн надходитимуть із сектора AI

Повідомлення Gate News, 23 квітня — SpaceX оцінює свій загальний доступний ринок (TAM) у $28,5 трлн, згідно з внутрішніми документами. Компанія прогнозує, що понад 90% ринку, приблизно $26,5 трлн, припадатиме на штучний інтелект. Enterprise AI, як очікується, становитиме більшість можливостей ринку AI, представляючи приблизно $22,7 трлн від загального TAM.

GateNews1год тому

«Біблія Навального» Naval запускає AI-фонд USVC, роздрібні інвестори також можуть інвестувати до біржового розміщення в OpenAI, Anthropic

Силіконової долини відомий інвестор Naval, у межах власного фонду AngelList нещодавно запустив новий фонд під назвою USVC, який робить акцент на тому, що звичайні інвестори також можуть опосередковано долучатися до популярних непублічних технологічних компаній, починаючи з мінімального порогу в 500 доларів США: OpenAI, Anthropic, xAI, Vercel, Crusoe, Sierra та Legora. Офіційно його упакували як «інвестування в компанії майбутнього до того, як усе стане очевидним» і наголошують, що це фонд, відкритий для всіх інвесторів, без необхідності мати статус кваліфікованого інвестора; таким чином вони намагаються перетворити венчурні активи, які раніше були доступні лише багатим і «своїм» у колі, на продукт, до якого можуть дотягнутися й роздрібні інвестори. 500 доларів США — цього достатньо, щоб інвестувати в ранні AI-компанії Ключовий наратив USVC дуже прямолінійний: коли все більше зіркових стартапів обирають залишатися в приватному ринку протягом тривалого часу, справжній вибуховий ріст оцінки, як правило, відбувається в I

ChainNewsAbmedia1год тому

Tesla придбає компанію з апаратного забезпечення для ШІ за суму до $2 Billion

Повідомлення Gate News, 23 квітня — Tesla оголосила 23 квітня, що погодилася придбати компанію з апаратного забезпечення для штучного інтелекту за суму до $2 мільярда в звичайних акціях Tesla та у вигляді нагород за акціями. Приблизно $1.8 billion

GateNews1год тому
Прокоментувати
0/400
Немає коментарів