Hasil pencarian untuk "LLM"
2026-03-17
13:08

Tether meluncurkan kerangka kerja BitNet LoRA yang mendukung pelatihan model besar di perangkat seluler

Gate News melaporkan bahwa pada 17 Maret, QVAC Fabric di bawah Tether meluncurkan kerangka kerja LoRA fine-tuning lintas platform pertama di dunia yang ditujukan untuk Microsoft BitNet (LLM satu bit), secara signifikan menurunkan ambang batas GPU memory dan daya komputasi untuk pelatihan model besar. Kerangka kerja ini mendukung LoRA fine-tuning dan akselerasi inferensi pada Intel, AMD, Apple Silicon M series, dan mobile GPU (termasuk Adreno, Mali, dan Apple Bionic).
Lainnya
07:09

Pendiri Bersama Sentry Mempertanyakan LLM Memperlambat Kecepatan Pengembangan, Menyatakan OpenClaw Menghasilkan Terlalu Banyak Kode Sudah Sulit untuk Menyelamatkan Diri

Sentry co-founder David Cramer menyatakan bahwa model bahasa besar tidak meningkatkan produktivitas, sebaliknya menghasilkan kode yang kompleks dan memperlambat kecepatan pengembangan. Dia mempertanyakan metode pembuatan kode otomatis, percaya bahwa kualitas output lebih rendah, terutama dalam pengembangan inkremental dan konsistensi gaya. Berdasarkan pengalaman pribadinya, dia menunjukkan bahwa pembangunan perangkat lunak tetap sulit, dan perubahan pada tingkat psikologis mempengaruhi kontribusinya.
Lainnya
11:02

China Academy of Information and Communications Technology Discovers and Fixes Critical Command Injection Vulnerability in OpenClaw

China Academy of Information and Communications Technology dan tim universitas menemukan kerentanan injeksi perintah yang didorong oleh LLM dalam modul bash-tools saat melakukan audit terhadap kerangka kerja open-source OpenClaw. Penyerang dapat mengeksekusi kode jarak jauh dan mencuri data melalui induksi perintah. Proses pengungkapan kerentanan telah dimulai dan saran perbaikan telah diajukan.
Lainnya
09:32

Pendiri Bersama AMI Labs Xie Saining: LLM Dalam Beberapa Hal Adalah "Anti-Bitter Lesson", Model Dunia Adalah Masa Depan

Xie Saining dalam wawancara mengkritik jalur pengembangan AI yang didominasi oleh model bahasa besar saat ini, dengan menganggap bahwa hal tersebut membatasi pembelajaran AI terhadap dunia nyata, dan menekankan keunggulan model dunia. Dia percaya bahwa membangun agen cerdas yang dapat bertahan di dunia nyata lebih menantang, menyebutkan bahwa AMII Labs fokus pada pengumpulan data nyata, dan berencana meluncurkan kacamata pintar AI dan robot di masa depan.
Lainnya
06:07

Subnet Bittensor menyelesaikan pretraining LLM dengan 72 miliar parameter, TAO naik 54,8% dalam dua minggu terakhir

Subnet Bittensor Templar menyelesaikan pretraining model bahasa terdesentralisasi Covenant-72B dengan 72 miliar parameter pada 10 Maret. Model ini menunjukkan performa luar biasa dalam tes MMLU, melampaui beberapa model baseline terpusat. Proyek ini menarik kolaborasi dari lebih dari 70 node, dengan semua bobot dan checkpoint dirilis di bawah lisensi Apache. Dipengaruhi oleh berita ini, Bittensor dan tokennya mengalami kenaikan secara umum.
Lainnya
TAO14,04%
03:37

ETH Zurich Uji Lapangan Kemampuan Konsensus Blockchain Agen AI: Tingkat Keberhasilan Hanya 41,6%

Tim peneliti ETH Zurich menguji kemampuan konsensus Byzantine dari LLM Agent dan menemukan bahwa bahkan tanpa node jahat, tingkat konsensus yang efektif hanya sebesar 41,6%. Seiring bertambahnya node, kesulitan mencapai kesepakatan meningkat, dan setelah menambahkan node jahat, situasinya semakin memburuk. Kesimpulan penelitian menunjukkan bahwa saat ini LLM Agent belum dapat diandalkan dalam hal konsensus yang andal, dan penerapan desentralisasi harus dilakukan dengan hati-hati.
Lainnya
ETH-0,9%
03:07

Andrej Karpathy membuka sumber proyek autoresearch, menjalankan otomatisasi eksperimen pelatihan LLM sebanyak seratus kali

Pendiri Eureka Labs, Andrej Karpathy, merilis proyek open source autoresearch pada 8 Maret, menggunakan mode "Manusia menulis Markdown, AI menulis kode", memungkinkan pengembang untuk mendefinisikan arah penelitian melalui program.md, dan AI secara otomatis mengoptimalkan kode. Setiap jam dapat melakukan sekitar 12 eksperimen, dari 83 eksperimen yang ditampilkan, 15 di antaranya menunjukkan peningkatan yang efektif. Proyek ini berbasis NVIDIA GPU dan PyTorch, telah diuji pada H100 dan mengikuti lisensi MIT.
Lainnya
03:10

Minara Skill v2 dirilis: Menciptakan "jiwa" keuangan digital Web4.0 satu atap untuk Agen AI

Minara merilis Minara Skill v2, meningkatkan kemampuan keuangan digital AI Agent, mendukung pengelolaan aset multi-chain, deposit kartu kredit, dan fitur lainnya, serta mewujudkan transaksi Gasless, menurunkan ambang penggunaan. Selain itu, mengintegrasikan LLM lokal untuk meningkatkan kemampuan percakapan pribadi dan pengambilan keputusan transaksi.
Lainnya
USDC0,02%