Ingin membuat AI Agent sendiri? Koleksi 12 model LLM, Anda juga dapat melatih alat yang baik!

Question

Saya hampir setiap hari menerima pertanyaan yang serupa. Setelah membantu membangun lebih dari 20 entitas AI dan menghabiskan banyak biaya dalam menguji model, saya mengambil beberapa pengalaman yang benar-benar efektif.

Berikut adalah panduan lengkap tentang bagaimana memilih LLM yang sesuai.

Sumber gambar: TechFlow Shenzhen

Industri Model Bahasa Besar (LLM) saat ini mengalami perubahan yang cepat. Hampir setiap minggu ada model baru yang dirilis, dan setiap model mengklaim dirinya sebagai yang terbaik.

Tetapi kenyataannya adalah: tidak ada model yang dapat memenuhi semua kebutuhan.

Setiap model memiliki skenario aplikasi khusus.

Saya telah menguji puluhan model dan berharap pengalaman saya dapat membantu Anda menghindari pemborosan waktu dan uang yang tidak perlu.

Sumber gambar: TechFlow Shenzhen

Perlu dijelaskan bahwa artikel ini bukan berdasarkan pengujian laboratorium atau pemasaran.

Saya akan berbagi pengalaman praktis dalam membangun AI fisik dan produk AI generatif (GenAI) selama dua tahun terakhir.

Pertama-tama, kita perlu memahami apa itu LLM:

Model Bahasa Besar (LLM) seperti mengajar komputer untuk "berbicara." Berdasarkan apa yang Anda ketik, ini memprediksi kata-kata yang paling mungkin muncul berikutnya.

Titik awal dari teknologi ini adalah makalah klasik ini: Perhatian Hanyalah Yang Anda Butuhkan

Pengetahuan Dasar - Perbedaan antara Kode Sumber Tertutup dan Kode Sumber Terbuka LLM:

Kode Sumber Tertutup: Misalnya GPT-4 dan Claude, biasanya dibayar berdasarkan penggunaan dan dijalankan oleh penyedia yang di-host.

Source code terbuka: misalnya Llama dan Mixtral dari Meta, harus dideploy dan dijalankan oleh pengguna sendiri.

Ketika baru mengenalnya, mungkin Anda akan bingung dengan istilah-istilah ini, tetapi memahami perbedaan di antara keduanya sangat penting.

Sumber gambar: TechFlow Shenzhen

Skala model tidak selalu berarti kinerja yang lebih baik:

Misalnya, 7B berarti model tersebut memiliki 7 miliar parameter.

Namun model yang lebih besar tidak selalu lebih baik. Kuncinya adalah memilih model yang sesuai dengan kebutuhan Anda.

Sumber gambar: TechFlow Shenzhen

Jika Anda perlu membangun bot X/Twitter atau AI sosial:

@xai's Grok adalah pilihan yang sangat bagus:

Menyediakan kuota gratis yang murah hati

Kemampuan untuk memahami konteks sosial sangat baik

Meskipun kode sumbernya tertutup, ini sangat layak dicoba

Model ini sangat direkomendasikan untuk pemula! (Selentingan:

Model default Eliza @ai16zdao menggunakan XAI Grok)

Jika Anda perlu menangani konten multibahasa:

Model QwQ @Alibaba_Qwen berkinerja sangat baik dalam pengujian kami, terutama dalam pemrosesan bahasa Asia.

Perlu dicatat bahwa data pelatihan model ini terutama dari Cina daratan, sehingga beberapa konten mungkin memiliki informasi yang hilang.

Sumber gambar: TechFlow Shenzhen

Jika Anda memerlukan model yang serbaguna atau memiliki kemampuan penalaran yang kuat:

@OpenAI 的模型依然是業界的佼佼者：

Performa stabil dan dapat diandalkan

Setelah pengujian praktis yang luas

Memiliki mekanisme keamanan yang kuat

Ini adalah titik awal yang ideal untuk sebagian besar proyek.

Sumber gambar: TechFlow Shenzhen

Jika Anda seorang pengembang atau pembuat konten:

Claude dari @AnthropicAI adalah alat yang saya gunakan secara rutin sebagai alat utama:

Kemampuan pengkodean sangat baik

Responnya jelas dan rinci.

Bagus untuk pekerjaan yang berhubungan dengan materi iklan

Sumber gambar: TechFlow Shenzhen

Llama 3.3 dari Meta baru-baru ini mendapatkan perhatian yang besar:

Performa stabil dan dapat diandalkan

Model open source, fleksibel dan bebas

Anda dapat mencobanya melalui @OpenRouterAI atau @GroqInc

Misalnya, proyek kripto x AI seperti @virtuals_io sedang mengembangkan produk berdasarkan itu.

Sumber gambar: TechFlow Shenzhen

Jika Anda memerlukan AI berjenis peran bermain:

MythoMax 13B milik @TheBlokeAI saat ini menjadi pemimpin di industri peran, telah berada di puncak peringkat terkait selama beberapa bulan berturut-turut.

Command R+ dari Cohere adalah model yang sangat baik yang kurang dihargai:

Menunjukkan kinerja yang luar biasa dalam tugas peran bermain

Mampu mengatasi tugas yang kompleks dengan mudah

Dukungan jendela konteks hingga 128.000, memiliki kapasitas 'memori' yang lebih panjang

Sumber gambar: TechFlow Shenzhen

Model Gemma Google adalah pilihan yang ringan namun kuat:

Fokus pada tugas tertentu dan excel

Ramah anggaran

Cocok untuk proyek yang sensitif terhadap biaya

Pengalaman pribadi: Saya sering menggunakan model Gemma kecil sebagai "hakim netral" dalam alur kerja AI, dan hasilnya sangat baik dalam tugas verifikasi!

Sumber gambar: TechFlow Shenzhen

Gemma

@MistralAI 的模型值得一提：

Sumber terbuka tetapi dengan kualitas tinggi

Kinerja model Mixtral sangat kuat

Khususnya ahli dalam tugas penalaran yang kompleks

It has received widespread praise from the community and is definitely worth a try.

AI terdepan di tanganmu.

Saran Profesional: Cobalah untuk mencampur dan mencocokkan!

Setiap model memiliki keunggulan masing-masing

Anda dapat membuat 'tim' AI untuk tugas yang kompleks

Memungkinkan setiap model fokus pada bagian yang paling mereka kuasai

Seperti membangun tim impian, setiap anggota memiliki peran dan kontribusi yang unik.

Bagaimana cara cepat memulai:

Pengujian model dengan @OpenRouterAI atau @redpill _gpt, platform ini mendukung pembayaran cryptocurrency, yang sangat nyaman

adalah alat yang sangat baik untuk membandingkan kinerja model yang berbeda

Jika Anda ingin menghemat biaya dan menjalankan model Anda secara lokal, Anda dapat mencoba bereksperimen dengan GPU Anda sendiri menggunakan @ollama.

Sumber gambar: TechFlow Shenzhen

Jika Anda mencari kecepatan, teknologi LPU @GroqInc menawarkan kecepatan inferensi yang sangat cepat:

Meskipun pilihan model terbatas

Namun kinerjanya sangat cocok untuk diterapkan dalam lingkungan produksi

Sumber gambar: TechFlow Shenzhen

【Penafian】 Pasar berisiko, dan investasi perlu berhati-hati. Artikel ini bukan merupakan saran investasi dan pengguna harus mempertimbangkan apakah ada pendapat, pendapat atau kesimpulan di sini yang sesuai untuk keadaan khusus mereka. Investasikan sesuai dengan risiko Anda sendiri.

Artikel ini dicetak ulang dengan izin dari: Deep Tide TechFlow

Penulis asli: superoo7

"Ingin membuat AI Agent sendiri? Simpanlah 12 model LLM ini, Anda juga dapat melatih alat yang baik!" Artikel ini pertama kali diterbitkan di "Kota Enkripsi".