Saat ini, bagaimana cara mengatasi "gelembung" AI? - Platform pertukaran mata uang digital terenkripsi yang aman dan terpercaya

最近AI terkait perusahaan saham semuanya karena berbagai putaran pendanaan di Amerika Serikat,

Tidak melihat pengembalian dari investasi besar yang tidak terlihat dan kekurangan likuiditas pasar global mengalami pukulan keras.

Perusahaan besar CSP mengubah depresiasi,

arus kas,

proporsi pengeluaran modal terhadap pendapatan sudah cukup tinggi, saya sudah menyebutkan ini sejak pertengahan tahun lalu,

tapi saat itu pasar mengabaikannya,

terus mendorong AI dengan keras,

sekarang kembali menjadi perbincangan hangat,

Alasan inti dan saat itu sama sekali,

Masih belum melihat laba dan aplikasi viral yang sepadan dengan pengeluaran modal,

Jelasnya, gelembung yang dipandang pasar adalah biaya investasi yang terlalu tinggi.

Tapi saat ini semua orang juga tidak mungkin benar-benar berhenti berinvestasi di AI,

Daripada memprediksi secara abstrak kapan pengeluaran modal akan pecah dan aplikasi viral muncul,

lebih baik mempelajari tren perkembangan industri saat ini untuk memecahkan masalah “gelembung” AI.

Bagaimana cara memecahkannya,

Jawabannya adalah menurunkan biaya,

Setiap tren perkembangan teknologi pasti akan menurunkan biaya per unitnya secara terus-menerus,

Kalau tidak, teknologi itu tidak akan bisa menyebar.

Dari ponsel besar ke ponsel kecil hingga smartphone,

Dari internet ke internet mobile, semuanya berjalan seperti itu.

Jadi, saat ini, tantangan terbesar AI adalah: tingginya pengeluaran modal dan kekurangan listrik,

Yang terkait adalah GPU terlalu mahal,

konsumsi listrik terlalu besar,

Lalu bagaimana menyelesaikan masalah ini,

Ada dua jalur berikut:

Pertama,

Mengurangi biaya sistem kartu kalkulasi

(1) Chip buatan sendiri,

Contoh utamanya adalah Google,

Dan Google sama seperti Apple, memiliki kas yang melimpah,

ekosistem tertutup,

pemain yang menggabungkan perangkat lunak dan keras, bentuk heksagonal,

tentu saja menjadi investasi terakhir dari Bapak Larry Page.

Dari tabel di bawah ini juga bisa dilihat bahwa konfigurasi TPU7 Google masih cukup mumpuni,

Dua unit kemampuan hampir sebanding dengan B300,

Tapi dari segi harga,

membeli satu B300 kira-kira bisa membuat empat TPU7.

Oleh karena itu, panduan pengiriman TPU tahun 26 sudah mencapai empat juta unit,

Hampir menyamai prediksi pengiriman Rubin tahun 26.

Dampaknya terhadap industri adalah,

Jika GPU umum dan kartu buatan sendiri mencapai pasar total 1:1 dalam jangka panjang,

Ini berarti dengan pengeluaran modal yang sama,

dapat mencapai sekitar 1,5 kali lipat kapasitas komputasi dan penggunaan penyimpanan sebelumnya.

Hal yang sama berlaku untuk produk pendukung seperti modul optik,

Lebih banyak kartu berarti permintaan pendukung meningkat.

(Segmen ini saya tulis pada 7 September,

Pas sebelum ledakan penyimpanan ini,

Detailnya bisa dicek dari konten saat itu)

(2) Membagi satu GPU tradisional menjadi dua konfigurasi berbeda: inference + pelatihan mendalam,

menggunakan skema memori yang dipadukan tinggi-rendah,

Contohnya adalah kombinasi Rubin+CPX dari Nvidia dan chip seri Ascend 950pr+950dr,

Bagian logika bisa menggunakan chip yang sama,

Tapi dengan mengadopsi konfigurasi memori berbeda untuk menurunkan biaya.

Misalnya, biaya HBM4 288G sudah mencapai lebih dari 30.000 RMB,

Tapi dengan GDDR7 288G mungkin hanya sekitar 15.000 RMB,

Preprocessing teks yang ringan bisa secara signifikan menurunkan biaya kartu inference saya,

Menggunakan lebih banyak kartu untuk inference.

Ascend 950pr, chip buatan sendiri dari HiSilicon, adalah solusi kartu inference bandwidth tinggi non-tradisional berbasis HBM yang inovatif dari dalam negeri,

Belum resmi dirilis dan tidak cocok untuk diskusi terbuka,

Tapi dalam industri, kemungkinan besar sudah bisa menebak apa itu.

Kedua,

Mengurangi konsumsi listrik server

Dalam berita minggu ini sudah disebutkan,

Untuk mengurangi konsumsi listrik server AI,

Nvidia baru-baru ini memutuskan mengubah memori server dari DDR5 (memori sinkron dinamis berkecepatan data ganda generasi ke-5 yang biasanya digunakan di server),

Menjadi LPDDR5X—yang juga digunakan di banyak ponsel flagship.

Mengenai chip AI domestik yang hemat energi,

Seperti Qualcomm,

Lebih agresif dari Nvidia,

Mereka bahkan menggunakan LPDDR untuk menghemat energi di penyimpanan CPU,

Kita langsung fokus ke penyimpanan GPU,

Tidak bisa bocorkan lebih banyak lagi,

Hanya bisa bilang, kamu tahu sendiri.

Selain itu, mengganti pendingin udara server dengan pendingin cair,

Ini tentu saja sudah tidak perlu dijelaskan lagi,

Pendinginan, ya,

Juga menjadi fokus utama konsumsi energi.

Singkatnya,

Industri akan mengalami banyak perubahan struktural, dan bagian-bagian ini tetap menjadi peluang besar berikutnya.

Penyimpanan,

Minggu ini juga sangat aktif,

Satu masalah adalah likuiditas,

Yang lain adalah ekspansi besar-besaran kapasitas memori.

Pertama, Hynix dan Samsung kapasitas baru yang benar-benar dibangun hanya M15X dan P4 di Pyeongtaek,

Lainnya adalah kapasitas lama yang dialihkan dari proses produksi DDR4/LPDDR5 yang sudah ada,

Sebenarnya bukan penambahan kapasitas baru,

Judul besar tentang ekspansi 8 kali lipat lebih banyak sekadar permainan kata,

Pertama, proses 1C canggih dulu basisnya kecil,

Kedua, lebih dari 50% dari kapasitas adalah upgrade proses dari kapasitas yang sudah ada,

Jumlah total peningkatannya pun terbatas.

Selain itu, ekspansi ini paling cepat bisa terealisasi setelah semester kedua tahun 26,

Ada yang bahkan baru akan terealisasi di tahun 27-28,

Pengadaan bisa disesuaikan dengan permintaan pasar.

Menjaga harga DRAM tetap di posisi tinggi secara fluktuatif,

Memperluas penjualan untuk memenuhi permintaan,

Itulah yang perlu dilakukan produsen memori agar bisa mendapatkan margin tinggi jangka panjang seperti HBM,

Volume dan harga meningkat bersamaan,

Karena DRAM hanya didominasi oleh tiga perusahaan: Samsung, Micron, dan Hynix,

Dikatakan bahwa dua perusahaan Korea di pasar desktop ada semacam kolusi.

Selain itu,

Perlu diperhatikan bahwa,

Harga spot yang terlihat adalah harga kontrak dari produsen,

Jauh lebih rendah dari harga spot,

Bahkan jika harga spot turun setengah, harga dari produsen tetap 50% lebih rendah dari harga spot.

Dari HBM ke penyimpanan umum,

Meningkatkan proporsi bisnis AI secara signifikan,

Saatnya penyedia memori meningkatkan volume dan harga secara bersamaan, “momen modul optik.”

Bank AS juga merilis laporan yang menggambarkan situasi sulit saat ini,

Perbedaan pendapat di kalangan pembeli sangat besar,

Peneliti pembeli optimis terhadap penyimpanan,

Tapi manajer dana takut menjadi korban spekulasi,

Secara umum, yang paham merasa tidak ada masalah,

Tapi yang mengelola uang khawatir,

Hanya bisa menunggu pasar sekunder mencapai titik terendah sebelum melanjutkan.

TAO1,93%
DAI0,12%
AIA-2,61%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan