Gempanya AI berikutnya: Mengapa bahaya sebenarnya bukanlah pembunuh SaaS, tetapi revolusi daya komputasi?

robot
Pembuatan abstrak sedang berlangsung

Penulis: Bruce

Belakangan ini, seluruh dunia teknologi dan investasi sedang memusatkan perhatian pada satu hal yang sama: bagaimana aplikasi AI sedang “menghancurkan” SaaS tradisional. Sejak @AnthropicAI memperlihatkan Claude Cowork yang mampu dengan mudah membantu menulis email, membuat PPT, menganalisis tabel Excel, mulai muncul kepanikan tentang “software sudah mati”. Memang menakutkan, tetapi jika pandanganmu berhenti di situ, kamu mungkin melewatkan gempa besar yang sebenarnya sedang terjadi.

Ini seperti kita semua menengadah melihat peperangan drone di langit, tetapi tidak menyadari bahwa seluruh lempeng benua di bawah kaki kita sedang bergerak perlahan. Badai sejati tersembunyi di bawah permukaan, di sudut yang sebagian besar orang tidak lihat: fondasi kekuatan komputasi yang menopang seluruh dunia AI, sedang mengalami “revolusi diam-diam”.

Dan revolusi ini mungkin akan membuat para penjual alat AI—Nvidia @nvidia—mengakhiri pesta besar yang mereka adakan lebih awal dari yang diperkirakan.

Dua jalur revolusi yang sedang bersilangan

Revolusi ini bukan satu peristiwa tunggal, melainkan gabungan dari dua jalur teknologi yang tampaknya independen. Mereka seperti dua pasukan yang sedang mengepung, membentuk serangan dari kedua sisi terhadap dominasi GPU Nvidia.

Jalur pertama adalah revolusi penyederhanaan algoritma.

Pernahkah kamu berpikir, apakah otak super besar benar-benar perlu mengaktifkan semua neuron saat berpikir? Jelas tidak. DeepSeek sudah memahami hal ini dan menciptakan arsitektur MoE (Model Ahli Campuran).

Bayangkan saja seperti sebuah perusahaan yang mempekerjakan ratusan ahli dari berbagai bidang. Tapi saat rapat untuk menyelesaikan masalah, kamu hanya perlu memanggil dua atau tiga orang yang paling relevan, bukan semua orang untuk brainstorming bersama. Inilah keunggulan MoE: membuat model besar hanya mengaktifkan sebagian kecil “ahli” saat melakukan perhitungan, sehingga sangat menghemat daya komputasi.

Apa hasilnya? Model DeepSeek-V2 secara nominal memiliki 236 miliar “ahli” (parameter), tetapi saat bekerja hanya mengaktifkan sekitar 21 miliar, kurang dari 10% dari totalnya. Tapi performanya bisa menyamai GPT-4 yang membutuhkan 100% daya penuh. Apa artinya ini? Kemampuan AI dan konsumsi daya komputasi tidak lagi saling bergantung!

Dulu, kita semua menganggap semakin kuat AI, semakin banyak kartu GPU yang dibakar. Sekarang, DeepSeek menunjukkan bahwa dengan algoritma cerdas, kita bisa mencapai hasil yang sama dengan biaya sepuluh kali lebih murah. Ini sama saja menantang kebutuhan mendasar Nvidia terhadap GPU.

Jalur kedua adalah revolusi “pergantian jalur” perangkat keras.

AI bekerja dalam dua tahap: pelatihan dan inferensi. Pelatihan seperti bersekolah, harus membaca ribuan buku, dan GPU yang mampu melakukan komputasi paralel besar memang cocok di sini. Tapi inferensi seperti penggunaan AI sehari-hari, lebih mengutamakan kecepatan respons.

GPU memiliki kekurangan alami saat inferensi: memorinya (HBM) adalah eksternal, sehingga data yang masuk dan keluar memiliki latensi. Ini seperti seorang koki yang bahan makanannya disimpan di kulkas di kamar sebelah, setiap kali memasak harus berjalan ke sana, meskipun cepat tetap saja lambat. Perusahaan seperti Cerebras dan Groq merancang chip inferensi khusus yang memuat memori (SRAM) langsung di chip, sehingga bahan makanan ada di tangan, memungkinkan akses “tanpa latensi”.

Pasar sudah membuktikan dengan uang nyata. OpenAI mengeluh tentang performa inferensi GPU Nvidia, tetapi langsung menandatangani kontrak senilai 10 miliar dolar dengan Cerebras untuk menyewa layanan inferensi mereka. Nvidia sendiri juga panik, lalu membeli Groq seharga 20 miliar dolar agar tidak tertinggal di jalur baru ini.

Ketika kedua jalur ini bersilangan: biaya meluncur turun

Sekarang kita satukan kedua hal ini: model DeepSeek yang “lebih ramping” dengan algoritma, berjalan di chip Cerebras yang “tanpa latensi”.

Apa yang akan terjadi?

Sebuah gelombang biaya yang meluncur turun secara masif.

Pertama, model yang lebih ramping sangat kecil sehingga bisa dimuat sekaligus ke dalam memori bawaan chip. Kedua, tanpa hambatan memori eksternal, kecepatan respons AI akan sangat cepat. Akhirnya, biaya pelatihan dengan arsitektur MoE turun 90%, dan biaya inferensi dengan perangkat keras khusus dan perhitungan jarang (sparse) turun satu tingkat lagi. Hitung-hitungannya, total biaya memiliki dan menjalankan AI kelas dunia mungkin hanya 10-15% dari solusi GPU tradisional.

Ini bukan sekadar perbaikan, melainkan perubahan paradigma.

Kursi Nvidia, secara perlahan, sedang digulingkan dari karpetnya

Sekarang kamu harus paham mengapa ini jauh lebih berbahaya daripada “Kegelisahan Cowork”.

Nilai pasar Nvidia yang ratusan triliun hari ini didasarkan pada cerita sederhana: AI adalah masa depan, dan masa depan AI harus bergantung pada GPU saya. Tapi sekarang, fondasi cerita ini mulai goyah.

Di pasar pelatihan, meskipun Nvidia tetap mendominasi, jika pelanggan bisa menyelesaikan pekerjaan dengan sepuluh kali lebih sedikit kartu, maka total pasar bisa menyusut secara signifikan.

Di pasar inferensi, yang jauh lebih besar sepuluh kali lipat dari pasar pelatihan, Nvidia tidak hanya kehilangan keunggulan mutlak, tetapi juga dihadapkan pada serangan dari Google, Cerebras, dan berbagai perusahaan lain. Bahkan pelanggan terbesar mereka, OpenAI, mulai berbalik arah.

Begitu Wall Street menyadari bahwa “alat” Nvidia tidak lagi menjadi satu-satunya pilihan, apalagi yang terbaik, dan bahwa prediksi monopoli permanen mulai goyah, apa yang akan terjadi pada valuasi mereka? Saya yakin semua orang sudah tahu jawabannya.

Jadi, dalam enam bulan ke depan, kemungkinan besar “black swan” terbesar bukanlah aplikasi AI yang mengalahkan satu sama lain, melainkan berita teknologi yang tampaknya sepele: misalnya makalah baru tentang efisiensi algoritma MoE, atau laporan yang menunjukkan peningkatan pangsa pasar chip inferensi khusus, yang secara diam-diam menandai babak baru dalam perang kekuatan komputasi.

Ketika “penjual alat” tidak lagi memiliki satu-satunya pilihan, era keemasan mereka mungkin juga akan berakhir.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan

Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)