Nhu cầu bộ nhớ AI giảm gấp 6 lần! Công nghệ mới của Google khiến thị trường hoảng sợ, cổ phiếu liên quan cũng lao dốc đồng loạt

CryptoCity

Google đã ra mắt TurboQuant, giảm chiếm dụng bộ nhớ mô hình 6 lần, tăng tốc độ suy luận 8 lần, gây ra sự sụt giảm cổ phiếu bộ nhớ và thảo luận về sự chuyển hướng cầu.

Google đã ra mắt thuật toán TurboQuant, giảm chiếm dụng bộ nhớ của các mô hình ngôn ngữ lớn ít nhất 6 lần, đồng thời nâng cao tốc độ tính toán suy luận lên tới 8 lần mà không hy sinh độ chính xác của mô hình. Thị trường nhanh chóng hiểu công nghệ này là “sự phá hủy ở phía cầu”, với logic rất trực tiếp: nếu nhu cầu bộ nhớ của mô hình AI trong giai đoạn suy luận bị nén lại nhiều lần, điều đó có nghĩa là đường cong nhu cầu của trung tâm dữ liệu cho DRAM, HBM hoặc thậm chí NAND có thể bị điều chỉnh giảm cấu trúc trong tương lai.

Sau khi thông tin được công bố, các cổ phiếu liên quan đến bộ nhớ và lưu trữ đã đồng loạt giảm, bao gồm SanDisk (SNDK) giảm 3,5%, Micron Technology (MU) giảm 3,4%, Western Digital (WDC) giảm 1,63%; trong chuỗi cung ứng châu Á, Samsung Electronics giảm 4,71%, SK Hynix giảm tới 6,23%. Cũng có ý kiến cho rằng TurboQuant có khả năng thay đổi “hiệu quả sử dụng tài nguyên”, thay vì chỉ đơn giản là làm suy yếu nhu cầu.

Thuật toán mới nhất của Google: ít bộ nhớ hơn 6 lần, tốc độ suy luận nhanh hơn 8 lần

Theo giải thích của nhóm nghiên cứu Google, TurboQuant là một thuật toán định lượng (quantization) được thiết kế cho các mô hình ngôn ngữ lớn và hệ thống tìm kiếm vector, tập trung vào việc nén mạnh mẽ “key-value cache” và cấu trúc dữ liệu vector bậc cao, vốn tiêu tốn nhiều tài nguyên nhất trong mô hình AI. Trong các thử nghiệm, công nghệ này có thể nén chiếm dụng bộ nhớ ít nhất 6 lần, đồng thời nâng cao tốc độ tính toán suy luận lên tới 8 lần mà không làm giảm độ chính xác của mô hình.

Bước đột phá này trực tiếp nhắm vào các nút thắt quan trọng trong cơ sở hạ tầng AI hiện tại. Sự mở rộng của AI sinh sinh dựa vào sức mạnh tính toán, phụ thuộc mạnh mẽ vào bộ nhớ băng thông cao như HBM để chứa trọng số mô hình và KV cache quy mô lớn, tránh tình trạng bộ nhớ bị kẹt trong quá trình suy luận. Tuy nhiên, TurboQuant thông qua việc kết hợp các phương pháp như PolarQuant và Quantized Johnson-Lindenstrauss (QJL), hoàn thành việc nén mà không cần “chi phí bộ nhớ bổ sung”, tương đương với việc hoàn thành cùng một hoặc thậm chí hiệu quả hơn với ít tài nguyên phần cứng hơn.

Thuật toán Google gây chấn động bộ nhớ! Các nhà sản xuất bộ nhớ Mỹ và Hàn Quốc đồng loạt giảm

Thị trường nhanh chóng hiểu công nghệ này là “sự phá hủy ở phía cầu”. Sau khi thông tin được công bố, các cổ phiếu liên quan đến bộ nhớ và lưu trữ đã đồng loạt giảm, bao gồm SanDisk (SNDK) giảm 3,5%, Micron Technology (MU) giảm 3,4%, Western Digital (WDC) giảm 1,63%; trong chuỗi cung ứng châu Á, Samsung Electronics giảm 4,71%, SK Hynix giảm tới 6,23%.

Logic phía sau rất trực tiếp: nếu nhu cầu bộ nhớ của mô hình AI trong giai đoạn suy luận bị nén lại nhiều lần, điều đó có nghĩa là đường cong nhu cầu của trung tâm dữ liệu cho DRAM, HBM hoặc thậm chí NAND có thể bị điều chỉnh giảm cấu trúc trong tương lai. Đặc biệt trong bối cảnh ngành AI đang dần chuyển từ “hướng đào tạo” sang “hướng suy luận”, ảnh hưởng biên của công nghệ tối ưu hóa hiệu suất sẽ được khuếch đại.

Tuy nhiên, cũng có ý kiến cho rằng TurboQuant có khả năng thay đổi “hiệu quả sử dụng tài nguyên”, thay vì chỉ đơn giản là làm suy yếu nhu cầu. Khi chi phí giảm và độ trễ giảm, các trường hợp ứng dụng AI có thể còn mở rộng hơn nữa, dẫn đến nhu cầu tính toán tổng thể tiếp tục tăng trưởng, hình thành cấu trúc “giảm cầu đơn vị, tăng cầu tổng thể”. Các nhà sản xuất bộ nhớ lớn đã bán hết công suất trong năm nay, có lẽ thị trường nên suy nghĩ: trần phát triển của AI thực sự lớn đến mức nào?

  • Bài viết được ủy quyền đăng lại từ: 《Chuỗi tin tức》
  • Tiêu đề gốc: 《Công nghệ mới của Google khiến thị trường hoảng sợ, nhu cầu bộ nhớ AI giảm 6 lần! SK Hynix, Micron đồng loạt sụt giảm》
  • Tác giả gốc: Neo
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận