2025-12-20 01:21:10

Hiệu quả suy luận của mô hình mã nguồn mở GPT chạy trên GPU Blackwell đã được cải thiện đáng kể chỉ trong một tháng - sức mạnh xử lý mã thông báo trên mỗi đơn vị chi phí đã tăng 33%. Bước đột phá này là do công việc tối ưu hóa các dự án vLLM và hỗ trợ phần cứng của NVIDIA, trực tiếp làm giảm ngưỡng chi phí triển khai mô hình ngôn ngữ lớn. Đối với lớp ứng dụng Web3, điều này có nghĩa là chi phí của cơ sở hạ tầng suy luận AI tiếp tục giảm, điều này sẽ thúc đẩy hơn nữa việc mở rộng ranh giới khả thi của các ứng dụng AI on-chain và hợp đồng thông minh.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

7 thích