DeepSeek V4-Flash lên Ollama Cloud, máy chủ Mỹ: Claude Code, OpenClaw tích hợp một lần
Ollama Cloud đã niêm yết DeepSeek V4-Flash, suy luận trên máy chủ tại Mỹ, cung cấp ba bộ lệnh một lần để kết nối Claude Code, OpenClaw, Hermes. V4-Flash/V4-Pro sử dụng kiến trúc MoE, hỗ trợ nguyên sinh ngữ cảnh 1M, và giảm chi phí bằng nén theo Token-wise + chú ý thưa DSA; trong bối cảnh 1M, FLOPs cho mỗi token giảm 27%, bộ nhớ đệm KV giảm 10%. API tương thích với OpenAI ChatCompletions và Anthropic, giúp chuyển đổi dễ dàng giữa nhiều quy trình làm việc, đồng thời giảm chi phí và rủi ro về chủ quyền dữ liệu.
ChainNewsAbmedia·41phút trước

