MiniMax Merilis Sumber Terbuka Model MiniMax M3 Dengan 428 Miliar Parameter dan Konteks 1 Juta Token
Menurut Beating, MiniMax merilis secara open-source model multimodal native mixture-of-experts (MoE) MiniMax M3, dengan bobotnya di Hugging Face. Model ini memiliki 428 miliar total parameter dengan 23 miliar parameter yang diaktifkan per token, mendukung hingga 1 juta konteks token secara native. Tim pengembang merilis versi terkuantisasi MXFP8 dan mengintegrasikan dukungan untuk kerangka inferensi arus utama termasuk SGLang, vLLM, dan Transformers. MiniMax juga merilis secara open-source pusta
GateNews·1jam yang lalu