ME News メッセージ、2023年4月12日(UTC+8)、MiniMax社は、そのM2.7モデルがNVIDIA GPUアクセラレーションエンドポイントで利用可能になったことを発表し、NemoClawやOpenClawを含むツールをサポートしています。M2.7はM2シリーズの最新バージョンで、エージェントワークフローや推論、機械学習研究などの複雑なアプリケーションを強化することを目的としています。これは疎結合のハイブリッドエキスパートモデルで、総パラメータ数は2300億、1トークンあたりの活性化パラメータは100億、活性化率は約4.3%、20万トークンのコンテキスト長をサポートし、256のローカルエキスパートを持ち、1トークンあたり8つのエキスパートを活性化し、62層で構成されています。展開を支援するために、NVIDIAはオープンソースのリファレンススタックであるNemoClawをリリースし、OpenClawの安全な展開を簡素化し、NVIDIA Brevクラウドプラットフォームを通じてワンクリックで起動できるようにしています。さらに、NVIDIAはオープンソースコミュニティと協力し、vLLMやSGLangなどのフレームワークに大規模なMoEモデル向けに最適化された高性能コアを統合しています。(出典:InFoQ)
MiniMax M2.7モデルがNVIDIA GPUアクセラレーションエンドポイントにログイン、NemoClawとOpenClawをサポート
ME News メッセージ、2023年4月12日(UTC+8)、MiniMax社は、そのM2.7モデルがNVIDIA GPUアクセラレーションエンドポイントで利用可能になったことを発表し、NemoClawやOpenClawを含むツールをサポートしています。M2.7はM2シリーズの最新バージョンで、エージェントワークフローや推論、機械学習研究などの複雑なアプリケーションを強化することを目的としています。これは疎結合のハイブリッドエキスパートモデルで、総パラメータ数は2300億、1トークンあたりの活性化パラメータは100億、活性化率は約4.3%、20万トークンのコンテキスト長をサポートし、256のローカルエキスパートを持ち、1トークンあたり8つのエキスパートを活性化し、62層で構成されています。展開を支援するために、NVIDIAはオープンソースのリファレンススタックであるNemoClawをリリースし、OpenClawの安全な展開を簡素化し、NVIDIA Brevクラウドプラットフォームを通じてワンクリックで起動できるようにしています。さらに、NVIDIAはオープンソースコミュニティと協力し、vLLMやSGLangなどのフレームワークに大規模なMoEモデル向けに最適化された高性能コアを統合しています。(出典:InFoQ)