Gate Newsの報道によると、3月25日にCursorはComposer 2の技術レポートを公開し、完全なトレーニング計画を初めて明らかにしました。基盤モデルKimi K2.5はMoEアーキテクチャを採用し、総パラメータは1.04兆、活性化パラメータは320億です。トレーニングは二段階に分かれています。まずコードデータを用いた継続事前学習でエンコード知識を強化し、その後大規模な強化学習を通じてエンドツーエンドのコーディング能力を向上させます。RL環境は実際のCursorの使用シナリオを完全に模擬しており、ファイル編集、端末操作、コード検索などのツール呼び出しを含み、モデルが本番環境に近い条件下で学習できるようになっています。レポートでは、自社開発のベンチマークCursorBenchの構築方法も併せて公開されており、これはエンジニアリングチームの実際のコーディングセッションからタスクを収集したもので、人工的に作成したものではありません。基盤モデルKimi K2.5はこのベンチマークで36.0点を獲得し、二段階のトレーニング後のComposer 2は61.3点に達し、70%の向上を示しています。Cursorは、推論コストが先端の大規模モデルAPIよりも著しく低く、精度とコストの両面でパレート最適を実現していると述べています。