微軟揭露七款 AI 模型,宣稱在 Claude 與 Nano Banana 之上具備優勢
Microsoft 於週二的年度 Build 活動中揭露七款全新 AI 模型,宣稱在盲測與影像編輯基準測試中,其表現優於 Anthropic 的 Claude Sonnet 4.6 以及 Google 的 Nano Banana 2。此次發布代表微軟的努力,欲讓自己成為前沿 AI 開發者,而不只是 OpenAI 最大的支持者與基礎設施供應商。此公告亦逢領先 AI 開發者之間的競爭持續加劇,因 Anthropic 與 Google 近期相繼推出自家旗艦模型。 MAI-Thinking-1 在盲測中超越 Claude Sonnet 4.6 根據微軟 AI 執行長 Mustafa Suleyman 的說法,MAI-Thinking-1 為微軟的旗艦文字基礎模型,在由獨立評估者進行的盲測中,相較於 Anthropic 的 Claude Sonnet 4.6 更受青睞。該模型在 AIME 2025 的得分為 97%,這是一項衡量進階問題解決與推理能力的指標。Suleyman 表示,該模型的 SWE Bench Pro 成績讓它「在最艱難的程式碼基準測試之一上,與 Opus 4.6 並駕齊驅」。微
1小時前