特倫斯·陶警告:需要糾正對AI數學革命的過度期待

robot
摘要生成中

特倫斯·陶被譽為數學界的最高權威之一,但最近在深夜發表了一篇重要的文章。內容是對AI協助數學研究能力的謹慎且冷靜的評價。在許多媒體大肆報導AI在數學突破上的消息時,陶呼籲「應該停止神話化這一現象」。

他主張的核心很簡單但重要:AI能在特定問題上產生可驗證的結果,並不代表AI具備真正的數學理解與創新能力,這是兩回事。

AI部分成功帶來的誤解

從媒體的報導來看,常見標題如「AI自主解決人類50年未解的數學難題」等。讀者容易產生AI已具備獨立數學思考能力的印象。

但實際情況如何?查看特倫斯·陶在GitHub上公開的「AI contributions to Erdős problems」專案的詳細分析,情況要複雜得多。

AI在取得成果的問題中,層次不一。有些是超難的核心問題,也有大量是長期未被詳細研究的「長尾問題」。後者屬於「低垂果實」範疇,是目前AI工具較擅長的領域。然而,僅以「解決數」來計算,卻可能將不同難度的問題放在同一層級比較,造成誤導。

更重要的是,陶指出以下幾個因素:

文獻記錄的不完整性:許多網站上的問題未經系統性文獻回顧,「未解決」的標籤多為暫定。AI看似「新解」的問題,實際上文獻中早已有解答。

失敗記錄的缺失:網站只記錄成功案例,未記錄未有進展或失敗的嘗試。因此,AI的成功率看起來比實際高。

問題定義的模糊性:部分Erdős問題表述不嚴謹,甚至含有錯誤。要還原原意,需專業背景知識和語境理解。

Erdős問題的實際成果

根據陶的專案頁面,2026年1月6日,Aristotle和ChatGPT 5.2 Pro也成功解決了#728問題,並完成了Lean的形式驗證。此外,1月8日至10日,#729問題也被同樣解決。

這些案例顯示,在某些問題類型或難度範圍內,AI能產生「可行的證明結構」,甚至進入形式驗證階段。

陶同時重視「AI驅動的文獻回顧」這一類別。AI用來搜尋問題是否已解決,或確認「未解決」判定是否有誤。也就是說,AI的價值不僅在於產生新證明,也在於整理和驗證現有知識體系。

對於形式化證明的驗證過程,陶持謹慎態度。使用Lean等工具進行證明形式化能提升可靠性,但仍存在漏洞:引入隱藏公理、問題定義誤形式化、或利用數學庫的「端點行為」等情況。特別是當形式化證明異常短或異常冗長時,更需留意。

AI不是數學家,而是輔助工具

陶強調,AI並不真正「理解」數學。實際上,AI擅長的是數學的「體力活」——例行作業、填空、證明形式化、論文撰寫與修訂、文獻調查。

這些領域,AI的支援能力是確定的。未來數學研究中,這些技術性工作很可能由AI來完成。

但數學的「靈魂」在於:提出深刻問題、創造新概念、將成果融入整體知識網絡——這些仍然高度依賴人類智慧。

數學的價值不僅在於有解,更在於證明帶來的啟示、與現有理論的聯繫、應用方法的發現,以及「為何採用此途徑」的背景動機說明。AI產生的證明,技術上可能正確,但缺乏這些知識背景,對數學社群的實用價值可能有限。

此外,即使解出一些次要的長尾問題,也不一定能直接發表在一流學術期刊。尤其當解法只是現有模式的小改良時,通過同行評審仍具挑戰。

未來數學:人類與AI的協作

陶此次深夜發文的原因,是希望正確傳達AI時代數學的發展方向。

未來的數學家,可能不再是孤獨的思索者,而是善用AI這個強大支援系統的指揮官。在這個過程中,人類提供方向,AI則開拓具體路徑。這種合作模式,或許能讓數學學科以更快的速度進步。

重點在於:正確評估AI的能力,並避免過度神話化。陶的警告,是呼籲數學界「冷靜下來」。

AI確實在改變數學研究的方法,但真正的革新,來自於人類與AI理解彼此角色、相互補足的時刻。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言