特倫斯·陶被譽為數學界的最高權威之一,但最近在深夜發表了一篇重要的文章。內容是對AI協助數學研究能力的謹慎且冷靜的評價。在許多媒體大肆報導AI在數學突破上的消息時,陶呼籲「應該停止神話化這一現象」。他主張的核心很簡單但重要:AI能在特定問題上產生可驗證的結果,並不代表AI具備真正的數學理解與創新能力,這是兩回事。## AI部分成功帶來的誤解從媒體的報導來看,常見標題如「AI自主解決人類50年未解的數學難題」等。讀者容易產生AI已具備獨立數學思考能力的印象。但實際情況如何?查看特倫斯·陶在GitHub上公開的「AI contributions to Erdős problems」專案的詳細分析,情況要複雜得多。AI在取得成果的問題中,層次不一。有些是超難的核心問題,也有大量是長期未被詳細研究的「長尾問題」。後者屬於「低垂果實」範疇,是目前AI工具較擅長的領域。然而,僅以「解決數」來計算,卻可能將不同難度的問題放在同一層級比較,造成誤導。更重要的是,陶指出以下幾個因素:**文獻記錄的不完整性**:許多網站上的問題未經系統性文獻回顧,「未解決」的標籤多為暫定。AI看似「新解」的問題,實際上文獻中早已有解答。**失敗記錄的缺失**:網站只記錄成功案例,未記錄未有進展或失敗的嘗試。因此,AI的成功率看起來比實際高。**問題定義的模糊性**:部分Erdős問題表述不嚴謹,甚至含有錯誤。要還原原意,需專業背景知識和語境理解。## Erdős問題的實際成果根據陶的專案頁面,2026年1月6日,Aristotle和ChatGPT 5.2 Pro也成功解決了#728問題,並完成了Lean的形式驗證。此外,1月8日至10日,#729問題也被同樣解決。這些案例顯示,在某些問題類型或難度範圍內,AI能產生「可行的證明結構」,甚至進入形式驗證階段。陶同時重視「AI驅動的文獻回顧」這一類別。AI用來搜尋問題是否已解決,或確認「未解決」判定是否有誤。也就是說,AI的價值不僅在於產生新證明,也在於整理和驗證現有知識體系。對於形式化證明的驗證過程,陶持謹慎態度。使用Lean等工具進行證明形式化能提升可靠性,但仍存在漏洞:引入隱藏公理、問題定義誤形式化、或利用數學庫的「端點行為」等情況。特別是當形式化證明異常短或異常冗長時,更需留意。## AI不是數學家,而是輔助工具陶強調,AI並不真正「理解」數學。實際上,AI擅長的是數學的「體力活」——例行作業、填空、證明形式化、論文撰寫與修訂、文獻調查。這些領域,AI的支援能力是確定的。未來數學研究中,這些技術性工作很可能由AI來完成。但數學的「靈魂」在於:提出深刻問題、創造新概念、將成果融入整體知識網絡——這些仍然高度依賴人類智慧。數學的價值不僅在於有解,更在於證明帶來的啟示、與現有理論的聯繫、應用方法的發現,以及「為何採用此途徑」的背景動機說明。AI產生的證明,技術上可能正確,但缺乏這些知識背景,對數學社群的實用價值可能有限。此外,即使解出一些次要的長尾問題,也不一定能直接發表在一流學術期刊。尤其當解法只是現有模式的小改良時,通過同行評審仍具挑戰。## 未來數學:人類與AI的協作陶此次深夜發文的原因,是希望正確傳達AI時代數學的發展方向。未來的數學家,可能不再是孤獨的思索者,而是善用AI這個強大支援系統的指揮官。在這個過程中,人類提供方向,AI則開拓具體路徑。這種合作模式,或許能讓數學學科以更快的速度進步。重點在於:正確評估AI的能力,並避免過度神話化。陶的警告,是呼籲數學界「冷靜下來」。AI確實在改變數學研究的方法,但真正的革新,來自於人類與AI理解彼此角色、相互補足的時刻。
特倫斯·陶警告:需要糾正對AI數學革命的過度期待
特倫斯·陶被譽為數學界的最高權威之一,但最近在深夜發表了一篇重要的文章。內容是對AI協助數學研究能力的謹慎且冷靜的評價。在許多媒體大肆報導AI在數學突破上的消息時,陶呼籲「應該停止神話化這一現象」。
他主張的核心很簡單但重要:AI能在特定問題上產生可驗證的結果,並不代表AI具備真正的數學理解與創新能力,這是兩回事。
AI部分成功帶來的誤解
從媒體的報導來看,常見標題如「AI自主解決人類50年未解的數學難題」等。讀者容易產生AI已具備獨立數學思考能力的印象。
但實際情況如何?查看特倫斯·陶在GitHub上公開的「AI contributions to Erdős problems」專案的詳細分析,情況要複雜得多。
AI在取得成果的問題中,層次不一。有些是超難的核心問題,也有大量是長期未被詳細研究的「長尾問題」。後者屬於「低垂果實」範疇,是目前AI工具較擅長的領域。然而,僅以「解決數」來計算,卻可能將不同難度的問題放在同一層級比較,造成誤導。
更重要的是,陶指出以下幾個因素:
文獻記錄的不完整性:許多網站上的問題未經系統性文獻回顧,「未解決」的標籤多為暫定。AI看似「新解」的問題,實際上文獻中早已有解答。
失敗記錄的缺失:網站只記錄成功案例,未記錄未有進展或失敗的嘗試。因此,AI的成功率看起來比實際高。
問題定義的模糊性:部分Erdős問題表述不嚴謹,甚至含有錯誤。要還原原意,需專業背景知識和語境理解。
Erdős問題的實際成果
根據陶的專案頁面,2026年1月6日,Aristotle和ChatGPT 5.2 Pro也成功解決了#728問題,並完成了Lean的形式驗證。此外,1月8日至10日,#729問題也被同樣解決。
這些案例顯示,在某些問題類型或難度範圍內,AI能產生「可行的證明結構」,甚至進入形式驗證階段。
陶同時重視「AI驅動的文獻回顧」這一類別。AI用來搜尋問題是否已解決,或確認「未解決」判定是否有誤。也就是說,AI的價值不僅在於產生新證明,也在於整理和驗證現有知識體系。
對於形式化證明的驗證過程,陶持謹慎態度。使用Lean等工具進行證明形式化能提升可靠性,但仍存在漏洞:引入隱藏公理、問題定義誤形式化、或利用數學庫的「端點行為」等情況。特別是當形式化證明異常短或異常冗長時,更需留意。
AI不是數學家,而是輔助工具
陶強調,AI並不真正「理解」數學。實際上,AI擅長的是數學的「體力活」——例行作業、填空、證明形式化、論文撰寫與修訂、文獻調查。
這些領域,AI的支援能力是確定的。未來數學研究中,這些技術性工作很可能由AI來完成。
但數學的「靈魂」在於:提出深刻問題、創造新概念、將成果融入整體知識網絡——這些仍然高度依賴人類智慧。
數學的價值不僅在於有解,更在於證明帶來的啟示、與現有理論的聯繫、應用方法的發現,以及「為何採用此途徑」的背景動機說明。AI產生的證明,技術上可能正確,但缺乏這些知識背景,對數學社群的實用價值可能有限。
此外,即使解出一些次要的長尾問題,也不一定能直接發表在一流學術期刊。尤其當解法只是現有模式的小改良時,通過同行評審仍具挑戰。
未來數學:人類與AI的協作
陶此次深夜發文的原因,是希望正確傳達AI時代數學的發展方向。
未來的數學家,可能不再是孤獨的思索者,而是善用AI這個強大支援系統的指揮官。在這個過程中,人類提供方向,AI則開拓具體路徑。這種合作模式,或許能讓數學學科以更快的速度進步。
重點在於:正確評估AI的能力,並避免過度神話化。陶的警告,是呼籲數學界「冷靜下來」。
AI確實在改變數學研究的方法,但真正的革新,來自於人類與AI理解彼此角色、相互補足的時刻。