ITBear旗下自媒體矩陣:

DeepMind AI破解數(shù)學(xué)奧賽幾何題,金牌水平不在話下?

   時間:2025-02-08 07:58:28 來源:ITBEAR編輯:快訊團隊 發(fā)表評論無障礙通道

近期,科技界迎來了一項令人矚目的成就:谷歌DeepMind實驗室的人工智能系統(tǒng)AlphaGeometry2,在攻克國際數(shù)學(xué)奧林匹克競賽(IMO)中的幾何難題上,取得了前所未有的突破,其解題能力甚至超越了歷年的金牌平均水平。

AlphaGeometry2是DeepMind在今年早些時候推出的AlphaGeometry系統(tǒng)的升級版。據(jù)DeepMind團隊最新發(fā)布的論文顯示,這一AI系統(tǒng)能夠解答過去25年間國際數(shù)學(xué)奧林匹克競賽中出現(xiàn)的84%的幾何題目。國際數(shù)學(xué)奧林匹克競賽作為面向全球高中生的頂級數(shù)學(xué)賽事,其難度與挑戰(zhàn)性不言而喻。而DeepMind認(rèn)為,探索解決復(fù)雜幾何問題,尤其是歐幾里得幾何問題的新方法,或許能夠為開發(fā)更強大的人工智能提供關(guān)鍵線索。

在數(shù)學(xué)領(lǐng)域,證明定理或解釋定理為何成立,不僅需要嚴(yán)密的邏輯推理能力,還需要從眾多可能的解題路徑中做出正確選擇。如果DeepMind的見解正確,那么這些解題技巧將是未來構(gòu)建通用人工智能模型不可或缺的要素。

去年夏天,DeepMind曾展示過一個結(jié)合AlphaGeometry2與AlphaProof(一個專注于形式化數(shù)學(xué)推理的AI模型)的系統(tǒng),該系統(tǒng)成功解答了2024年國際數(shù)學(xué)奧林匹克競賽中的4道題目,占總數(shù)6題的2/3。這一成果預(yù)示著,類似的方法不僅限于幾何問題,還有望拓展至數(shù)學(xué)乃至科學(xué)的其他領(lǐng)域,比如輔助復(fù)雜的工程計算。

AlphaGeometry2的核心組件包括谷歌Gemini系列AI模型中的語言模型,以及一個強大的“符號引擎”。Gemini模型與符號引擎協(xié)同工作,符號引擎利用數(shù)學(xué)規(guī)則推導(dǎo)出問題的解決方案,并為給定的幾何定理提供有效的證明。

然而,將證明轉(zhuǎn)化為AI可理解的格式并非易事,加之可用的幾何訓(xùn)練數(shù)據(jù)稀缺,給研究帶來了不小的挑戰(zhàn)。為此,DeepMind為AlphaGeometry2的語言模型專門生成了合成數(shù)據(jù),這些數(shù)據(jù)涵蓋了超過3億個不同復(fù)雜度的定理和證明,為AI的訓(xùn)練提供了堅實的基礎(chǔ)。

為了驗證AlphaGeometry2的解題能力,研究團隊從過去25年的國際數(shù)學(xué)奧林匹克競賽中精選了45道幾何題目,這些題目涉及線性方程和需要在平面上操作的幾何對象。隨后,他們將這些題目“轉(zhuǎn)化”為一個包含50道題目的更大集合(部分題目因技術(shù)原因被拆分為兩題)。據(jù)論文所述,AlphaGeometry2成功解答了其中的42題,得分超過了平均金牌得主的40.9分。

盡管如此,AlphaGeometry2仍存在一定的局限性。例如,它無法處理涉及可變數(shù)量點、非線性方程和不等式的問題。盡管AlphaGeometry2并非首個達到幾何問題金牌水平的AI系統(tǒng),但它是首個在如此廣泛的問題集上實現(xiàn)這一成就的系統(tǒng)。

在另一組更具挑戰(zhàn)性的題目測試中,AlphaGeometry2的表現(xiàn)略顯不足。DeepMind團隊額外選取了29道由數(shù)學(xué)專家提名但尚未出現(xiàn)在競賽中的題目,AlphaGeometry2僅成功解答了其中的20題。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動資訊  |  爭議稿件處理  |  English Version