去年 7 月,Google DeepMind 宣布其 AI 系統在國際數學奧林匹克競賽(International Mathematical Olympiad, IMO)中取得銀牌成績,這是 AI 首次在這項賽事中達到獎牌水平。當時團隊承諾會公布技術細節,如今,這一承諾得以兌現:11 月 12 日,完整論文發表在《自然》(Nature)雜志上,AlphaProof 系統的技術細節得以全面公開。
圖片
圖丨相關論文(來源:Nature)
作為匯集了全球最擅長數學的一批青少年的比賽,IMO 的試卷涵蓋六道極具挑戰性的題目,覆蓋代數、組合數學、數論和幾何等領域。這些題目的難度往往讓人望而生畏,在 2024 年的比賽中,滿分 42 分的試卷上,只有不到百分之一的參賽者能夠獲得滿分。許多數學界的菲爾茲獎得主都曾是 IMO 的參賽者,這足以說明這項賽事在數學界的分量。而近年來,IMO 也逐漸成為衡量人工智能系統高級數學推理能力的標桿性挑戰。
在 2024 年的 IMO 中,AlphaProof 與專門處理幾何問題的 AlphaGeometry 2 系統聯手,完成了六道題目中的四道,獲得 28 分。這個成績相當于當年 609 名參賽者中排名前列的銀牌獲得者的水平。此外,AlphaProof 還成功解決了被認為是當年最難的第六題,這道題目只有五名人類參賽者完全解答出來。這是人工智能系統首次在 IMO 中達到獎牌級別的表現,標志著機器數學推理能力的一個重要里程碑。
圖片