我們正處於人工智慧令人興奮的時代。自 2022 年底 ChatGPT 發布以來,人工智慧產業已經踏上了快速改變我們生活和工作方式的旅程。 Google、微軟、Meta、蘋果和亞馬遜等大型科技公司在正在進行的人工智慧革命中發揮關鍵作用。憑藉龐大的預算、運算資源和人才,這些公司不斷推進尖端研究,努力引領人工智慧競賽。
到目前為止,除了OpenAI 的 Sora之外,2024 年最重要的人工智慧突破可能是 Deepmind 的 AlphaGeometry。AlphaGeometry 由 Google 負責開發通用人工智慧的部門DeepMind設計,是一個創新的人工智慧系統,結合了神經語言模型和符號推演引擎來解決複雜的幾何問題。該模型被描述為奧林匹克級的幾何人工智慧系統,代表了對創建可以跨數學領域推廣的先進人工智慧系統的長期目標的重要貢獻。
在這篇文章中,我們將向您介紹 AlphaGeometry。我們將分析 AlphaGeometry 背後的動機、它的工作原理以及 AlphaGeometry 最相關的用例。我們最終將獲得一些有關 AlphaGeometry 對人工智慧研究未來影響的線索。
什麼是 AlphaGeometry?
AlphaGeometry 是專為解決複雜幾何圖形而建構的新一代人工智慧系統。該系統採用新穎的邏輯推理設計方法,使其在幾何相關任務中超越了最先進的結果。
因此,與 OpenAI 的 ChatGPT 和 Google 的 Gemini 等可被視為通用 AI 模型的 AI 工具不同,AlphaGeometry 是一種特定領域的 AI 模型。
程式碼和模型以及合成資料生成和訓練中使用的方法(參見下一節)是在開源許可下發布的。
為了測試 AlphaGeometry 的效能,Google Deepmind 的研究人員準備了一組基準幾何問題,這些問題是根據2000 年至 2022 年歷屆國際數學奧林匹克競賽 (IMO) 編制的。
IMO 是一項年度錦標賽,聚集了來自世界各地的優秀高中生來解決數學問題,包括幾何領域的問題。
AlphaGeometry 在比賽時間限制下解決了 30 個選定問題中的 25 個,超越了先前人工智慧系統的最先進成績,接近人類金牌得主的平均分數,如下圖所示。基準測試的設計和結果可以在《自然》雜誌上發表的一篇專門論文中找到。
來源:Google
AlphaGeometry 如何運作?
AlphaGeometry 成功的關鍵在於其解決(幾何)問題的混 阿富汗電話號碼列表 合方法。雖然現代大型語言模型 (LLM),如 OpenAI 的 ChatGPT 和 Google 的 Gemini,擅長偵測模式,但它們通常無法精確推理。
Google DeepMind 試圖透過將神經語言模型與專門用於代數和幾何推理的符號演繹引擎結合來克服這一限制。神經語言模型有助於提供快速、直觀的想法和解決方案。相較之下,符號模型基於易於解釋和驗證的形式邏輯語句,可以根據第一個模型返回的初步想法提供更深思熟慮、理性的決策。
為了更了解 AlphaGeometry 的工作原理,我們首先必須了解 IMO 幾何問題的本質。這些問題是基於圖表,需要添加新的幾何結構(例如點、線和圓)才能解決。
當 AlphaGeometry 遇到其中一個問題時,它首先使用其語言模型來預測從無限數量的可能性中添加哪些新構造最有用。這些線索有助於填補空白,並允許符號引擎對圖表進行進一步推論並接近解決方案。整個過程如下圖所示:
來源:Google
這種創新的雙重方法使 AlphaGeometry 不僅可以預測有用的結構,還可以解釋和驗證其決策。
利用合成數據
AlphaGeometry 開發過程中最重大的挑戰之一是訓練過程。將幾何物件內的屬性和關係(即空間、距離、形狀、相對正值)轉換為機器可讀的格式是一項複雜的任務,因為特定於幾何的程式語言定義很窄,很難捕捉使用以下方法導出的人類證明:超出幾何範圍的工具,例如複數。
這種情況造成了資料瓶頸,阻礙了機器學習技術用於幾何目的。
為了克服這項限制,Google DeepMind 研究人員開發了一種新穎的方法,利用平行運算技術產生大量合成訓練數據,其中包括 1 億個獨特的幾何物件圖。請查看我們的單獨文章,以了解什麼是合成數據。
然後模型使用此類訓練資料來學習所有屬性和關係,以及幾何定理及其相關證明。一切都不需要人類演示。合成資料生成過程如下圖所示:
來源:自然
合成資料的廣泛可用性使得 AlphaGeometry 的語言模型能夠在遇到新的幾何問題時為新的構造提出很好的建議。
AlphaGeometry 對人工智慧研究的未來意味著什麼?
AlphaGeometry是專為解決抽象幾何問題而設計的研究模式。儘管其性能空前,AlphaGeometry 只接受過處理 IMO 問題的訓練(而且只是其中的一部分,因為 IMO 測試還包括其他數學領域的問題,例如代數、數論和組合學)。
AlphaGeometry 的目標並不是在幾何學中發揮基礎作用的學科(例如建築、工程和藝術)中做出貢獻。相反,它是如何結合神經語言和符號模型以增強未來人工智慧系統的推理能力的一個有希望的例子。
正如 AlphaGeometry 訓練期間所展示的那樣,產生大規模合成資料的新方法的開發正在使我們接近人工智慧研究的新前沿。
最終目標是建構能夠超越當前大型語言模型的限制和缺點的新一代人工智慧系統。這可以透過為新模型配備先進的推理和解決問題的技能來實現,這些技能可以幫助概括數學領域及其他領域的知識。
了解更多
我們希望您喜歡這篇關於 DeeMind AlphaGeometry 的文章。我們正處於正在迅速改變世界的人工智慧革命的開端。風險很高,因此了解最新動態非常重要。
DataCamp 正在努力幫助您駕馭人工智慧革命。查看我們關於生成人工智慧的專門文章和課程。
AI 基礎技能課程