-
潘禺:今年有另一場更值得關注的數學競賽
AI的數學能力
ChatGPT這樣的大語言模型在簡單的算術計算上會犯錯,因為模型并不是從基本原理推導出答案,而是根據輸入猜測最可能的輸出,這種方法有時候并不奏效。GPT-4的研究人員測試了數百道國際數學奧林匹克(IMO)級別的問題,成功率只有1%,只有一個被簡化后的特定問題答對了。大型語言模型在生成回答時依賴于訓練數據中學習到的模式,盡管訓練數據集非常龐大,但它們可能不包含足夠的邏輯推理或數學證明的示例。
DeepMind的AlphaProof和AlphaGeometry 2這兩個更專門的系統,這次的表現就好得多。
AlphaProof是用于形式化數學推理的系統,結合了預訓練的語言模型和AlphaZero強化學習算法,也就是之前自學掌握了國際象棋、將棋和圍棋的算法。它在Lean中訓練自己證明數學陳述,并通過自動將自然語言陳述翻譯成形式化的數學語言陳述,創建了一個不同難度的形式化問題庫。AlphaProof通過在Lean中搜索可能的證明步驟來生成候選解決方案,然后證明或反駁它們。在IMO比賽前幾周內,它證明或反駁了數百萬問題進行自我訓練,涵蓋不同的難度和廣泛的數學領域。
AlphaGeometry是一個神經符號系統,由神經語言模型和符號推導引擎組成,它們協同工作以查找復雜幾何定理的證明。一個系統提供快速、 “直觀 ”的想法,而另一個系統則提供更深思熟慮、更理性的決策。
語言模型擅長識別數據中的一般模式和關系,可以快速預測可能有用的結構,但通常缺乏嚴格推理或解釋其決策的能力。符號推導引擎基于形式邏輯,并使用明確的規則來得出結論,但緩慢而不靈活。語言模型指導符號推導引擎尋找幾何問題的可能解決方案,從無限的可能性中預測哪些像點、線或圓這樣的新幾何結構最有用。如果未找到解決方案,語言模型將添加一個可能有用的結構,為符號引擎開辟新的推導路徑。此循環一直持續,直到找到解決方案。
這有點像諾貝爾經濟學獎得主丹尼爾·卡尼曼在《思考,快和慢》一書中提出的人類思維的兩種系統,快速思考系統是一種快速、直覺式的思維方式,慢速思考系統是一種緩慢、邏輯性強、需要集中注意力的思維方式。
AlphaGeometry 2采用的符號引擎比上一代快兩個數量級。當遇到新問題時,使用一種新的知識共享機制來實現不同搜索樹的高級組合,以解決更復雜的問題。在今年的比賽之前,AlphaGeometry 2可以解決過去25年中83%的歷史IMO幾何問題,而上一代為53%。在今年的IMO 2024中,AlphaGeometry 2在收到形式化后的問題后,19秒內解決了第4題(下圖,要求證明 ∠KIL 和 ∠XPY 之和等于 180°,AlphaGeometry 2 提議構造 E,即 BI上的一個點,使 ∠AEB = 90°)。
訓練AlphaGeometry并不是依靠人工的示例,AlphaGeometry首先生成了10億個幾何對象的隨機圖形,并詳盡地推導出每個圖形中點和線之間的所有關系,找到每個圖形中包含的所有證明,然后逆向工作以找出需要哪些額外的幾何結構(如果有)來得出這些證明。數據經過過濾,排除相似示例,產生一個包含1億個不同難度獨特示例的最終訓練數據集。有了這么多添加新幾何結構而得到證明的例子,AlphaGeometry的語言模型,就能夠在遇到奧數幾何題時,為添加新結構提出很好的建議。
我們的教育做好準備了嗎
教育對個人成長、社會進步和國家發展都至關重要,人工智能對教育的影響已經來臨,過去的運作模式和利益結構早晚都將受到沖擊。但或許是因為既有格局的根深蒂固,國內對這方面的討論還不多,但只要想想,同樣長期具備壟斷性的傳媒行業發生了多大變化,就很難忽視這種改變的前景。
人工智能已經深刻改變了媒體,當人們使用TikTok、抖音、今日頭條之類的應用獲取信息時,算法主導了內容的個性化推薦和分發。這一結果對傳媒行業的影響非常明顯,報紙、電視臺等傳統壟斷機構無法再占據流量最大的傳播渠道。
在教學上,AI同樣已經做到了通過分析學生的學習進度、錯誤模式和知識漏洞,提供個性化的學習路徑和習題練習。
比如,Khan Academy就使用機器學習算法,根據學生的答題記錄提供個性化的題目推薦,使學習更具針對性。AI平臺ALEKS通過自動化反饋機制幫助學生在練習中獲得即時指導,并通過不同題型進一步鞏固知識。在線平臺DreamBox Learning提供自適應數學練習系統,學生的進度可以依據他們的實時表現進行調整,確保學習曲線與能力相匹配。
而在解題和題庫方面,AI也已經有了不少實際應用。通過AI應用Socratic,學生可以拍攝問題,系統自動識別問題并提供相應的解答提示及詳細的解題過程。Edmentum使用AI生成多樣化的習題和測驗,以幫助教師設計針對性的評估,節省教師設計練習題的時間。
如今,Google DeepMind在高難度的競賽解題上取得突破,意味著對數學這樣最重要的基礎學科,通過AI的加持,使優質教育資源能充足提供,不再稀缺,技術上的障礙已經基本掃清。
Google正在基于Gemini開發一種自然語言推理系統,這意味著將不需要依賴人類專家將數學問題翻譯成形式化的語言進行處理,能與其它AI系統順利集成。當AI以自然語言解決數學問題后,科教系統的面貌必將改變。
中國教育有三大夢想,因材施教、教育公平和減負。
因材施教的障礙在于,沒有盡全力嘗試,許多人并不能認知到自己該走哪條路,家長也不愿接受孩子“是騾子還是馬”。選擇的迷霧加劇了賽道的狹窄,而AI能提供針對性的評估,有效改善個人天賦與才能的識別效率,幫助每個人更早更精準地定位和把握自己的比較優勢。無論是利用圖像識別技術的體育測評,還是基于機器學習的數學評估,AI會公正地幫助你判斷自己。
AI的發展能否帶來社會公平,這歷來是一個有爭議的問題。對于互聯網科技公司來說,用戶的增加意味著技術成本的攤薄。雖然話不能說絕對,但從過去的經驗看,AI提供的教育資源,與別的互聯網服務一樣,也很可能是往普及方向發展的。這意味著,除了帶來因材施教,AI將促進教育公平。
在減負上,AI也能發揮巨大作用。就像計算器對數學考試的影響,導致部分價值不大的計算在教學和考試中被舍棄,而更專注于考察數學思維、概念的理解和運用。AI的影響也有希望進一步優化教學和考試內容,減輕中國學生在某些解題套路上依靠“題海戰術”達到“肌肉記憶”的內卷性消耗。
關注數學的人可能都知道今年國內的一些輿情。某競賽初賽結果的爭議徹底出圈了,某數學大師領銜的某書院的爭議,則一直在小圈子內流傳。但由于涉及到中國教育的金字塔結構和招考錄取的指揮棒,后者對家長和學生的影響面其實并不小。
如果把這兩件事放在一起看,這都說明了數學競賽的門檻很高,數學研究的門檻更高,這條道路只適合極少數的人。這背后牽涉的討論非常復雜,但這個結論大致不差。
為了挑選出這少數人,需要多數人的陪跑。這種陪跑不僅發生在基礎教育階段,很多數學競賽的獲獎者,在因此避開高考,獲得了頂級學府的錄取后,最終也都沒有選擇從事數學研究的道路,這也是網上“IMO金牌與菲爾茲獎”的老生常談了。偏偏數學又是如此重要,社會在一定程度上容忍了投機與內卷的情況,而形成了鼓勵“天才少年”的風氣。但對每一個個體來說,內卷的代價要獨自承受,成長選擇的容錯率都是有限的,缺少退路的攀登難以長久,“一將功成萬骨枯”的情況傷害社會的總體利益,國家努力給教輔降溫,阻止家庭為爭奪教育資源而“升級軍備競賽”,背后也有這樣的考量。
教育是強國之基,教育資源和住宅用地一樣,人為制造出稀缺性,也許能夠造成短期的產業繁榮,卻可能埋下看不見的長久隱患,比如已經被一再討論的原始創新不足問題。考慮人口結構的變化和高學歷人口的規模,和住房一樣,中國優質教育資源稀缺的時代終將過去。
目前,還很難說AI提供的充盈教育資源與個性化輔導,能不能動搖中國教育的金字塔結構,也不清楚教育領域的“今日頭條”,這樣的規則破壞者和秩序顛覆者會在什么時候出現。但最新的AI技術進展,一定會鼓勵創業者與投資者摩拳擦掌,技術將又一次走在從業者和政策制定者的前面。
本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平臺觀點,未經授權,不得轉載,否則將追究法律責任。關注觀察者網微信guanchacn,每日閱讀趣味文章。
標簽 心智觀察所- 原標題:今年有另一場更值得關注的數學競賽 本文僅代表作者個人觀點。
- 責任編輯: 李昊 
-
中國貨運航天飛機,來了
2024-10-30 07:26 航空航天 -
馬斯克擁抱特朗普的隱秘心境,藏在這部美劇中
2024-10-29 14:35 心智觀察所 -
神十九將帶果蠅上太空 小鼠:等我
2024-10-29 13:34 航空航天 -
我國首艘深遠海多功能科學考察及文物考古船完成試航
2024-10-26 19:44 中國精造 -
“把大象裝進冰箱”,鴻蒙為什么行?
2024-10-25 14:41 心智觀察所 -
我國科研人員揭示過敏反應關鍵機制
2024-10-25 13:40 -
我國成功發射天平三號衛星
2024-10-22 08:55 航空航天 -
肖克利的幽靈重現硅谷
2024-10-22 08:39 心智觀察所 -
中方代表:防止出現機器自主殺人
2024-10-22 08:26 科技前沿 -
中國科學家讓“死亡”50分鐘豬腦“復活”
2024-10-20 15:05 科技前沿 -
污蔑寧德時代,美國有著怎樣的怨念與悔恨?
2024-10-17 14:33 心智觀察所 -
我國成功發射高分十二號05星
2024-10-16 08:33 航空航天 -
我國首個空間科學規劃公布!明確這些目標
2024-10-15 09:54 航空航天 -
拿下諾貝爾化學獎的中國血統,還將拯救谷歌?
2024-10-15 08:33 心智觀察所 -
星艦第五次試飛實現重大突破,但我國類似火箭可能得等一等
2024-10-13 23:04 航空航天 -
中國汽車電子產業將站上兩個世界之巔
2024-10-12 08:29 心智觀察所 -
世界最大!地下700米的這個玻璃球,將探尋宇宙之初
2024-10-11 10:00 科技前沿 -
我國成功發射衛星互聯網高軌衛星
2024-10-10 22:49 航空航天 -
我國科技成果轉化問題到了必須要解決的地步
2024-10-08 16:58 心智觀察所 -
2024年諾貝爾生理學或醫學獎揭曉
2024-10-07 17:45 諾貝爾獎
相關推薦 -
全國最大!哈密百萬千瓦“光熱+光伏”項目并網發電 評論 37“中國在非洲真正贏得了民心,就連斯威士蘭…” 評論 75“日企抱團是絕望之舉,中國工廠效率質量都是第一” 評論 123“她下月訪華,盡管特朗普團隊表達了擔憂” 評論 54最新聞 Hot
-
“中國在非洲真正贏得了民心,就連斯威士蘭…”
-
“日企抱團是絕望之舉,中國工廠效率質量都是第一”
-
“中國有能力讓夢想照進現實,將贏得史詩般競爭”
-
被災民暴罵到當場破防,馬克龍發飆:你該慶幸你在法國!
-
美高校敦促國際學生抓緊回來:萬一把中印拉黑名單呢
-
美國政府“逃過一劫”
-
“澤連斯基要求歐盟新外長:對華批評要降調”
-
澳大利亞來了,中國就得走人?澳總理這么回應
-
美媒感慨:基建狂魔發力,我們又要被超越了
-
英國剛公布新任大使,特朗普顧問就痛罵:傻X
-
“來自中國的老大哥能確保我們…”
-
俄羅斯的報復來了
-
澤連斯基罵普京“傻子”,俄方怒斥
-
還在扯皮中國,“涉華條款全刪了”
-
中國“光伏OPEC”發文嚴厲質問央企,怎么回事?
-
“最后一道貿易障礙,中國解除了!”
-