AI大語言模型雖然是目前最熱門的話題,不過它們的數學能力一直存在短板。南京航空航天大學聯合南通大學、牛津大學組成的團隊發現,通過低成本地訓練,對國產開源AI大模型DeepSeek的7B小版本和Qwen2.5-14...
AI大語言模型雖然是目前最熱門的話題,不過它們的數學能力一直存在短板。南京航空航天大學聯合南通大學、牛津大學組成的團隊發現,通過低成本地訓練,對國產開源AI大模型DeepSeek的7B小版本和Qwen2.5-14B進行推理指導,它們的數學推理能力就開始暴漲,甚至成功構造出困擾全世界數學家的關鍵反例。
這項發表于2024年2月27日的研究由南京航空航天大學的研究者李可晨擔任第一作者,聯合南通大學的嵇天博,以及牛津大學的兩位研究者共同完成。研究聚焦于提升大語言模型(LLM)解決復雜數學問題的能力,其突破性成果直指著名的“希爾伯特第十七問題”——這個由德國數學大師大衛·希爾伯特在1900年提出的世紀難題,涉及有理函數的多項式表示,其首個反例直到1927年才被發現,至今仍是一個重要的數學難題,在自動駕駛算法、量子計算驗證等前沿領域具有重要應用價值。
研究團隊創新性地開發了“結構化推理指導”訓練法,僅用2張A100顯卡訓練4小時的DeepSeek的7B小模型,不僅在準確率上超越671B參數的DeepSeek-V3,響應速度還提升50倍以上。
他們對另一個國產開源模型Qwen2.5-14B進行這樣的訓練,經過優化的模型自主構建出一個全新多項式,成功挑戰了希爾伯特問題的現有理論邊界——這類關鍵反例的發現通常需要數學家數十年探索,而AI僅用數小時就實現了創造性突破。研究者預言,AI大語言模型離破解這類數學難題又近了一步。
揚子晚報/紫牛新聞 宋世鋒
校對 盛媛媛
來源:本文內容搜集或轉自各大網絡平臺,并已注明來源、出處,如果轉載侵犯您的版權或非授權發布,請聯系小編,我們會及時審核處理。
聲明:江蘇教育黃頁對文中觀點保持中立,對所包含內容的準確性、可靠性或者完整性不提供任何明示或暗示的保證,不對文章觀點負責,僅作分享之用,文章版權及插圖屬于原作者。
Copyright©2013-2025 ?JSedu114 All Rights Reserved. 江蘇教育信息綜合發布查詢平臺保留所有權利
蘇公網安備32010402000125
蘇ICP備14051488號-3技術支持:南京博盛藍睿網絡科技有限公司
南京思必達教育科技有限公司版權所有 百度統計