紫牛熱點|南航領銜團隊低成本訓練4小時，DeepSeek數學能力暴漲

：2025年03月04日：揚子晚報網

分享到：

AI大語言模型雖然是目前最熱門的話題，不過它們的數學能力一直存在短板。南京航空航天大學聯合南通大學、牛津大學組成的團隊發現，通過低成本地訓練，對國產開源AI大模型DeepSeek的7B小版本和Qwen2.5-14...

AI大語言模型雖然是目前最熱門的話題，不過它們的數學能力一直存在短板。南京航空航天大學聯合南通大學、牛津大學組成的團隊發現，通過低成本地訓練，對國產開源AI大模型DeepSeek的7B小版本和Qwen2.5-14B進行推理指導，它們的數學推理能力就開始暴漲，甚至成功構造出困擾全世界數學家的關鍵反例。

這項發表于2024年2月27日的研究由南京航空航天大學的研究者李可晨擔任第一作者，聯合南通大學的嵇天博，以及牛津大學的兩位研究者共同完成。研究聚焦于提升大語言模型（LLM）解決復雜數學問題的能力，其突破性成果直指著名的“希爾伯特第十七問題”——這個由德國數學大師大衛·希爾伯特在1900年提出的世紀難題，涉及有理函數的多項式表示，其首個反例直到1927年才被發現，至今仍是一個重要的數學難題，在自動駕駛算法、量子計算驗證等前沿領域具有重要應用價值。

研究團隊創新性地開發了“結構化推理指導”訓練法，僅用2張A100顯卡訓練4小時的DeepSeek的7B小模型，不僅在準確率上超越671B參數的DeepSeek-V3，響應速度還提升50倍以上。

他們對另一個國產開源模型Qwen2.5-14B進行這樣的訓練，經過優化的模型自主構建出一個全新多項式，成功挑戰了希爾伯特問題的現有理論邊界——這類關鍵反例的發現通常需要數學家數十年探索，而AI僅用數小時就實現了創造性突破。研究者預言，AI大語言模型離破解這類數學難題又近了一步。

揚子晚報/紫牛新聞 宋世鋒

校對盛媛媛

[我要糾錯]

[編輯：王振袢 &發表于江蘇]

關鍵詞：語言模型雖然目前熱門

來源：本文內容搜集或轉自各大網絡平臺，并已注明來源、出處，如果轉載侵犯您的版權或非授權發布，請聯系小編，我們會及時審核處理。
聲明：江蘇教育黃頁對文中觀點保持中立，對所包含內容的準確性、可靠性或者完整性不提供任何明示或暗示的保證，不對文章觀點負責，僅作分享之用，文章版權及插圖屬于原作者。

點個贊

踩一腳

上一篇第二屆全國大學生職業規劃大賽江蘇賽區暨江蘇省第十九...

下一篇鎮江句容：從小學雷鋒長大做先鋒

您在閱讀：紫牛熱點|南航領銜團隊低成本訓練4小時，DeepSeek數學能力暴漲

最熱文章

更多>>

教育百科

更多>>

免费在线a视频-免费在线观看a视频-免费在线观看大片影视大全-免费在线观看的视频-色播丁香-色播基地

紫牛熱點|南航領銜團隊低成本訓練4小時，DeepSeek數學能力暴漲

[編輯：王振袢 &發表于江蘇]

關鍵詞：語言模型雖然目前熱門

您在閱讀：紫牛熱點|南航領銜團隊低成本訓練4小時，DeepSeek數學能力暴漲

最熱文章

教育百科

相關新聞

聯系我們

用戶服務

客戶服務

網站公告

媒體我們

微信公眾號

新浪微博

全國統一熱線： 025-81550000

免费在线a视频-免费在线观看a视频-免费在线观看大片影视大全-免费在线观看的视频-色播丁香-色播基地

紫牛熱點|南航領銜團隊低成本訓練4小時，DeepSeek數學能力暴漲

[編輯：王振袢 &發表于江蘇]

關鍵詞： 語言 模型 雖然 目前 熱門

最新文章

您在閱讀：紫牛熱點|南航領銜團隊低成本訓練4小時，DeepSeek數學能力暴漲

最熱文章

教育百科

相關新聞

聯系我們

用戶服務

客戶服務

網站公告

媒體我們

微信公眾號

新浪微博

全國統一熱線： 025-81550000

關鍵詞：語言模型雖然目前熱門