在本屆服貿會上,參展教育機構作業幫正式發布自研銀河大模型,并同時公布了銀河大模型在C-Eval、CMMLU兩大權威大語言模型評測基準的成績。
9月2日,2023中國國際服務貿易交易會在京開幕。伴隨新技術不斷涌現,AI、大數據、VR/AR等前沿技術與教育的融合更加深化,眾多教育“黑科技”亮相成為本次服貿會上一大看點。在本屆服貿會上,參展教育科技機構作業幫正式發布自研銀河大模型,并同時公布了銀河大模型在C-Eval、CMMLU兩大權威大語言模型評測基準的成績。數據顯示,作業幫銀河大模型在C-Eval、CMMLU雙榜排名第一,成為首個同時在上述兩大權威榜單平均分排名第一的教育大模型。
如何寫一篇描寫春天的作文?幾何題如何解析通俗易懂?植物需要睡眠嗎?在作業幫展區,面對現場觀眾提出的涵蓋多學科、多學段、多場景的問題,銀河大模型均一一給出答案。現場,銀河大模型在智能解題、知識問答、中英文寫作及AI伴學等方面的表現也吸引了不少觀眾駐足并互動體驗。
作業幫發布的銀河大模型吸引了不少現場觀眾駐足觀看。 受訪者供圖
據介紹,2023年國產大模型進入高速發展期,銀河大模型作為作業幫自主研發的大語言模型,深度融合作業幫多年的AI算法沉淀和教育數據積累,是一款專為教育領域量身打造的覆蓋多學科、多學段、多場景的教育大模型。它不僅具備多學科知識解答能力,更能協助不同學段學生進行創意寫作,同時還能夠實現自主提問、陪伴式輔導等,助力學生個性化學習與成長。
作業幫銀河大模型的綜合實力也在測評榜單中得到驗證。根據作業幫公布的、銀河大模型在C-Eval的成績顯示,銀河大模型以平均分73.7分位居C-Eval榜首。C-Eval是由清華大學、上海交通大學和愛丁堡大學合作構建的面向中文語言模型的綜合性考試評測集,是全球最具影響力的中文評測集之一,該測評包含13948道多項選擇題,涵蓋52個不同學科和四個難度級別。
作業幫發布的C-Eval成績排名。 受訪者供圖
同時,在由MBZUAI、上海交通大學、微軟亞洲研究院共同推出的CMMLU榜單中,銀河大模型在Five-shot和Zero-shot測試中分別以74.03分及73.85分占據榜首,CMMLU共涵蓋了67個主題,涉及自然科學、社會科學、工程、人文以及常識等,測試結果印證了銀河大模型在知識儲備和語言理解方面的實力。
英文表現方面,由美國加州大學伯克利分校、哥倫比亞大學、芝加哥大學等高校聯合打造的全球性大規模多任務語言理解評測基準MMLU,在集合了科學、工程、數學、人文、社會科學等領域的57個科目的評測中,作業幫銀河大模型平均分達71.88分,體現了其在英文領域的專業能力和問題解決能力。
作業幫發布的CMMLU榜單成績。 受訪者供圖
作業幫表示,作業幫銀河大模型即將在作業幫APP等學習工具、智能硬件、智能圖書、教育數字化等業務場景中實現應用,同時將持續優化銀河大模型性能與多模態能力,加速推進在更多教育場景的落地實踐。
此外,在9月2日至6日的展期中,作業幫還攜數十款產品集中亮相。其中包括“會AI批改”作文,能視頻講解的作業幫智能圖書;懂得個性化診斷,擅長“輔導”學習的作業幫智能硬件……作業幫展廳將帶給觀眾“無處不科技、無處不應用”的感受,展現該公司多年積累的科技實力和教育底蘊。
來源:本文內容搜集或轉自各大網絡平臺,并已注明來源、出處,如果轉載侵犯您的版權或非授權發布,請聯系小編,我們會及時審核處理。
聲明:江蘇教育黃頁對文中觀點保持中立,對所包含內容的準確性、可靠性或者完整性不提供任何明示或暗示的保證,不對文章觀點負責,僅作分享之用,文章版權及插圖屬于原作者。
Copyright©2013-2025 ?JSedu114 All Rights Reserved. 江蘇教育信息綜合發布查詢平臺保留所有權利
蘇公網安備32010402000125
蘇ICP備14051488號-3技術支持:南京博盛藍睿網絡科技有限公司
南京思必達教育科技有限公司版權所有 百度統計