日前,在《中國世界級非遺文化悅讀系列》叢書發布會上,南京農業大學信息管理學院王東波教授團隊聯合南京大學“術語與翻譯跨學科研究”基地,推出非遺領域大語言模型,為非遺文化的保護與傳播開辟了新路...
日前,在《中國世界級非遺文化悅讀系列》叢書發布會上,南京農業大學信息管理學院王東波教授團隊聯合南京大學“術語與翻譯跨學科研究”基地,推出非遺領域大語言模型,為非遺文化的保護與傳播開辟了新路徑。
記者了解到,非物質文化遺產傳承大多以口頭傳播為主,由于其內容豐富而形式多樣,在傳承過程中極易隨著時間流逝而丟失。非遺領域大語言模型的推出可以有效推動非遺文化的數字化保護,助力傳統故事、技藝、習俗等內容的數字化、知識化、系統化,從而建立非遺的長效保護體系,確保非遺文化的可持續發展。
“在非物質文化遺產領域,數據的獨特性與復雜性成為了領域化大模型構建的關鍵挑戰?!蓖鯑|波告訴記者,為確保非遺大模型能夠精準理解和運用文化遺產領域的獨特知識,研究團隊在數據收集階段深入中國非物質文化遺產網,從機構、政策、資源、咨詢、學術五大板塊獲取并整理了海量數據,涵蓋了政策通知、新聞專題、學術建設及項目介紹等多維度信息。此外,團隊還充分利用了學術文獻數據庫中的大量非遺相關期刊論文摘要,最終通過對網頁內容的分類解析和期刊論文摘要的整理,構建了一個內容豐富、體量龐大的非遺領域預訓練數據集。這一數據集的構建,為非遺大模型獲取領域知識奠定了堅實基礎。
為使模型能夠更好地理解和響應非遺相關的問題,研究團隊結合前期獲取的非遺領域數據,通過對數據的量化統計和領域專家的分析,構建了面向非遺領域的知識實體標注方案。在此基礎上,經過長期的人工數據標注與校驗,實現了非遺數據知識實體的精細標注,為后續模型的進一步訓練提供了高質量數據基礎。
值得一提的是,依托南京農業大學高性能算力平臺,研究團隊在現有高性能大語言模型的基礎上訓練了非遺領域基座大模型,并進一步構建了非遺對話大模型。對話大模型讓更多非遺知識的研究和學習者能夠更加便捷地獲取非遺相關知識,在非遺文化推廣與挖掘方面提供智能技術支持。
王東波介紹,在非遺傳播過程中,非遺對話大模型可以實現非遺文化的自動化傳播與知識普及,并通過其強大的跨語言能力,將不同地域的非遺文化融合,打破語言障礙,更有助于非遺文化走向國際,為中華民族文化自信道路建設貢獻力量。在輔助非遺傳承方面,非遺大模型能夠為非遺傳承人提供更加便捷的技術支持,使非遺傳承人能夠更好地利用新技術實現非遺文化的創造性轉化。同時,借助大語言模型在非遺基礎上進行文化再創造,深入挖掘非遺文化中蘊含的精神財富,結合知識圖譜技術對非遺文化進行知識化存儲,有助于研究人員更系統地研究非遺文化的內在邏輯和傳承脈絡。
通訊員 趙志梟
揚子晚報/紫牛新聞 王赟
校對 王菲
來源:本文內容搜集或轉自各大網絡平臺,并已注明來源、出處,如果轉載侵犯您的版權或非授權發布,請聯系小編,我們會及時審核處理。
聲明:江蘇教育黃頁對文中觀點保持中立,對所包含內容的準確性、可靠性或者完整性不提供任何明示或暗示的保證,不對文章觀點負責,僅作分享之用,文章版權及插圖屬于原作者。
Copyright©2013-2025 ?JSedu114 All Rights Reserved. 江蘇教育信息綜合發布查詢平臺保留所有權利
蘇公網安備32010402000125
蘇ICP備14051488號-3技術支持:南京博盛藍睿網絡科技有限公司
南京思必達教育科技有限公司版權所有 百度統計