31日,記者從教育部新聞發布會上獲悉,教育部、國家語委、中央網信辦近日共同印發《關于加強數字中文建設 推進語言文字信息化發展的意見》(以下簡稱《意見》)。
中新網北京3月31日電(記者 袁秀月)31日,記者從教育部新聞發布會上獲悉,教育部、國家語委、中央網信辦近日共同印發《關于加強數字中文建設 推進語言文字信息化發展的意見》(以下簡稱《意見》)。《意見》提出,到2027年,基本建成國家語言文字大數據中心,初步建成國家關鍵語料庫和國家戰略語言資源信息庫。
新聞發布會現場。袁秀月 攝
到2027年初步建成國家關鍵語料庫
《意見》提出,到2027年,國家數字中文建設行動取得重要成效,語言文字數據要素價值有效釋放。基本形成“政府主導、部門協同、社會參與、共建共享”的語言文字信息化工作機制;基本建成國家語言文字大數據中心,初步建成國家關鍵語料庫和國家戰略語言資源信息庫;語言文字信息化標準、前沿語言技術、優質語言資源、新型語言服務等基礎支撐能力顯著增強。
到2035年,中文在全球數字空間、網絡空間以及生成式人工智能等關鍵應用場景中的使用占比顯著提高;語言文字信息化有力支撐國家語言能力建設、語言文字事業和經濟社會高質量發展,整體水平位居世界前列。
推進大語言模型等基礎術語規范化
在完善規范標準方面,《意見》提出,以語言文字信息處理標準建設為基礎,支持面向信息技術及人工智能領域的語言資源建設、管理、應用、共享標準研究,重點推進語料庫、數據標注、數據評價等規范標準的制修訂。推進大語言模型等基礎術語規范化。制定手語和盲文的信息化標準。研制民族語言文字信息化標準。研制甲骨文數字化共享技術標準。
在健全資源服務方面,《意見》提出,加快建設國家語言文字大數據中心,以數字化技術動態監測、收集和分析語言文字事業發展、國家語言能力建設、重點規劃實施、重大工程進展等核心業務數據,提高數據支持決策效率。以國家語言資源服務平臺建設為基礎,帶動地方語言資源平臺建設。推動基礎性語言資源建設,實施國家關鍵語料庫共建共享計劃,重點支持建設大規模中文語料庫及高質量民族語言文字語料庫、手語盲文語料庫、行業領域語料庫、語言監測動態語料庫等。
重點加強語言文字資源信息安全治理
在人才培養方面,《意見》提出,依托國家語言文字關鍵研究領域領航計劃,培養精通語言文字信息化建設的高層次緊缺急需人才。加強語言人才供需機制研究,支持高等學校語言學科與多學科深度交叉融合發展,加強“語言+人工智能”復合型人才培養。
在安全保障方面,《意見》提出,重點加強語言文字資源信息安全治理,切實加強數據安全、倫理道德、價值觀對齊等重點事項的監測與管理,提升資源和技術的可信性、可控性和可靠性。支持生成式人工智能的語料規范性、生成內容評測評價和全流程追溯機制研究。加強面向語言資源監測的自然語言處理技術研究,強化語言文字信息安全的態勢感知、監測預警、風險評估和應急處置。規范網絡空間、數字空間的語言生態,建設健康文明的網絡語言環境,守住網絡安全底線。
打造中國版人工智能教育大模型
此外,《意見》提出,要實施數字中文服務教育發展行動、數字中文助力科技創新行動、數字中文賦能文化傳承行動、數字中文推動產業升級行動、數字中文促進社會進步行動。
其中提到,服務國家教育數字化戰略行動,加強語言文字信息化建設成果在國家智慧教育公共服務平臺和地方智慧教育平臺上推廣共享;助力打造中國版人工智能教育大模型;研究基于大語言模型的教學新范式,研制大語言模型能力素養框架(師生版)。
《意見》還指出,加快布局支持一批新型語言文字交叉領域科研機構,重點建設多語言智能化科技創新中心和實驗室。加強古籍數字化整理關鍵技術研究。推進甲骨文數字化共享。支持研發面向語言障礙人群、老年群體的科技設備,鼓勵智能終端設備的適老化研發及無障礙改造。(完)
來源:本文內容搜集或轉自各大網絡平臺,并已注明來源、出處,如果轉載侵犯您的版權或非授權發布,請聯系小編,我們會及時審核處理。
聲明:江蘇教育黃頁對文中觀點保持中立,對所包含內容的準確性、可靠性或者完整性不提供任何明示或暗示的保證,不對文章觀點負責,僅作分享之用,文章版權及插圖屬于原作者。
Copyright©2013-2025 ?JSedu114 All Rights Reserved. 江蘇教育信息綜合發布查詢平臺保留所有權利
蘇公網安備32010402000125
蘇ICP備14051488號-3技術支持:南京博盛藍睿網絡科技有限公司
南京思必達教育科技有限公司版權所有 百度統計