大模型目前存在的一個明顯缺點是“機器幻覺”,即有時會“一本正經地胡說八道”。在交互過程中,對于部分問題,大模型可能會輸出一些“看似非常有道理,實則完全不對”的內容,讓人啼笑皆非。
9月,在落幕不久的2023中國國際服務貿易交易會教育專題展上,“大模型”成為新看點,多家教育機構紛紛展示推廣各自的大模型相關應用和產品。
事實上,認知大模型發布以來,討論度居高不下,在國內教育界也迅速掀起應用浪潮。科大訊飛推出星火大模型,網易有道發布子曰教育垂類模型,學而思發布數學大模型,高途、中公教育等大批教育公司接連宣布將在產品中引入大模型,中小公司及創業者們也紛紛加入……不到一年,這項新興技術迅速席卷教育領域,坊間一度認為這將是教育公司的“標配”。
大模型技術在教育產品中究竟扮演什么角色?與上一輪“AI+教育”有何區別?它會對教育產生根本性的變革和推動嗎?它是否能改變教育公司的業務和產品邏輯?是否會重塑教育公司市場競爭格局?
大模型在國內教育界迅速掀起應用浪潮。圖/IC photo
是自主研發還是接入通用大模型?
2022年11月,OpenAI的ChatGPT橫空出世,引發技術圈高度關注。直到今年3月,ChatGPT4發布,徹底引爆整個互聯網,一時間無人不談“大模型”。
業內通常將以GPT為代表的大模型技術稱為“生成式人工智能”。ChatGPT4的橫空出世讓國內各領域大為震撼,多家企業調整業務規劃,啟動大模型產品研發。
教育領域也不例外。半年多以來,垂類模型陸續發布,并逐步落地應用。
“適合中國國情的教育行業的底座正在逐步成型,今年下半年逐漸過渡到應用和產品的層面。”在盛景嘉成投資管理有限公司董事總經理劉迪看來,底座上的部分更倚重細分行業的資源。
今年下半年開始,產品級應用開始落地。7月,網易有道推出國內首個教育領域垂直大模型“子曰”,并一口氣發布了六個相關應用,包括“虛擬人口語教練Echo”“AI Box”等,緊接著,搭載“子曰”大模型的有道詞典筆X6 Pro問世。“6個應用都陸續完成上線,之后我們會進入第二階段的應用落地。”網易有道CEO周楓說道。
有道選擇的是自研垂類大模型,這是目前教育公司與大模型技術結合的典型路徑之一。周楓透露,雖然現在是有道自己訓練大模型,但會保持開放態度,未來考慮與其他公司合作或參與開源生態。
有些公司選擇自研通用模型,例如科大訊飛。今年5月,訊飛星火認知大模型問世,今年8月,升級后的星火認知大模型V2.0發布,基于該模型,訊飛開發了教師助手、學習助手以及舞劇助手等。
還有一條典型路徑是跟已有模型合作。購買通用大模型的接口,接入自身在教育領域的垂類數據庫進行錘煉和改造,就可以輸出一個基于大模型的教育產品。這也是目前大部分教育公司的選擇。
選擇自研教育垂類大模型,還是接入通用大模型,對教育公司來說是一個問題。
目前業內對此持有不同觀點。一方認為自研垂類模型對于教育公司意義不大。西瓜創客與共創世界創始人肖恩認為,如果已經有了很好的GPU(訓練模型的芯片)租用機制,成本也不高,那么教育公司自己重新訓練一個大模型就沒有太大必要,基于成熟的算法和模型,用高質量的行業數據去訓練模型,才是垂類公司的競爭力。
另一方則認為教育公司訓練垂類模型仍有其必要性,“這其中涉及數據安全的問題。”廣東笑翠鳥教育科技有限公司總經理胡正東指出。國內一家自研教育垂類模型的頭部教育機構的從業者程路(化名),從另一個視角提出了做垂類模型的必要性:“通用大模型雖然好用,但其內容的準確性無法保障,而這對教育來說是致命的。必須確保教育模型所有數據的準確度、可追溯度。”
“現階段大家對大模型還停留在一些感性認識,理解還不是特別透徹。”在偉東云教育集團聯席CEO張高看來,需要再經過大概3至6個月,大眾經過基礎普及和初步體驗,會逐步進入更為理性的階段,那時大家會看到大模型在各類場景的應用,“不會覺得這東西沒用,也不會過分夸大技術的影響,而是看到大模型可以在各行業中發揮更多的作用。”
人們對大模型的關注從“是不是做大模型”變為“如何應用大模型做好的產品”。圖/IC photo
AI大模型、“AI+教育1.0版”并非相互替代
AI大模型與教育產業有哪些結合點?
劉迪總結為三類模式。第一類偏工具類,利用知識庫、題庫,讓大模型做助教、助理、陪讀、陪練;第二類偏陪伴類,虛擬人替代原有的講師,在虛擬沉浸課堂中,學生可以隨時隨地約課;第三類是教育信息化,應用在To b端,尤其是家校互動方面。
除了K12教育外,素質教育、職業教育企業也看好大模型在特定場景中的作用。張高比較看好大模型做“智能助教”,比如在職業教育的考證考級場景中,學生遇到問題可以請智能助教解答,“在知識層面,大模型在學習了知識庫之后,就可以答得不錯。”
張高看好的另一個場景是導學。比如興趣類的學習,以市民學堂為例,2000萬市民每個人興趣不一樣,在一大堆列表中很難找到想要的資源,有了應用大模型以后,可以直接與某方面的“科普專家”對話,如果想要繼續深入學習,就可以進入課程,大幅提升效率。此外,還可以應用到企業培訓、安全培訓等場景中。
AI大模型如何能夠賦能教育?這要從AI大模型的特性談起:語言能力更強,可以與用戶對話,能夠更好地理解和滿足用戶的意圖,更加接近人類的交互方式。
周楓在8月的產品發布會上,總結了大模型在教育領域的三大優勢:一是憑借強大的語言理解和生成能力,可以提供個性化分析與指導;二是能夠實現引導式學習,不是直接給出答案,而是逐步引導學習者自己思考,達到更好學習效果;三是全學科知識整合,隨時提供跨學科知識答疑和解題的支持。
從需求端看,“每個學生在學習過程中遇到的困難不一樣,這就需要個性化輔導,而大模型在教育場景下的個性化能力是非常寶貴的。”周楓說道。
實際上,近年來,教育領域已經有過一輪“AI+教育”的技術革新。以“自適應教育”為代表,知識評測、舉一反三、學情監測功能、個性化作業……通過分析學生的學習數據、行為模式、作業及測試結果,評估學生的學習情況,為每個學生提供個性化的學習路徑、資源推薦和反饋建議。
那么與之相比,AI大模型差異和優勢在哪?“之前的AI工具我們姑且稱之為‘小模型’,更聚焦在某一特定細分領域去解決問題。而大模型涉獵面更寬泛,可以看做是一個特別博學的科普工作者。”張高打比方解釋道。
“大模型最大的優勢在于人機交互方式的革新。”張高進一步指出,大模型涉獵無數領域,但不是每個領域都足夠精深。因此,大模型的應用場景更適合作為助教、導學,“通識類的問題大模型都能解決。大模型與各行各業相結合,會得到全新高效的體驗,但是很難稱得上顛覆。”
談及AI大模型與“AI+教育1.0版”之間的關系,張高認為,二者并非相互替代或取代的關系,而是分別適用于不同的教育場景。西瓜創客CEO鐘鳴也認為,大模型技術功能更加強大,但不代表過去的模型和算法沒有用。他進一步指出,上一輪AI+教育過程中積累的數據很重要,尤其是動態數據。
大模型的應用場景更適合作為助教、導學。圖/IC photo
大模型會顛覆現有的教育模式嗎?
“大模型將對教育產生顛覆性影響”“大模型技術是革命性、顛覆性的技術沖擊”……AIGC(生成式人工智能)的涌現,一度讓“AI顛覆教育”的說法甚囂塵上。在當前情況下,大模型是否能夠顛覆原有的教育形態呢?
鐘鳴并不認同這樣的說法。他告訴新京報記者,按照教育學相關理論,教育是由“知識傳遞、即時反饋、情感互動”三個部分組成,并且循環往復和互相推動。“AIGC的出現,讓AI老師即時反饋能力大大增強,讓知識傳遞這一環節的效率大大提高,然而,對于大部分學習者而言,老師與孩子之間的情感鏈接、興趣激發、在整個學習過程中同伴間的多點反饋和情感互動碰撞,才是點燃和激發學習內在動機的關鍵。”
劉迪的觀察是,目前教育產業當中對于大模型技術的應用并未跳脫出原來“AI+教育產業1.0時代”的底層邏輯,教育行為本質上還是糾錯修正、知識點強化、訓練鞏固,這些用傳統的AI模型同樣可以解決。從用戶感知上來說,產品中是否應用了大模型,其實使用感受上沒有明顯的差異。
“目前為止,大模型+教育在To c方向沒有看到變革性、創新性產品。”劉迪認為,除了教育模式及產品底層邏輯沒有改變外,教育產品形態、商業模式等也沒有發生根本變化,用戶也不會因此提升付費意愿。
“大模型是否會顛覆現有教育模式還有待探討。目前在我看來還沒有,只是在合適的場景中能夠大幅提升效率。”怎樣才算顛覆?在張高看來,大模型如果能夠真正模擬出名師、大師,讓學生與名師對話,改變了原有的教育模式和教育形態,才可能談“顛覆”。
AI虛擬教師能夠達到真人教師一樣嗎?二者本質區別在哪?張高指出,“要讓大模型成為大師,不光要磨練知識技能,還要具備大師的個人魅力、品德品性、洞察激情、交互引導,這些在教育當中的重要性遠超過知識技能。而目前大模型的技術還遠遠達不到,不是僅憑對話式人機交互就能改變一切的。”
胡正東對此持同樣觀點。“從單純知識技能的角度,從公開的知識數量,技能方法的數量,AI掌握的數量比人厲害;但是教師傳道授業解惑,不一定是教知識,也會教哲理人生;一舉一動言傳身教,情緒互動、情感交流,教育行為是全方位的。和教師不同,教練就更側重于訓練技能、幫助糾錯,有時候,模型是起到教練的作用,但從情感屬性看,AI教師是無法跟真人老師相比的。”此外他認為,人比AI厲害,可以綜合運用知識庫、問答庫、引導問題庫、提示詞等,利用AI的長處和人的思維綜合解決問題。
業內人士認為,目前在大模型+教育在Toc方向沒有看到變革性、創新性產品。圖/IC photo
當教育遭遇大模型的“機器幻覺”
AI大模型對教育能夠真正產生多大的價值,也仍然值得探討。
在AI大模型能力的加持下,“學生自學+AI答疑”的新型學習方式成為廣泛的可能。而這種方式能否達到預期的學習效果,背后則是對學習者的極大考驗。
“孩子需要學會的大量內容,都可以在大模型中直接得到答案。但是教會和得到答案并不能劃等號。孩子能否通過大模型真正學會一個知識點,則非常依賴于如何向大模型發問。”肖恩指出。
他進一步指出,“如果通過正確使用和有效提問,學習者是能夠得到足夠反饋的。用得好的人學習質量很高,當一個好奇心特別強的小朋友遇到大模型,他就可以擺脫周圍教育資源供給不足的限制,‘天花板’無限提高。用得不好的人正好相反。這個自主學習和提問的能力可能才是影響未來的核心能力。”
此外,大模型的優勢和關鍵能力,更多地表現在其生成能力上,而對于教育來說,這種能力反而可能成為“致命傷”。
大模型目前存在的一個明顯缺點是“機器幻覺”,即有時會“一本正經地胡說八道”。在交互過程中,對于部分問題,大模型可能會輸出一些“看似非常有道理,實則完全不對”的內容,讓人啼笑皆非。
但教育是嚴肅科學,容不得差錯、幻覺。“用戶在使用教育產品時,并不是希望大模型打破標準制式、隨意生成出什么東西,而是希望找到最優解。大家最怕大模型出現幻覺,在教育領域更是如此。”劉迪指出,正是基于此,大模型的生成能力在教育領域的價值和必要性反而沒有那么大,或者說,生成能力在教育行業并不值得變現。
而不少網友用目前開源的大模型去測試一些簡單數學題,發現很多答案并不準確。與自然語言理解不同,大型語言模型在解決算術推理任務時性能欠佳,經常提供錯誤的答案。一位不愿具名的頭部教育機構負責人曾提到,根據現在有限的時間經驗來看,英語、語文等學科,跟數學學科相比,評測結果更理想一些,提升速度也比較快。
但對于特殊的垂類模型——數學大模型,情況則并不樂觀。一位不愿具名的從業者評價稱,從理論上看這個技術方向是可行的,但最終結果如何,取決于兩個因素,一是算法是不是足夠好,二是是否有足夠量的數據做支撐。
今年5月,好未來公布正在進行自研數學大模型的研發,命名為MathGPT,是以解題和講題算法為核心的數學垂直領域的大模型,也是國內首個專為數學打造的大模型。8月24日,MathGPT開啟內測,其官網顯示,MathGPT的數學計算能力已覆蓋小學、初中、高中的數學題,題目類型涵蓋計算題、應用題、代數題等多個類型,還可以針對題目進行追問。“與其他通用大模型相比,MathGPT能實現更高準確度的解題,也能把答案解析得更清楚、講解得更明白。”
在測試中,新京報記者兩次向大模型提問同一道中考模擬數學題,MathGPT給出了兩套不同的答案和解析過程,且兩次給出的答案不同。經印證,兩次解析均存在問題。讓人匪夷所思的是,在此次測試中,大模型告訴用戶,在ΔABC中,“角A=B=C=45°”。忽略前提條件,這本身就無法成立。
針對一道數學題目MathGPT第一次給出的答案及解析。MathGPT截圖
針對同一道數學題目MathGPT第二次給出的答案及解析。MathGPT截圖
新京報記者邀請一位北京市數學高級教師對大模型的解析做出分析。“第一次解答不僅結論錯誤,而且思路從一入手就讓人費解,為何設‘A=B’?思維的起點就出現了無法理解的謬思,正是因為起點錯了,后面出現非常奇怪的錯誤肯定也在情理之中。第二次解答答案倒是正確,但是解題過程非常跳躍,匪夷所思,思路明顯錯誤,錯誤的過程導出了正確的結果,只可能是歪打正著。”
“綜合以上兩種證法,可以看出該大模型目前解題缺乏嚴謹邏輯,面對復雜環境應對的靈活性還有待提高。由于數學題目綜合性強、邏輯鏈條長等特點,也會導致機器解題的精準性大打折扣。”這位數學高級教師評價道。
大模型或將成為企業“標配”,核心在于尋找合適的應用場景
雖然大模型在用戶端的價值仍有待觀察和發掘,但對于教育產業仍然是有價值的,主要體現在企業端的降本增效上。
“當一個新技術出來,我們能看到它對于傳統模式的突破,即便無法判斷它是否能真正創造一個新的商業場景或者顛覆式的應用,但如果能讓效率變高、成本降低,用戶用同樣的價格享受到了更好的服務,它就是值得做的。”程路說道。
8月的發布會上,周楓在接受媒體采訪時也提到了大模型在提升效率方面的優勢。“以前做AI,做語法解析等要分別找人、單獨做模型,而現在一個大模型可以解決好幾個問題,它作為一個基礎模型,可以學一系列的相關能力,在這基礎上對它做定向微調之后就可以變成多個模型,不需要做很多單獨的工作,一下讓團隊的工作效率變高了。”
劉迪進一步指出,使用大模型可以為企業降低后端運營成本、節省前臺教師成本,一定程度上可以改變公司的收入結構和利潤空間,從公司運營的角度來講,可以提高效率、降低成本,從這個角度看,公司去擁抱大模型是沒錯的。“但是如果公司希望大模型產品能為企業增收,應該做的其實是創新。”
在企業紛紛加碼大模型的情況下,做與不做會在多大程度上影響其市場競爭力?劉迪認為,大模型作為基建的一部分,一定程度上會先行加劇當下企業的現金消耗,雖然不一定會立刻導致行業洗牌,但會讓兩極分化進行得更快。從長遠來看,張高指出,成本下降,企業就更有競爭力,“還是要擁抱新技術。”
在AI大模型+教育的語境下,雖然大模型本身不是壁壘,但依舊有門檻。多位受訪者表示,訓練大模型需要算力,而這需要大量的資金投入,此外,企業在行業中的積淀、數據也很重要。胡正東指出,通用大模型不解決全部問題,只能解決主干的問題,涉及具體某個行業或領域的數據信息,通用大模型是無法得到的。因此,企業內部基于自身已有產品積累的核心數據,才有可能成為影響各家企業競爭的壁壘。
需要強調的是,數據的質量非常重要,決定了能否讓大模型更精準。“用戶在學習過程中會持續產生的所有操作數據,與靜態的、非結構化的、非持續性的數據相比,質量要高得多,可以更好地賦能大模型。”鐘鳴指出。
然而大部分受訪者仍舊認為,最核心的問題仍然是能不能真正找到好的應用場景,把大模型用好。在劉迪看來,大模型逐漸會成為“標配”,“大模型只是基礎設施建設,后面拼的還是產品形態功能和商業模式。如果應用場景都找不好,做了也沒用。”
此外胡正東強調了一個容易被忽視的問題——大模型的倫理審查。“要給技術設置不可逾越的紅線,就是倫理審查,尤其是技術研究公司,技術威力非常強悍,但是從教育和倫理的角度不一定可行。那么,誰來給大模型做風險管控、倫理審查?目前這還是空白。”
來源:本文內容搜集或轉自各大網絡平臺,并已注明來源、出處,如果轉載侵犯您的版權或非授權發布,請聯系小編,我們會及時審核處理。
聲明:江蘇教育黃頁對文中觀點保持中立,對所包含內容的準確性、可靠性或者完整性不提供任何明示或暗示的保證,不對文章觀點負責,僅作分享之用,文章版權及插圖屬于原作者。
Copyright?2013-2024 JSedu114 All Rights Reserved. 江蘇教育信息綜合發布查詢平臺保留所有權利
蘇公網安備32010402000125
蘇ICP備14051488號-3技術支持:南京博盛藍睿網絡科技有限公司
南京思必達教育科技有限公司版權所有 百度統計