今日獲悉,有道專為教育場景自研的類ChatGPT模型將推出,模型名字為“子曰”。
基于“子曰”研發的 AI 口語老師和中文作文批改 DEMO 已完成,近期開放內測。這也將是國內企業推出的首個教育場景下類ChatGPT模型。
2月便有消息流出,網易有道 AI 技術團隊已投入到 ChatGPT 同源技術 AIGC 在教育場景的落地研發中。
有道的“子曰”是“大模型+小樣板”在教育領域的一次嘗試,相比通用模型,“子曰”在教育領域內的數據是否更全面,交互會更精準?具體效果尚待驗證。
AIGC(AI生成內容)有望帶來教育資源、教育體系和教學方式的革命性變革。
有道“子曰”——量身定制的個性化陪練
在教育領域,很早就有AI形式的口語練習,但是預設好的場景,基本是劇本式的對話,比較一板一眼,不太符合真實的口語環境,不能很好地解決用戶練口語的需求。
大語言模型或許可以帶來開放式的對話,幫用戶練習實際的場景口語。據悉,“子曰”將首先用于英語口語陪練環節,承擔一種個性化定制的一對一陪練角色。比如在練習口語當中,“子曰”可以在相應的語言環境中扮演不同的角色,一步步引導用戶“開口說話”。用戶可以直接輸入語音或者文字,進行多輪對話。
如果“子曰”足夠強大,那么它的確有重構教育方式的能力。但是對教育領域來說,容錯率很低,準確至關重要,尤其不能誤導。這就需要在數據訓練中數據足夠多,以便更精細。
“子曰”培植土壤——在教育內容、硬件和技術層面
“子曰”作為個性化陪練老師,回復是否準確,是否真正理解“人”的特征十分關鍵,對“子曰”的要求是非常嚴苛的,它需要背后的團隊在教育內容、硬件和技術方向上長期堅持。
教育內容的數據方面,網易有道在語言學習方面早有涉獵,2007年網易推出了有道詞典,這讓網易積累了較多的語言學習語料數據集,提供了培植“子曰”的土壤。從 ChatGPT 的開發機構 OpenAI 的布局動作來看,ChatGPT 同樣缺乏垂類的數據,否則不會投資垂類公司來獲取語料了,因此,網易在教育方向積累的數據尤為珍貴。
算力方面,只針對教育垂類,成本會有所下降。芯片在成本中占比頗高,有道詞典筆 P5 產品已升級至NPU方案,相對CPU版本的模型推理速度提高了4-10倍,實現了實時的一目十行識別;在模型大小增大15倍的基礎上,AI 引擎精確度大幅提升。算法方面,國內企業的算法已經比較成熟,有道“子曰”能達到什么程度尚不得知。
在技術層面,有道自2016年開始協同構建AI基礎能力,同步組建語言、視覺、聲音團隊,為多模態打下基礎。
可以看到,在新技術來臨時,有道是有準備的。
AIGC賦能教育——打開AI+教育深度融合時代
國內 ChatGPT 目前已經形成了三個不同的發展派別,包括以百度、華為、360等為代表的通用大模型派;以網易有道、京東云、同花順等為代表的垂類大模型派;以及以王慧文、李開復、王小川等為代表的 ChatGPT 創業派。三方都在爭取實現 AIGC 從技術到產品到場景的商業化落地。
GPT系列在垂直領域教育方向強勢登場,越來越多的教育科技團隊著手布局“類 ChatGPT”技術,引發新一輪 AI+ 教育革命。
在教育行業,有企業是“拿來主義”模式,諸如 Duolingo(多鄰國)、Khan Academy(可汗學院)等企業已經使用了 GPT-4;也有自主研發模式,諸如網易有道、科大訊飛、好未來等多家教育公司均透露了相關的產品及技術布局。
GPT系列本質上是一個通過語料數據學習詞語概率分布的語言模型,真正有力量的是人們發現語言模型在足夠大的規模下通過自監督的訓練方式就可以獲得很多能力,同時找到了“調教之法”,讓ChatGPT的輸出內容符合社會價值導向和邏輯思維結構,將其模型潛能充分釋放出來。
AIGC它正在重塑教育的底層邏輯,將之推向一個更加未知的方向。