10月26日消息,近日SuperCLUE發布了最新的中文大模型10月榜單,GPT4繼續霸榜位列第1,vivo自研大模型vivoLM以70.74的成績位列第4,在國內大模型中排行第1。
緊隨vivoLM后面的分別是月之暗面的Moonshot、百度的文心一言4.0和商湯科技的SenseChat 3.0。
SuperCLUE主要考察大模型在中文能力上的表現,包括專業知識技能、語言理解與生成、AI 智能體和安全四大能力維度的上百個任務。
本次評測共選取了目前國內外最具代表性的20個通用大語言模型,與9月相比新增了月之暗面的Moonshot、百度的文心一言4.0、科大訊飛的星火V3.0、vivo的vivoLM和阿里云的Qwen-14B。
本次評測數據集為全新的3754道測試題,其中包括606道多輪簡答題和3148道客觀選擇題,最終評選出總排行榜等5大榜單。
評測結果顯示,國內第一梯隊大模型格局已基本形成,頭部的幾個中文大模型已經與GPT3.5極為接近,但與GPT4的距離依然遙遠,尚未發現有對標和媲美GPT4的跡象。
SuperCLUE還認為在今年第四季度內將會出現全面超越GPT3.5的通用大模型,但如何趕超GPT4,又會成為擺在所有中文模型研發機構面前的新難題。
版權與免責聲明:
凡本站注明“來源:智能制造網”的所有作品,均為浙江興旺寶明通網絡有限公司-智能制造網合法擁有版權或有權使用的作品,未經本站授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:智能制造網”。違反上述聲明者,本站將追究其相關法律責任。
本站轉載并注明自其它來源(非智能制造網)的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點或和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。如其他媒體、平臺或個人從本站轉載時,必須保留本站注明的作品第一來源,并自負版權等法律責任。如擅自篡改為“稿件來源:智能制造網”,本站將依法追究責任。
鑒于本站稿件來源廣泛、數量較多,如涉及作品內容、版權等問題,請與本站聯系并提供相關證明材料:聯系電話:0571-89719789;郵箱:1271141964@qq.com。