大地资源网视频在线观看新浪,日本春药精油按摩系列,成人av骚妻潮喷,国产xxxx搡xxxxx搡麻豆

正在閱讀:512顆GPU、10萬億參數!阿里達摩院發布全球最大AI預訓練模型

512顆GPU、10萬億參數!阿里達摩院發布全球最大AI預訓練模型

2021-11-09 09:13:35來源:快科技 關鍵詞:人工智能閱讀量:22341

導讀:11月8日,阿里巴巴達摩院公布了多模態大模型“M6”的最新進展,其參數已從萬億躍遷至10萬億,成為全球最大的AI預訓練模型。
  11月8日,阿里巴巴達摩院公布了多模態大模型“M6”的最新進展,其參數已從萬億躍遷至10萬億,成為全球最大的AI預訓練模型。
 
  作為通用性AI大模型,M6擁有多模態、多任務能力,尤其擅長設計、寫作、問答,在電商、制造業、文學藝術、科學研究等領域有廣泛應用前景。
 
  與傳統AI相比,大模型擁有成百上千倍“神經元”數量,認知和創造能力也更勝一籌,被普遍認為是未來的“基礎模型”。
 
  但是,大模型的算力成本相當高昂,比如訓練1750億參數語言大模型GPT-3所需能耗,能讓一輛汽車在地月之間往返一趟。
 
  今年5月,通過專家并行策略及優化技術,達摩院M6團隊將萬億模型能耗降低超過80%,效率提升近11倍。
 
  10月,M6再次突破業界極限,使用512顆GPU,在10天內就訓練出了具有可用水平的10萬億模型,相比去年發布的大模型GPT-3,M6實現了同等參數規模,能耗卻只有1%。
 
  另一方面,AI大模型擴展到千億及以上參數的超大規模時,很難放在一臺機器上,為此達摩院在阿里云PAI自研Whale框架上搭建了MoE模型,并通過更細粒度的CPU offload技術,最終實現將10萬億參數放進512張GPU:
 
  自研Whale框架:
 
  自研Whale分布式深度學習訓練框架,針對數據并行、模型并行、流水并行、混合并行等多種并行模型進行了統一架構設計,讓用戶在僅僅添加幾行API調用的情況下就可以實現豐富的分布式并行策略。
 
  MoE專家并行策略:
 
  在Whale架構中實現Mixture-of-Experts(MoE)專家并行策略,在擴展模型容量、提升模型效果的基礎上,不顯著增加運算FLOPs(每秒所執行的浮點運算次數),從而實現高效訓練大規模模型的目的。
 
  CPU offload創新技術:
 
  在自研的分布式框架Whale中通過更細粒度的CPU offload,解決了有限資源放下極限規模的難題,并通過靈活地選擇offload的模型層,進一步地提高GPU利用率。
 
  此外,針對訓練效率問題,M6團隊設計了Pseudo-to-Real(共享解除)機制,即利用訓練好的共享參數模型初始化大模型,讓收斂效率進一步提升7倍,解決大模型訓練速度慢的問題。
 
  對比不使用該機制,預訓練達到同樣loss用時僅需6%;和此前萬億模型相比,訓練樣本量僅需40%。
 
  作為國內首個商業化落地的多模態大模型,M6已在超40個場景中應用,日調用量上億。
 
  今年,大模型首次支持雙11,應用包括但不限于:
 
  - M6在犀牛智造為品牌設計的服飾已在淘寶上線;
 
  - 憑借流暢的寫作能力,M6正為天貓虛擬主播創作劇本;
 
  - 依靠多模態理解能力,M6正在增進淘寶、支付寶等平臺的搜索及內容認知精度。
 
  未來,M6將積極探索與科學應用的結合,通過AI for science讓大模型的潛力充分發揮,并加強M6與國產芯片的軟硬一體化研究。
 
  目前,達摩院聯合阿里云已推出M6服務化平臺,為大模型訓練及應用提供完備工具,首次讓大模型實現“開箱即用”,算法人員及普通用戶均可方便地使用平臺。
我要評論
文明上網,理性發言。(您還可以輸入200個字符)

所有評論僅代表網友意見,與本站立場無關。

  • 福建首設人工智能產業科技專項,開啟智能發展新篇章

    此次設立的人工智能產業發展科技專項在福建省尚屬首次。根據最新發布的申報指南顯示,本批次項目將重點聚焦兩大關鍵技術領域予以支持。
    人工智能智能制造
    2025-06-23 08:40:50
  • 人工智能進校園:智啟未來 AI筑夢

    當前,AI在校園中的主要應用方向包括個性化學習系統、智能教學輔助工具、自動化行政管理和校園安全監控等。這些應用不僅提高了教育效率,還為教育公平和質量提升創造了新的可能。
    人工智能智慧校園
    2025-06-19 11:40:29
  • 快訊|上海將加大人工智能與6G技術創新研發力度;黑芝麻智能擬收購AI芯片企業

    6月18日,上海市副市長陳杰在2025MWC上海開幕式上表示,上海正強化新一代信息技術的引領作用;黑芝麻智能國際控股有限公司宣布,擬通過股權收購及注資方式收購一家AI芯片企業......
    人工智能6G技術AI芯片
    2025-06-19 11:06:04
  • 多地政策加碼,具身智能產業發展進入快車道

    截至2025年6月12日,北京、上海、江蘇、四川等多個地區已相繼出臺專項政策,形成覆蓋技術研發、場景開放、生態建設的系統性產業支持體系。
    具身智能人工智能
    2025-06-16 10:36:20
  • 物聯網和人工智能融合塑造嵌入式系統的未來

    物聯網包括傳感器和執行器等設備。 AI涉及編程,構建模型以及使用其他各種算法。兩者單獨都有其局限性。將這兩個集成到一個系統中肯定會帶來巨大的結果。
    物聯網人工智能嵌入式系統
    2025-06-16 09:37:53
  • 人工智能如何重塑交通運輸:從交通管理到自動駕駛的七大變革

    隨著城市規模的不斷擴大和人們出行需求的日益增加,智能交通系統的重要性愈發凸顯。未來,隨著人工智能技術在預測交通需求、優化路線規劃和保障行車安全等方面的應用不斷深化,道路將不再僅僅是車輛通行的場所,而是一個充滿智慧的交通生態系統。
    人工智能智能交通自動駕駛
    2025-06-13 10:00:36
版權與免責聲明:

凡本站注明“來源:智能制造網”的所有作品,均為浙江興旺寶明通網絡有限公司-智能制造網合法擁有版權或有權使用的作品,未經本站授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:智能制造網”。違反上述聲明者,本站將追究其相關法律責任。

本站轉載并注明自其它來源(非智能制造網)的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點或和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。如其他媒體、平臺或個人從本站轉載時,必須保留本站注明的作品第一來源,并自負版權等法律責任。如擅自篡改為“稿件來源:智能制造網”,本站將依法追究責任。

鑒于本站稿件來源廣泛、數量較多,如涉及作品內容、版權等問題,請與本站聯系并提供相關證明材料:聯系電話:0571-89719789;郵箱:1271141964@qq.com。

不想錯過行業資訊?

訂閱 智能制造網APP

一鍵篩選來訂閱

信息更豐富

推薦產品/PRODUCT 更多
智造商城:

PLC工控機嵌入式系統工業以太網工業軟件金屬加工機械包裝機械工程機械倉儲物流環保設備化工設備分析儀器工業機器人3D打印設備生物識別傳感器電機電線電纜輸配電設備電子元器件更多

我要投稿
  • 投稿請發送郵件至:(郵件標題請備注“投稿”)1271141964.qq.com
  • 聯系電話0571-89719789
工業4.0時代智能制造領域“互聯網+”服務平臺
智能制造網APP

功能豐富 實時交流

智能制造網小程序

訂閱獲取更多服務

微信公眾號

關注我們

抖音

智能制造網

抖音號:gkzhan

打開抖音 搜索頁掃一掃

視頻號

智能制造網

公眾號:智能制造網

打開微信掃碼關注視頻號

快手

智能制造網

快手ID:gkzhan2006

打開快手 掃一掃關注
意見反饋
我要投稿
我知道了
主站蜘蛛池模板: 尼勒克县| 和静县| 玉树县| 司法| 大安市| 兰溪市| 方城县| 汝州市| 罗定市| 扶沟县| 滁州市| 黄浦区| 惠安县| 乐陵市| 弥渡县| 杭锦后旗| 渝北区| 万盛区| 革吉县| 扎兰屯市| 鲁甸县| 奎屯市| 彰武县| 措勤县| 松阳县| 轮台县| 静宁县| 江川县| 如皋市| 荥阳市| 榕江县| 吴桥县| 遂平县| 元氏县| 深圳市| 许昌县| 来凤县| 邵东县| 铜鼓县| 溧阳市| 江城|