隨著自動駕駛的快速發展,系統功能越來越復雜,對算力的要求也越來越高。
據相關分析數據顯示,現階段 L2 級別自動駕駛計算量已達10TOPS,L3 自動駕駛對芯片算力的需求約在 30 ~100TOPS 之間,L4/L5 則分別在 100/1000 TOPS 以上。對于高階自動駕駛而言,高算力自動駕駛芯片已然成了落地的關鍵所在。
正因為如此,目前很多車企和技術提供商都將峰值算力作為了衡量自動駕駛芯片能力的重要指標,由此吸引各大芯片廠商紛紛加碼研發大算力、高性能自動駕駛芯片。
近日,安霸在CES 2022上發布了全新的AI域控制器芯片 CV3 系列。該系列芯片基于5nm制程打造,AI等效算力達500eTOPS,能夠支持ADAS和 L2+ 至 L4 級自動駕駛系統的研發。據安霸中國區總經理馮羽濤介紹,和以往一樣,此次新推出的CV3 系列將包括多個不同的版本,此前亮相CES的CV3 - HIGH是該系列的高性能旗艦版產品,后續安霸將根據具體客戶需求,對相關性能進行裁剪,進一步推出中端和入門級產品。
安霸首發CV3 系列,單芯片AI算力達500 eTOPS
作為安霸最新 AI 域控制器芯片,CV3系列芯片采用了5nm制程,基于完全可擴展、高能效比的 CVflow® 架構,可實現500 eTOPS AI算力,比安霸上一代車規級 SoC CV2 系列提高了 42 倍,而功耗僅為50W,相當于能效比只有10 eTOPS/W,較CV2提升了4倍。
“這里的e指的是equivalent。因為我們的架構是特殊的架構,CVflow®不等同于任何GPU,這就導致CV3芯片AI算力的計數單位與大家常用的GPU的TOPS有所不同,這里加了e也就是說跟通用芯片架構相比,我們可以跑到等效的性能。” 馮羽濤指出。
這是什么概念呢?目前在自動駕駛領域備受青睞的英偉達Orin芯片,算力也只有254 TOPS,蔚來ET7通過四顆Orin級聯也僅實現了1016 TOPS算力。而如果采用四顆CV3芯片級聯,意味著可以實現2000 eTOPS的超高算力。正因為如此,對于這款芯片未來幾年的市場前景,安霸也是信心十足。
具體來看,相較于上一代CV2,CV3對CPU進行了大幅升級,搭載了多達 16 個 Arm® Cortex-A78AE CPU 內核,這是Arm最新推出的高性能CPU內核,由此使得CV3在支持自動駕駛系統的軟件應用所需的 CPU 性能上,比CV2 提高了 30 倍。
在設計上,安霸將這16 個 Arm® Cortex-A78AE分成了四個集群,每個集群4個核,用于實現不同的功能,從而使軟件開發相對較獨立,并且還可以互為冗余,提升安全性。例如,可以用一個集群做安全島,一個集群負責神經網絡以及視覺感知,一個集群用于融合。
“現在我們第一顆芯片雖然有4個集群共16個核,但將來真正落地的時候,如果客戶不需要這么多,也是可以裁剪的。” 馮羽濤表示。不僅如此,CV3還加入了HSM模塊。在馮羽濤看來,未來在汽車域控制器里,HSM將是必須的硬件安全模塊。
另外,CV3還應用了安霸全新一代CVflow®架構,其中對神經矢量處理器NVP和通用矢量處理器GVP進行了專門的區分,從而更好地分工協作,滿足不同客戶的算法開發需求。據馮羽濤介紹,就應用而言,NVP主要是針對卷積神經網絡運算,可以運行先進的神經網絡算法,而GVP則更擅長浮點運算、非神經網絡計算,可以幫助 NVP 引擎分擔傳統算法等運算處理。CV3里有專用硬件加速用來跑傲酷的 4D 成像雷達 AI 算法。
為繼續發揮安霸在圖像處理領域的領先優勢,CV3 系列亦搭載了其最新一代 ISP,可同時支持 20 路攝像頭通過 MIPI VC 方式連接,并可以接入激光雷達、毫米波雷達、超聲波雷達等自動駕駛傳感器,進行多傳感器的深度融合,通過單顆芯片實現 ADAS到L4 不同等級自動駕駛系統的研發。
在此過程中,馮羽濤指出,最大的挑戰是如何讓一個新平臺同時適應不同的研發需求,并且兼顧功耗和成本。“做一顆超高算力的芯片,理論上只要拼很多核放進去一樣可以實現很高的算力。但這種做法很難落地,因為真正應用的時候,會面臨各種各樣的瓶頸,包括功耗,包括成本,都是需要考慮的,而且這些也是評價一顆芯片最核心的幾個指標。”
支持視覺和雷達前融合,大幅提升融合感知效果
2021年10月,安霸正式與傲酷雷達( Oculii)達成最終收購協議。通過此次收購,安霸得以將傲酷的算法部署在其 CVflow® 系列芯片上,從而將目標市場拓展至雷達感知與視覺融合領域。此次CV3的發布,可以說是雙方合作的首個重要成果。
據安霸中國區市場營銷副總裁郄建軍介紹,通過對傲酷的收購,安霸在CV3系列中也加入了傲酷4D高精度雷達的算法,實現了4D成像雷達和視覺感知原始數據集的融合,這也是前一代產品所不具備的。
在視覺和雷達的融合方面,目前一般做法都是后融合或者目標級的融合。這類融合雖然對計算量和通信帶寬的要求相對降低,但由于部分數據的舍棄使其準確性也有所下降。CV3基于卓越的 AI 處理性能可以做前融合,即對視頻的像素和雷達的點云做原始數據級的融合,從而使融合感知的整體性能、置信度等大幅度提升,降低誤檢率、漏檢率。
在郄建軍看來,隨著自動駕駛的快速發展,未來傳感器融合可能都會朝著原始數據集前融合的方向發展。而CV3除了視覺和雷達的前融合,其實也可以支持激光雷達的前融合,具體視客戶的需求而定。但無論如何,視覺都將是自動駕駛最重要的感知手段。
在智能駕駛領域,安霸布局由來已久,一直以來安霸堅持的都是“算法優先”。通過對VisLab和傲酷的收購,安霸先后入局了自動駕駛算法和雷達處理算法的研究,以深刻理解這些技術對于芯片的需求。
除此之外,在圖像處理和壓縮以及AI加速算法等領域,安霸也積累了豐富的經驗。尤其是圖像處理,安霸已經擁有17年的研發經驗,基于此安霸已經先后推出了多款基于視覺感知的車用芯片,包括不帶AI處理器的A12、H22、H32,以及加入了安霸獨有AI加速引擎設計的CV2x系列、CV5等。
其中CV2x系列采用了10nm制程,在前視ADAS、智能電子后視鏡、DMS、OMS、行泊一體等領域有廣泛的應用,例如RIVIAN、Motional、Arrival,都是安霸CV2芯片的合作伙伴。CV5是安霸首顆5nm制程芯片,已經于CES 2021正式推出,這意味著安霸的5nm芯片此前就已經經過了驗證。
盡管如此,馮羽濤指出,隨著自動駕駛的快速發展,對芯片的算力、多傳感器連接以及信息處理等的需求都在大幅提升,這些產品是遠遠無法滿足高階自動駕駛對中央域控制器的需求的,這也是為什么安霸要推出CV3。接下來,馮羽濤表示安霸將會結合客戶實際的市場需求,對此次發布的旗艦級產品進行功能裁剪,降維應用于不同系統的開發,更好地滿足當前百花齊放的自動駕駛市場。