【中國智能制造網 智造快訊】雖然有著諸多阻礙,現在光學計算機似乎正重新整裝待發,研究者們在測試一種新型光學計算機芯片,為人工智能設備鋪就了新的道路。
早在半個世紀前,就已經出現了用光取代電子建造計算機的想法。“光計算”與傳統電子計算機相比,運行更快,能耗更低。然而,盡管科學家殫精竭慮,研制比現今計算機的光學元件,生產切實可行的光學計算機前景依舊暗淡。雖然有著諸多阻礙,現在光學計算機似乎正重新整裝待發,研究者們在測試一種新型光學計算機芯片,為人工智能設備鋪就了新的道路。該類智能設備有著與自動駕駛汽車等同的智能程度,同時又很精小,能放進口袋。
傳統計算機的工作依靠電子電路交替運行,開關嚴格與兩個數字的乘積相一致。光學計算機的運作原理于此類似,但數學計算不再依靠電流來進行,而是相互作用的光子束和透鏡、分束器等導光元件。與必須克服電阻并沿著電路迂回曲折傳輸的電子不同,光子沒有質量,以光速行進,一旦產生不會帶來額外的能量消耗。
麻省理工學院的科研人員近在 Nature Photonics 上發表了一篇論文,提出光學計算會非常有助于深度學習——推動人工智能重要技術的進步發展。深度學習需要的計算極其龐大:把大量數據集提供給模擬人工“神經元”構成的大型網絡,這種“神經元”是基于人類大腦結構設計的,但很簡略。每個人造神經元吸收一組數字,將這些輸入進行簡單計算并把結果傳遞給下一層神經元。通過調節每個神經元執行的計算,一個人造神經元網絡能學習執行多重任務,比如識別貓,能駕駛汽車。
深度困境
深度學習已經成為人工智能的核心,像 Google 和芯片巨頭 Nvidia 這樣的大型企業都斥資百萬研發深度學習專用芯片。人造神經網絡的大部分時間都花在了“矩陣乘法”運算上——每個神經元把它的輸入相加,并對每個輸入賦上不同的值,這種正是芯片利用了這一優勢。比如說,在面部識別神經網絡中,有些神經元會去尋找鼻子的特征。這些神經元就會給那些與狹小的深色區域(比如鼻孔)相關的輸入設置更大的值,給明亮的斑塊(如皮膚)設置稍小的值,而對熒光綠這種顏色(不太可能會出現在鼻子上)設置的值就更低。通過將這些任務分發給上百個微小并相互獨立的處理器,專用的深度學習芯片能同步進行加權運算,極大提升運算速度。
這種類型的工作負荷所需的處理能力與一臺微型超級計算機相當。奧迪和其他制造自動駕駛汽車的公司,相當大手筆地在后備箱放置了整個計算機機架,但如果要給人工智能無人機或手機配備這么高的處理能力就沒那么容易了。而且即使神經網絡能運行在大型服務器農場里,就像 Google 翻譯或 Facebook 的面部識別,這種高負荷計算消耗,電費就能達到百萬美元。
2015 年,MIT 的博士后,也是這篇新論文的作者 Yichen Shen,試圖尋求一種創新的深度學習方法來解決這些能耗和尺寸問題。在此過程中發現了論文共同作者 Nicholas Harris 的研究。Nicholas Harris 在 MIT 攻讀電子工程和計算機科學的博士學位,構建了一種新型光學計算芯片。雖然以前大多數光學計算機都沒有成功,Shen 意識到可以把光學芯片和傳統計算機進行結合,開啟深度學習的新愿景。
復合型計算機
許多研究者很多年前就放棄光學計算了。從 1960 年代開始,貝爾實驗室就花費巨資研發光學計算機部件,但終他們的努力并沒有太多成效。法國上阿爾薩斯大學(Upper Alsace University)的光學計算教授 Pierre Ambs 表示,“電子晶體管的光學等同物一直沒能被開發出來”,而且光束也無法進行基本的邏輯運算。
與以往絕大多數光學計算機不同,Harris 開發的新型芯片并不是要取代傳統 CPU(中央處理器)。它的設計僅僅專門用于量子計算,利用亞原子粒子的量子態進行運算,速度遠超傳統計算機。在參加 Harris 舉辦的新型芯片研討會時,Shen 注意到量子計算與阻礙深度學習的矩陣乘法是等同的。他隨即意識到,深度學習也許會是讓光學計算被雪藏幾十年的“殺手應用”。受此激發,MIT 團隊把 Harris 的光學芯片集成到一臺普通計算機內,讓一個深度學習程序把它的矩陣乘法運算下發到了光學硬件上。
當他們的計算機需要進行矩陣乘法時——數字的加權運算,它會首先把數字轉化成光信號,用更亮的光束代表更大的數字。這樣光學芯片就把整個大的乘法問題分解成了很多小的乘法運算,每個小運算都由芯片的單一“細胞”來完成。為了理解細胞的運作,想象一下兩股水流(即輸入光束)流入其中,然后流出也是兩股。細胞就像是水閘和水泵組成的晶格,將水流分成兩股,控制水的流速,然后再將它們合在一起。通過控制水泵的速度,細胞能引導不同量的水進入輸出流。
水泵的光學等效物是加熱后的硅(導電)通道。Harris 解釋說,加熱以后,“(硅)原子會稍微分散,導致光以不同的速度傳輸,”讓光波互相增強或抵消,就像聲波那樣。(抵消效應就是消噪耳機工作的原理)。傳統計算機設置加熱器,每個細胞輸出通道流出的光流量就是輸入的加權和,加熱器決定權重大小。
要有光?
Shen 和 Harris 通過訓練單一神經網絡辨識不同元音字母的發音來測試芯片。結果只是中等水平,不好不壞。但 Shen 認為,這是因為重復使用了不完全合適的器件。比如說,用于數字與光信號相互轉換的元件只是粗略地驗證了概念的正確性,選擇它們只因為容易跟 Harris 的量子計算芯片集成。而根據他們在 Nature Photonics 上發表的論文,他們專為深度學習打造的計算機,性能極好,足以達到與好的傳統芯片同等的準確度,同時降低了好幾個數量級的能耗,速度提升了 100 倍。這樣的性能甚至足以讓手持型設備具備人工智能,且只需將這種能力內置在手機,而無需把大量工作負荷轉嫁給大型服務器,如果沒有他們的研究,這本來幾乎是不可能實現的。
當然,光學計算機一波三折的發展史也留下了很多值得懷疑的地方。“我們不應該太過興奮,”Ambs 警告道。Shen 和 Harris 的團隊目前還沒有開發出一套完整的系統,Ambs 的經驗告訴我們,“對初級系統進行跨越性的改進絕非易事。”
即使如此,甚至 Ambs 也同意這項工作“與 90 年代光學處理器相比,是一個非常大的進步”。Shen 和 Harris 也抱著同樣樂觀的態度。他們正著手組建一家初創公司,對該項技術進行商業化,并很有信心地認為更大型的深度學習芯片也能實現。現有芯片的不足都能找到解決辦法,Harris 宣稱,所以“這只是一個工程上的挑戰,只需要找到合適的人,并真正去著手建造,一切都將迎刃而解。”
(原標題:麻省理工發表新論文:用光學芯片打造深度學習專用計算機)