【
中國智能制造網 技術前沿】我們發現,機器人現在需要有一個根本性的進化,這就是逐漸從性進入到了靈巧性。新的應用需求要處理不確定性,處理不完全信息,具體表現為非結構化環境,這些需求和現有技術比較還是有一點差距的。
陳小平教授曾任2015年世界人工智能大會機器人領域主席,2008年、2015年兩年的機器人世界杯及學術大會主席。在2016年獲得IEEE ROBIO大會佳論文獎,同時還獲得了國務院政府特殊津貼,是中科大杰出研究校長獎獲得者。
陳小平教授從性和靈巧性兩個方面深入分析了機器人過去取得的成就,及將來面臨的挑戰。以下是陳教授在機器人大講堂的演講實錄(為使文章簡介規范,略有改動):
機器人靈巧性:需求推動的技術變革
機器人從性向靈巧性轉變
對于機器人的發展,我們一方面結合國家戰略需求和市場的需求研發機器人;另一方面,根據我們了解的機器人技術都取得了什么樣的成果,能夠支撐什么樣的應用,來衡量技術的有效性。當把兩個方面放在一起時,我們發現,機器人現在需要有一個根本性的進化,這就是逐漸從性進入到了靈巧性。
回顧一下機器人產業的歷史。1961在通用汽車生產線上用了工業機器人,到現在56年了。人工智能領域到現在已經做了60多年,取得的成果國內比較關注的是阿爾法狗,但西方民眾開始重視人工智能是在1997年,當時IBM的深藍戰勝了十年棋王卡斯特羅夫。
所以,對西方人來說,他們感受到人工智能超過人的時間比我們早20年。但是為什么工業機器人能夠成功,而所謂的智能機器人到現在還不成功?
工業機器人回顧
其實工業機器人是比較簡單的,其硬件本體基于關節-連桿機構,用運動學來計算關節的角度,保證機械臂的末端能夠達到指定的位置。這很容易給人帶來一個誤區,覺得機器人的成功完全是因為機械臂的性,其實不是這樣的。
近幾年我們到很多生產現場去實地學習,發現生產線上還需要大量輔助設備,其中一種叫夾具。夾具相對于機器人來說古老得多,這個領域有很多成熟的技術。一般來說,在國內,一條生產線只有1/3到1/5的開支是機械臂的,其它的都是這些輔助設備的,包括夾具的。
在國外,他們的加工精度更高,所以他們輔助裝備的開支占比更大,只有1/5到1/8是機械臂,其它都是輔助設備的。我們這樣全面的一看才發現:工業機器人能夠成功,并不是單純的因為機械臂的性,還要加上環境的性。
環境怎么能?必需經過化改造,也就是說造一條生產線,以保證生產線上的每一個操作對象(如工件)在任何時刻都被定位,使得機械臂和其他加工設備可以地進行操作。這才是工業機器人的一個完整圖像。
傳統主流控制策略
工業機器人背后的技術主要是控制技術。傳統的主流控制技術有四種:優化控制、適應性控制、Robust控制,這三種都試圖讓機器人有一定的靈活性或者靈巧性,第四種叫分層控制。當問題太復雜了,就需要分層控制了。
各種傳統控制策略背后的原理,其實就兩種。
種是基于決策論的控制,也就是基于馬爾可夫決策過程理論的控制原理。這種原理對問題做了一個抽象,把實際問題抽象為狀態集、行動集、回報函數和概率轉移函數四個基本構件。在這套基本構件的基礎上,引入一些數學規劃的方法。首先定義值函數,值函數是評價一個動作的價值的。
值函數怎么計算?原始的辦法是用貝爾曼公式,后來有很多種改進的計算辦法。有了值函數,就可以計算優策略,從而決定在什么狀態下執行什么策略好。決策論的一個基本要素是概率轉移函數,概率轉移函數在馬爾可夫決策里扮演了關鍵性的角色,后面的值函數和優策略求解,都依靠概率轉移函數,沒有它后面的事情都干不了。
這套體系在理論上有很多成果,但在實際應用中,根據我們的觀察和了解,得到一個大規模實際問題的可實用的概率轉移函數是非常困難的,鮮見成功實例。也就是說,這套理論假定了一種數學機制,但那個機制在大規模實際問題中通常是得不到的。
那么,工業機器人實際上是怎么干的?就是用運動學和動力學來簡化決策論模型,關鍵是把概率轉移函數給取代了,這樣就沒問題了。這樣做的效果是達到了性,但很大程度上喪失了靈巧性,因為在馬氏決策論體系中,沒有概率就無法表達不確定性。因此,在工業上實際我們用的是運動學、動力學這套辦法。
還有一種是基于模糊數學的模糊控制。模糊數學也可以用一段話來概括,核心思想是用實數區間[0,1],即用連續統上的分類/建模替代二值布爾分類/建模。比如講臺邊緣能測量嗎?不能。那么按照模糊數學,對桌面邊緣上的每一點,給它一個隸屬度。
比如給它1,表示這一點肯定在桌面上;給它0,肯定不在桌面上;其他情況,用隸屬度大小表示在桌面上的模糊度。隸屬度和馬氏決策論中的概率轉移函數一樣,對于大規模實際問題很難得到實用化的隸屬度。
1997年,IBM的深藍打敗了卡斯帕羅夫,當時西方人和我們看到阿爾法狗打敗李世石是一樣的,感覺天都塌了。深藍的核心技術是前瞻至少14步,對前瞻得到的棋局用專家的知識做判斷,選擇有利的走步。這么簡單的辦法計算量非常大,所以用了人工智能的一種技術叫剪枝,把前瞻棋局減到了600億個,但還是算不過來。
人工智能硬件什么時候開始做?深藍就開始做了,不是現在才做。許峰雄做了專用的芯片,計算象棋棋局的評價,一秒鐘算5億個棋局,600億個棋局5分鐘就算完了,可以用于比賽實戰。這套技術看上去很簡單,但是意義非常重大,我把它的意義總結為“許峰雄不等式”: