【
中國智能制造網 技術前沿】如果請一個機器人來抓取同樣的東西,你只會看到一個發呆的機器人或得到一團皺巴巴的東西抓在機器人手里。這是因為機器人通常擅長需要很多力量的重復性工作,它們在面對陌生事物時做得還不夠好。
如何訓練機器人?VR技術或為得力助手
幫我個忙,抓住你周圍的一件東西。隨便你怎么做,即使你以前從來沒有做過這種事情,但是你的大腦會告訴你應該如何去做,比如說怎樣抓取物體,要用多大的力量。這是人類與生俱來的動手能力。
然而,如果請一個機器人來抓取同樣的東西,你只會看到一個發呆的機器人或得到一團皺巴巴的東西抓在機器人手里。這是因為機器人通常擅長需要很多力量的重復性工作,它們在面對陌生事物時做得還不夠好。然而一家名為“Embodied Intelligence”的公司卻能將機器人和人們的優勢融合到一個新的系統中,使得普通人可以簡便地教授機器人新任務。你可以把它想象成一個虛擬現實游戲,而只有你能操控那些巨大的機器人。
如果你想教機器人如何拿起扳手,你可以用如下幾種方法。你可以把它所需要的動作進行編程——這個過程會非常沉悶冗長。
強化學習是一項更為復雜的新技術。加州大學伯克利分校實驗室有一個名叫布雷特(Brett)的機器人,它可以進行自我強化學習,不斷地嘗試把方塊放在方孔里。如果它的移動能讓方塊更靠近方孔,那么它就會得到獎勵。一次次地嘗試之后,機器人就會離其目標越來越近,直到終成功完成此次任務。這生動地展現了一個機器人是如何在10分鐘內自行掌握一個兒童游戲的。
相比之下,以往讓機器人活動的編程耗時巨大。因為機器畢竟要受現實束縛,在有限的時間內只能進行一定量的訓練嘗試(而在模擬訓練中強化學習速度要快得多,因為虛擬試驗能更快地進行)。
其中一位操作員演示了機器人是如何把一個方塊放在對應的方孔里的,這就是讓機器人行為更為精細的技術——模仿學習。機器人的手臂像游戲操縱桿一樣靈活,但可惜的是這種機器人無法教導自己進行新任務。
Embodied Intelligence公司所構想的是一個綜合模仿學習和強化學習的混合系統。人類可以使用VR(虛擬現實)耳機和控制器,來遙控機器人執行某項任務。這在操作員和機器人之間創建了一個更加自然的動力學連接,即機器學習算法。這種算法可以把人類的行為匹配到機器人的運動控制之中。強化學習就這樣開始了,機器人可以反復試驗來不斷改進自己的動作,直到它的工作能做的比人類教的更好為止。
Embodied Intelligence公司的聯合創始人兼總裁彼得·阿貝勒表示,“通常情況下,人們希望自己的機器人是超人,做得要比人類訓練師更好。人們還希望機器人在掌握了一項技能之后,可以自己進行反復訓練,來讓這項技能變得更快,更準確,更可靠,而不再需要人類對它進行持續訓練。畢竟理論上講,很多事人類是無法做得比機器人更快的。”
暢想一下未來的工廠是什么樣子的。程序員不需要對在流水線上的機器人進行編碼,而是在虛擬現實中訓練機器人。也許機器人在一開始會表現不佳,但隨著時間的推移,機器人會做得越來越好。而且隨著研究人員構建出更好的學習算法,機器人還可能會承擔起一項人類教授的特定任務,它還可以自己教自己完成不同的事情。
但是,目前這個系統還處于初期發展階段。目前它正在研究PR2機器人,這是一種相對較慢且笨拙的機器人。現在的任何機器人都遠不如人靈巧,所以即使這個東西擅長復制模仿操作者的動作,卻也不能復制出精細的抓握。但是,如果Embodied Intelligence公司真的開發出這種系統出來,那么制造商很快就可以運用上,讓工業用機器人向工人學習,之后工業機器人可以自行強化掌握的種種技能。
設想一下,我們讓所有的機器人都搭載上這種系統。如果你有100臺機器人在網絡中交流,并且其中一個學到了一些特別有用的東西,那么它就可以把這些知識共享給其余99個機器人。這就是一種強大的蜂巢思想,一個人會則人人皆會。機器人甚至不必具有相同的規格,因為研究人員已經想出了信息在不同類型的機器之間轉換的方法。
從近期來看,這不僅能使機器人變得更加智能,而且使他們更容易從人類身上學習新知識。雖然在實驗室里編程布雷特(Brett)需要花費博士的很多時間,但Embodied Intelligence(公司的聯合創始人兼執行官陳皮特表示,“如果使用了新系統,那么任何能夠使用VR耳機的人都能夠快速地教授機器人新技能。這將改變目前機器人遠不及軟件技術的現狀,讓機器人技術騰飛。”
那么,這是否會使機器人更容易取代工作人員?是的。但是機器人會接管那些繁瑣重復又勞累的工作,解放掉這些工人,讓他們去從事需要敏銳觸覺以及創造力的工作。如果我們希望這種富有成效的關系成為現實,那么我們就需要機器人具備快速學習能力,讓機器人成為人類的幫手。
(原標題:新技術:如何用VR訓練機器人? 作者MATT SIMON;由億歐編譯。)