當次聽到世界的社交網絡公司不是專心發展搜索機制,而是正在進行機器人研究的時候,確實讓人感到十分驚訝。
Facebook是一個有著眾多競爭優先權的大型組織,雖然這些機器人不會直接影響用戶的Facebook體驗,但公司從它們身上學到的東西可能會對多方面產生影響。
機器人技術作為Facebook的一個全新研究領域,對人工智能和前沿研究的依賴是眾所周知的。可以說人工智能的機制控制著機器人的各項機能,從相機效果到限制內容的自動調節。
人工智能和機器人是自然重疊的領域,其中一個領域的進步往往也能在另一個領域帶來全新發展。而Facebook對在現實和社交媒體世界中使用人工智能完成任務有著十分濃厚的興趣,因此它希望涉足機器人技術以挖掘人工智能的洞察力也就不足為奇了。
那么,它目前宣布的機器人技術項目有哪些廣泛的應用呢?
從零開始學走路
行走是一個非常復雜的動作,尤其是有六條腿的時候,就像這個實驗中使用的機器人。
研究人員可以設定它應該如何移動雙腿向前,轉身等等,但這有點像作弊,不是嗎?畢竟我們人類必須自己學習行走,并沒有什么說明書或設置可以導入。
因此,研究小組打算讓機器人自學走路。這其實并不是一項新型的研究,很多機器人學家和人工智能研究人員都參與其中。
通過給機器人一些基本的優先權,比如只要它向前移動就可以獲得相應“獎勵”。但沒有真正操縱其肢體的設置,團隊只是不斷讓它嘗試不同的方式,慢慢地學習并改進它移動的模型。目標是讓機器人從零開始學習走路到能夠穩定行走的時間能夠縮短到數周到數小時不等。
這對Facebook有什么用呢?
眾所周知,Facebook是一個龐大的數據庫,結構相當復雜。雖然學習管理一個數據網絡與學習管理一個機器人是非常不同的,但是系統在給定一些簡單規則和目標后,短時間內自學基礎知識的方式是相通的。
學習人工智能系統如何自學,以及如何消除諸錯誤的優先級、規則欺騙、奇怪的數據存儲習慣等障礙,對于那些在現實和虛擬世界中的算法來說是很重要的。
也許下一次Facebook需要在其平臺上監控人道主義危機時,有助于監控的人工智能模型將從這里出現的自動學習機器人中得到啟發。
利用好奇心
這項研究聽上去并不是那么直觀,但每個人都有一定程度的好奇心,雖然俗話說:好奇心害死貓。
但大多數時候它是一種驅使我們更有效地學習的動力,Facebook將好奇心的概念應用于執行各種日常任務的機械臂。
給機械臂灌輸“好奇心”似乎很奇怪,但在這種情況下,這個名詞的意思是說,負責手臂的人工智能,無論是觀察還是決定如何抓握,還是確定移動速度的過程,都被賦予了減少動作不確定性的動機。
這意味著很多事情:也許在識別物體的時候稍微扭轉一下相機,會讓它有一點更好的視野,提高它識別物體的信心;也許它會先查看目標區域,來檢查距離并確保沒有障礙物。
不管是什么情況,給予人工智能自由尋找增強信心的行動,終可能會讓它更快地完成任務,即使在開始時,它可能會因為“好奇心”放慢進程。
這對Facebook有什么用呢?
Facebook在計算機視覺方面一直走在前列,正如我們在它的相機和圖像處理程序以及Portal等設備上看到的那樣,Potal會用它的“臉”跟著用戶在房間里轉來轉去。
雖然聽上去有些驚悚,但是好奇心對于這些需要了解他們所看到或感覺到的環境才能正常工作的應用程序來說都是至關重要的。
任何在應用程序或設備上運行的攝像頭,比如Facebook上的攝像頭,都在不斷地分析它所看到的圖像,以獲取有用的信息。
當一張臉進入畫面時,十幾個新的算法就會同時啟動并開始工作。如果有人舉起一個物體,攝像頭就會忙著分析:它有文字內容嗎?需要翻譯嗎?有二維碼嗎?背景有多遠?
如果設備要及時完成這些任務,就會產生CPU使用率峰值、可見延遲以及用戶或系統工程師不希望出現的種種情況。
相反,如果人工智能助理在對場景感到不確定性時,發揮它的好奇心去檢查這些東西,確定分析物體的優先級,是個相當不錯的折衷辦法。
通過觸摸感知
盡管視覺很重要,但它不是我們或機器人感知世界的方式。許多機器人都配備了運動、聲音和其他形式的傳感器,但對物體的實際接觸相對較少。我們可以把它歸因于缺乏良好的觸覺接口。
盡管如此,Facebook的研究人員還是想研究使用觸覺數據代替視覺數據的可能性。
仔細想想,這完全是正常的,就像有視覺障礙的人用觸覺來了解周圍的環境,獲取關于物體的細節。
因此,Facebook的研究人員部署了一個人工智能模型,機器人根據視頻來決定采取什么行動,但不是實際的視頻數據,而是給它輸入高分辨率的觸摸數據。
結果表明,該算法并不真正關心它是否像我們平時觀察世界的圖像,只要數據是以視覺方式呈現的,例如作為觸覺傳感器上的壓力圖,它就可以像圖像一樣分析該模式。
這對Facebook有什么用呢?
雖然Facebook對用戶接觸并沒有多大興趣。但這不僅僅是接觸的問題,而是跨模式應用學習。
試想你次看到兩個不同的物體,閉上眼睛,單靠觸摸就可以很容易地分辨出來。為什么會這樣?
因為當你看到某個東西時,你不只是觀察到它的樣子,還構想了一個內部模型來表示它,包含了多種感官和視角。
類似地,人工智能助理可能需要將其學習的內容從一個領域轉移到另一個領域,比如說聽覺數據告訴握力傳感器如何握緊物體,或者視覺數據告訴麥克風如何分離聲音。
現實世界是一個復雜的環境,這里的數據更嘈雜,信息量更大。無論數據類型如何,都能夠利用這些數據對于可靠理解和與現實交互非常重要。
所以你會發現,這些研究本有趣,而且事實上也很重要。正如描述這項研究的博客文章所言:“我們專注于使用機器人技術,這不僅會生產出更有能力的機器人,還將在未來數年或者數十年內挑戰人工智能的極限。如果我們想要更接近像人類那樣思考、計劃和推理的機器,那么我們需要構建人工智能系統,使其能夠在多種場景中自主學習,不僅僅是在虛擬的數字世界。”
隨著各大網絡社交媒體不斷擴大其影響力,其應用程序和服務的的范圍涉及日常生活的方方面面,它對人工智能助力的要求也就越來越復雜。
雖然我們不會很快看到一個“Facebook機器人”,但未來可期。
(原標題:Facebook研究機器人,是打的什么算盤?)