大地资源网视频在线观看新浪,日本春药精油按摩系列,成人av骚妻潮喷,国产xxxx搡xxxxx搡麻豆

正在閱讀:AI同傳PK人類同傳,這或許是兩個職業

AI同傳PK人類同傳,這或許是兩個職業

2018-04-18 08:59:16來源:智能相對論 關鍵詞:AI同傳閱讀量:23951

導讀:今年的博鰲亞洲論壇上,次出現了AI同傳。值得注意的是,這是博鰲論壇創辦17年采用人工智能同傳技術。然而在如此重要的場合,現場配備的騰訊AI同傳卻掉了鏈子。
  【中國智能制造網 行業動態】今年的博鰲亞洲論壇上,次出現了AI同傳。值得注意的是,這是博鰲論壇創辦17年采用人工智能同傳技術。然而,在如此重要的場合,現場配備的騰訊AI同傳卻掉了鏈子。詞匯翻譯不準確、重復、短語誤用等“烏龍”引來各方“嘲笑”。
 
  人們總是把AI跟人類職位對立起來,各種“取代論”層出不窮。博鰲論壇會議前,就出現了許許多多的“取代論新聞”引起了各界關注。終,AI同傳“翻車”,引來外界一片唏噓。
 
  然而,就目前來看,AI同傳前路未明,太早將其與人類同傳對立起來實在是“杞人憂天”。除了取代,AI同傳其實有更好的路。
 
  AI同傳進階之路:變智能問題為數據問題
 
  很多人都覺得人工智能如果要處理自然語言,就必須理解自然語言。實質上,AI翻譯靠的是數字,更準確地來說,是統計。AI同傳出錯,并不是“智能”不夠,實質上,是數據和模型出了問題。
 
  AI同傳還需要理解力
 
  首先,AI同傳要去理解場景。在博鰲論壇上,會議現場專業度高、覆蓋度廣,AI對特殊場景的理解還不夠。場景對于語義具有至關重要的影響,相同的一句話在不同的場景里有不同的意思。舉個例子,“好”這個字在百度漢語顯示有多種語義,既可以表示稱贊,也可以表示狀態,還可以表達問好……諸如此類,語義的表達和理解都要結合具體的場景。在具體的句子中,這種語義與情景的結合就更為緊密,更需要機器理解學習。
 
  其次,AI要理解口語的模糊邏輯。口語翻譯是不會傳譯的,根據AIIC(會議口譯員協會)的規定,同傳譯員只要翻譯出演講者內容的80%就已經算是合格了(90%~100%的“同傳”幾乎是不可能的)。這意味著AI工作量減少嗎?當然不,正是這種模糊的東西使得AI同傳更加困難,除此之外,口語沒有標點符號來標志句子,缺少了必要的聲調和停頓,就很容易造成句子的歧義。而模糊的指令極有可能出現的是滿屏的錯碼。
 
  隱馬爾可夫模型(HMM)解決統計數據之外的語言問題
 
  然而,在參考騰訊AI同傳的失誤后,我們發現,僅僅增加數據量還是不夠的,在現實生活中,我們也會遇到零概率或者統計量不足的問題。
 
  比如一個漢語的語言模型,就足足達到20萬這個量級。曾有人做過這樣一個假設,如果刨掉互聯網上的垃圾數據,互聯網中將會有100億個有意義的中文網頁,這還是相當高估的一個數據,每個網頁平均1000詞,那么,即使將互聯網上上所有中文內容用作訓練,依然只有1013。
 
  為了解決數據量的問題,我們提出了隱馬爾可夫模型(HMM)。實際應用中,我們可以把HMM看作一個黑箱子,這個黑箱子可以利用比較簡潔的數據,處理后得出:
 
  1.每個時刻對應的狀態序列;
 
  2.混合分布的均值和方差矩陣;
 
  3.混合分布的權重矩陣;
 
  4.狀態間轉移概率矩陣。
 
  看起來可能比較復雜,簡單點說,這個模型可以通過可觀察的數據而發現這個數據域外的狀態,即隱含狀態。也就是說,我們可以憑借一句話,來探索出這句話后的隱含的意思,從而解決一些微妙的語義問題。
 
  這個模型能夠通過你提供的可以明顯觀察的句子,推斷出一個人隱含的心情狀態(開心OR難過),并得到后的行為判斷(宅、購物、社交),即通過已知推斷出未知。
 
  而如何優化這個模型,得到優隱含狀態?人們提出了許多解決問題的算法,包括前向算法、Viterbi算法和Baum-Welch算法。此中奧妙,難以盡述。但不能否認的是,在深度學習的基礎上,數據+模型就能很好地打造出一款AI同傳翻譯,數據越大,神經網絡更好。即使翻譯結果不盡如人意,但只要建設足夠大的數據庫,建立更好的模型,打磨算法,AI同傳很快就會有更大的提升。
 
  NLP金字塔頂端反哺底端:打造高質量AI同傳
 
  除了增加數據庫和打磨數據模型,AI同傳還可以從哪些方面提升呢?我們不妨借鑒一下其它的技術。下圖中,這四個方面代表了人們在NLP領域的一些進步。用金字塔形來表示這四個技術之間的關系,難度是逐級上升的。
 
  目前,聊天機器人和閱讀理解這一塊兒已經取得了很大的突破。而AI閱讀理解技術的進步不止是NLP的高階進化,還有一層意義是,科學之間是相通的,技術之間可以互相借鑒,金字塔頂端技術可以反哺底端。
 
  在自然語言處理上,人區別于AI的點在于人有先驗知識。即人們在聽到某個字時,會自然地聯想到后一個字,或者會被一個詞觸發了一句話的聯想。比如,我們聽到“中”,既有可能想到“國”,也可能想到“間”。但是AI“聯想”的詞卻依靠數據。它說“北”,如果輸入的數據不變,那后面跟的就是”京“。
 
  智能相對論行業分析師顏璇曾經在《AI在閱讀理解領域開始“跑分”,這個“人類好幫手”還能去哪炫技》一文中總結了AI閱讀理解的技術層面,我們或許可以從中得到閱讀理解技術反哺AI同傳的方法。
 
  AI閱讀理解技術的流程如下,em bedding la yer(相當于是人的詞匯級的閱讀知識)→Encoding la yer(相當于人通覽全文)→Matching la yer(相當于帶著問題讀段落)→Self-Matching la yer(相當于人再讀一遍進行驗證)→AnswerPointerla yer(相當于人綜合線索定位答題)。
 
  綜合來看,閱讀更偏向的是Multi-turn,即做完一次輸入輸出后,要把結果作為下輪輸入的一部分繼續輸出,系統在運作時需要考慮上下文。而翻譯,則是Single-turn,一句話進一句話出。
 
  合理利用后,機器翻譯即使現在是Single-turn,將來也有可能是Multi-turn;AI同傳現在沒用到上下文背景,將來也有可能結合上下文做到翻譯質量更佳。
 
  如今,創作還是人工智能正在摸索的領域,而一旦這個領域有了突破,將一些技術應用到AI同傳里,我們或許可以達到翻譯的高境界——“信、達、雅”。
 
  在未來,AI不會擠占人類同聲傳譯員的空間
 
  AI同傳會取代人類翻譯嗎?當然不會。先不說語言本身的復雜,我們可以來看看同傳的實際應用場景。
 
  在實際工作中,不論是口譯還是直接對話都需要同傳來完成,不會有被服務方只聘用其中的一個職能。也就是說,AI同傳不僅要學會翻譯,還要學會聊天。而在這一塊兒,機器還有很大的進步空間。那么,AI同傳的用處在哪里呢?
 
  AI共享同傳,僅針對普通人的市場
 
  人們出國旅游,常常會遇到語言溝通問題,然而,并不是每個人都配得起一個專業的口語翻譯。這時候,如果一個可穿戴設備亦或者一部手機就能為你同聲傳譯,想必會減少很多人的出國成本。隨身攜帶一位專屬的同聲傳譯,是不是覺得很酷呢?
 
  智能硬件一直是AI的狂熱地帶。就在去年,微軟和華為合作,在Mate10手機中嵌入了微軟的神經網絡機器翻譯,可以算得上是在終端運行神經網絡機器翻譯的例。
 
  如果AI同傳的硬件設備出世,更可能的商業模式是出租或者共享。即按需求進行租用,有一個專門的技術公司負責租賃,正如共享單車一樣,我們的使用費會降到極低。而這類AI的應用場景并不在復雜的會議現場,而是日常生活,出外旅游等,語料庫的建設也會更加簡單。
 
  如此,AI同傳只是更加惠民而已,卻不會取代在某個特殊場景比如金融會議、醫療會議等更加專業的人類同傳。
 
  將AI同傳與硬件設備相結合,創造切實可用的語音接口,還可以在很大程度上提高用戶在移動終端、可穿戴、智能家居、智能汽車等智能設備的體驗,真正在交互層面實現智能時代的人機結合。
 
  AI同傳成為同聲翻譯的考官
 
  同聲傳譯需求量成倍增加,但是合格的同聲傳譯的數量卻增長非常緩慢,據了解,現實市場上能夠十句話翻譯出十句的同傳譯員。同時,擁有口譯資格證書的人并不一定能勝任同聲翻譯,同聲翻譯還需要進行專業的技能訓練,而有些合格的同聲翻譯人員也并不一定有口譯證書。
 
  目前,我國還沒有一個固定的機構來負責同聲翻譯的相關事宜,也沒有一套統一的標準對同聲翻譯的工作進行考評。
 
  面對這樣的困境,我們或許可以在AI同傳上開個腦洞。
 
  人們可以利用AI數字化、標準化等特點,以數據庫為依托,將AI訓練成單一功能性的考核機器,針對不同的應用場景,對同聲傳譯員進行考核和評級,從而規范人才市場。
 
  這里或許可以參考駕駛培訓機器人。駕培機器人包含了高精度GPS導航技術、慣性技術和虛擬傳感技術、視頻檢測、數據處理、無線傳輸、指紋身份識別等高新技術,能夠記錄、判斷駕駛人操縱駕駛機動車的真實能力。
 
  同理,AI同傳也可以在各種場景里,去觀察、判斷考生的翻譯能力,以及考生對翻譯規則的熟悉、理解程度。這個系統可以減少考試員的勞動強度和人為因素,確保考試公平、公正,考核方法科學準確。
 
  簡單來講,我們的目標是通過智能機器,使考核自動化,選撥或者是訓練真正的人才,而并非取代人類的翻譯能力。更有意思的是,在考核過程中,AI又能不斷吸收新養分,增加口語類文本語料庫,何樂而不為呢?
 
  (原標題:AI同傳PK人類同傳,這或許是兩個職業)
我要評論
文明上網,理性發言。(您還可以輸入200個字符)

所有評論僅代表網友意見,與本站立場無關。

  • AI同傳成標配,NLP表現日漸成熟?

    人工智能大會作為AI領域的會議,選擇AI同傳本身就是一種價值背書,從一個AI關切者的角度展示AI同傳當下的技術水準,盡可能為大會創造價值。
    AI同傳
    2019-09-02 08:53:36
版權與免責聲明:

凡本站注明“來源:智能制造網”的所有作品,均為浙江興旺寶明通網絡有限公司-智能制造網合法擁有版權或有權使用的作品,未經本站授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:智能制造網”。違反上述聲明者,本站將追究其相關法律責任。

本站轉載并注明自其它來源(非智能制造網)的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點或和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。如其他媒體、平臺或個人從本站轉載時,必須保留本站注明的作品第一來源,并自負版權等法律責任。如擅自篡改為“稿件來源:智能制造網”,本站將依法追究責任。

鑒于本站稿件來源廣泛、數量較多,如涉及作品內容、版權等問題,請與本站聯系并提供相關證明材料:聯系電話:0571-89719789;郵箱:1271141964@qq.com。

不想錯過行業資訊?

訂閱 智能制造網APP

一鍵篩選來訂閱

信息更豐富

推薦產品/PRODUCT 更多
智造商城:

PLC工控機嵌入式系統工業以太網工業軟件金屬加工機械包裝機械工程機械倉儲物流環保設備化工設備分析儀器工業機器人3D打印設備生物識別傳感器電機電線電纜輸配電設備電子元器件更多

我要投稿
  • 投稿請發送郵件至:(郵件標題請備注“投稿”)1271141964.qq.com
  • 聯系電話0571-89719789
工業4.0時代智能制造領域“互聯網+”服務平臺
智能制造網APP

功能豐富 實時交流

智能制造網小程序

訂閱獲取更多服務

微信公眾號

關注我們

抖音

智能制造網

抖音號:gkzhan

打開抖音 搜索頁掃一掃

視頻號

智能制造網

公眾號:智能制造網

打開微信掃碼關注視頻號

快手

智能制造網

快手ID:gkzhan2006

打開快手 掃一掃關注
意見反饋
我要投稿
我知道了
主站蜘蛛池模板: 元谋县| 青冈县| 上蔡县| 本溪| 镶黄旗| 宽城| 昌宁县| 共和县| 安溪县| 喀什市| 孝义市| 安达市| 临泉县| 吴川市| 宜丰县| 杭锦后旗| 句容市| 高碑店市| 漾濞| 海南省| 四子王旗| 鹤山市| 晋中市| 西峡县| 金平| 樟树市| 潮州市| 西贡区| 长岛县| 峨眉山市| 东海县| 秦皇岛市| 师宗县| 米易县| 建阳市| 吴桥县| 延川县| 枣庄市| 邢台县| 绵竹市| 唐海县|