“叫什么概念并不重要,關鍵還是要為技術找對應用場景,真正讓技術落地,創造價值。”達觀數據創始人兼CEO陳運文在談及愈發火熱的“AI+RPA”時如此說道。
這家成立于2015年,來自上海的創業公司剛剛獲得2.7億元B+輪融資,這已是其成立四年來的第四輪融資。在達觀數據的背后,不乏真格基金、深創投、軟銀賽富等頭部投資機構的身影。
據陳運文介紹,達觀數據是一家專注于文本智能處理技術的國家高新技術企業。其利用NLP(自然語言處理)、OCR(光學字符識別)、知識圖譜等技術,為大型企業和政府機構提供機器人流程自動化、文檔智能審閱、垂直搜索、智能推薦、客戶意見洞察等智能產品,旨在讓計算機協助人工完成業務流程自動化,大幅度提高企業效率。
在陳運文看來,所謂智能,就是從數據中提煉出信息,再從信息里進一步提煉出知識,終利用知識去模仿人類工作的過程,“人工智能很難一蹴而就,還是要扎扎實實從數據出發,不斷提煉加工,耐心訓練神經網絡系統,才能一點一點的突破現有的技術瓶頸。”
文本處理行業“老兵”,
判斷未來企業一半員工將是機器人
翻看陳運文的履歷可以發現,他從在復旦大學攻讀計算機博士開始,就一直扎根于文本數據處理行業,包括在百度、盛大文學、騰訊文學等巨頭公司任職時都從事著與文本數據挖掘相關的工作。
“在盛大文學工作時,一開始文字錄入和圖書推薦都是手工完成,后來隨著數據量暴增,每天處理數據超過1億字,開始使用數據機器清洗、審核、分類各類文本自動化功能,通過文本挖掘技術提升人工效率。陳運文說道。
可以說,這是一位文本數據行業的“老兵”。
2015年選擇創業的陳運文,依然把目光瞄向了文本智能處理賽道。“當時看到大量傳統企業面臨數字化轉型升級,但恰恰這些行業缺乏智能化改造的能力,因此覺得可以在這個行業有所作為。”
陳運文表示,雖然彼時的互聯網公司已經開始運用大量的文本處理技術,但傳統行業還是相對落后。
“新商業時代下,數據類型和數據量都在激增,傳統行業企業的計算能力、數據自動化處理能力此時就顯得捉襟見肘。依然需要不少職員長期去做重復性的文字資料處理工作,比如填表、核對、找錯別字、上傳下載等,效率十分低下。”
另一方面,盡管傳統行業企業一般都有內部獨立的信息化系統,例如辦公 OA、ERP、財務管理系統、CRM、銷售管理系統等,但因為多種原因,這些系統之間的數據無法打通,導致形成信息孤島效應。
而對于潛在的市場空間,陳運文也有著自己的判斷,他認為未來10年里,如果有50%的基層工作將由機器人完成,文本智能化處理領域將有5000億元人民幣的市場規模,這也堅定了他加入賽道的信心。
“我知道這件事情很難,但是我覺得特別有意思,我們面臨著很多的技術挑戰,有很多的工作要做,有困難才有動力。”陳運文笑著說道。
而對于達觀數據,陳運文給出的定位是“文本智能處理專家”,根本目的是幫助傳統行業企業提升智能化能力,實現降本增效。
“在這其中主要有三個關鍵詞,一是文本,代表達觀數據是圍繞文本處理展開的;二是智能,可以讓計算機、RPA機器人能夠自動化的進行文檔資料的上傳下載、閱讀審核、信息填寫等智能化操作;三是處理,我們希望能夠更多地把文本智能系統嵌入到客戶的日常辦公流程當中去,幫助他們處理工作。”
自研底層開發框架,
“以機代人”提高數倍工作效率
據了解,從2015年開始,達觀數據就一直專注于自然語言處理(NLP)、光學字符識別(OCR)、知識圖譜等AI技術,提供文檔審閱、智能推薦、資料搜索、知識圖譜等多款文本自動化解決方案。并在2019年正式推出“達觀智能RPA”,融合自研語義理解模塊,打造了首款國產自研“NLP+OCR+RPA” 三位一體的智能化機器人。
據陳運文介紹,圍繞文本處理場景下的“數據+AI能力”,達觀數據目前構建了較為完整的文本數據采集、標注、訓練體系。在數據知識層構建知識倉庫和知識圖譜;在數據應用層訓練機器學習模型并結合業務場景來開發出一系列智能機器人產品。
“我們揭開的不過是企業文本大數據的冰山一角。”陳運文認為企業的需求是一片藍海,達觀處理的文檔數據中蘊含著諸多規律,而這些規律同樣需要依靠計算機識別,形成“系統知識”運用到企業的服務中去。“我們希望能夠努力滿足各行各業的企業的需求,幫助他們解決數據挖掘問題。”
據悉,達觀數據已經圍繞銀行、證券、保險、財稅、政務、能源、物流、地產等行業構建了解決方案,合伙客戶數百家,包括中國銀聯、深交所、人民網、萬科等頭部企業。
陳運文表示,以RPA機器人代替人工操作,可以實現節省成本、提高效率和準確率等諸多優勢,這些都是經過實際測算得出的結論。首先,機器人系統的采購成本大概是普通白領工資待遇的1/4,但工作效率是普通白領的3-4倍。
“我們有一家電力企業客戶,該公司財務部在對賬過程中涉及多家銀行,上千筆的對賬業務量,數據量很大。在使用達觀RPA機器人代替傳統手工操作后,財務對賬效率提升了600%。”
其次,機器人的犯錯率與人工相比會低出很多。“人在連續長時間工作后,錯誤率容易上升。但機器人可以在非常穩定的狀態下進行7×24小時工作,機器人系統內部的交叉核驗,也可以保證準確率維持在較高水準。”
陳運文介紹,與同業相比,達觀RPA產品的核心優勢是市場上不采用微軟底層開發框架,完全獨立自主研發的機器人。
“比起借用國外現成框架,雖然研發的過程代價更高更困難,但是回頭來看是非常值得的,因為掌握了從底層向上的所有核心技術,軟件的跨平臺適應能力更強,能在國內外各種操作系統上運行。”
RPA成為吸金賽道,
疫情加速企業數字化進程
據IDC預計,到2023年,RPA軟件市場規模將達到39億美元,2018-2023年復合增長率達36%。中國RPA市場也將高速發展,2023年市場規模將達到10.2億美元,2018-2023年復合增長率為64%。
而此次新冠病毒肺炎疫情更是加速了無人辦公、數字化建設進程,讓RPA變得愈加炙手可熱。根據Forrester針對企業的調研顯示,2019年末,RPA技術在所有企業自動化系統部署中排名低;而到2020年,RPA技術的排名則上升到了第一位。
廣闊的市場空間也吸引了眾多玩家入局,一時間,RPA成為創投圈吸金的賽道。
日前,互聯網巨頭微軟剛剛宣布收購一家美國RPA初創公司,另據投資界(ID:pedaily2012)不完全統計,國內RPA市場在今年以來,包括達觀數據在內已有5筆融資事件發生,融資總額近8億元。諸如紅杉資本中國、光速中國、深創投等頭部投資機構均有所布局。
作為達觀數據B+輪融資的領投方,深創投董事長倪澤望表示:“智能化文本處理和RPA等前沿創新技術,是深創投特別看好的應用方向,達觀數據是其中極為優秀的企業,我們非常欣賞團隊扎實的作風和過硬的技術,并全力支持達觀進一步向前發展。”
軟銀賽富管理合伙人閻焱也表示:“無論是從產品先進性,還是應用落地能力上,達觀都處在行業地位。我們看好文本自動化的發展,也相信在陳博士的帶領下達觀將在這個領域做出了不起的成就。”
談及今年年初爆發的新冠病毒肺炎疫情,陳運文表示,雖然對眾多企業的正常經營都造成了一定影響,但這次危機同樣也是RPA賽道的加速器。
“此次疫情讓眾多企業對數字化和自動化的需求再次升溫,意識到了RPA機器人的重要性,相當于間接的教育了市場。往常,客戶認為使用達觀的產品是‘錦上添花’,但現在他們會覺得這是‘雪中送炭’。”陳運文說道。
對于接下來的發展規劃,陳運文表示達觀數據的目標一直都很明確,即成為國內文本智能處理行業第一,因此會在產品研發、交付質量、技術深度等方面持續投入,打造出更高品質的產品與豐富的場景來服務客戶。
“文本智能處理是一條困難但正確的道路,正所謂‘板凳要坐十年冷,文章不寫半句空’,低調務實是我們團隊一直堅持的做事風格,達觀也將沉下心來認認真真把產品做好,沿著這條賽道堅持下去。”陳運文后說道。