功能介紹
-
1:1還原重構(gòu)表格
支持自動識別分析表格,并1:1還原重構(gòu)表格,確保數(shù)據(jù)完整性
-
識別多種版面報刊
可以識別不同版式的報刊內(nèi)容,精確重現(xiàn)原始布局
-
支持多種采集方式
通過手機、平板電腦、高拍儀、掃描儀、數(shù)碼相機等途徑獲取的圖像均可識別
-
可識別多門語種,字符集廣
支持識別印刷簡體、手寫簡體、印刷繁體、手寫繁體、生僻字、手寫體和印刷體混合文本及通用英文
-
支持識別、導(dǎo)出多種格式圖像/文件
支持識別BMP、JPG、JPEG、PNG、PDF等主流圖片格式;導(dǎo)出JSON、TXT、雙層PDF等多種格式文件
-
自動旋正圖片
TH-OCR文字識別支持45°、90°、180°、270°等多角度圖片旋正
-
可與多種系統(tǒng)集成應(yīng)用
提供標準的API接口,實現(xiàn)與檔案、OA、ERP等應(yīng)用系統(tǒng)快速集成
-
多種部署方式
既支持B/S端服務(wù)部署,也支持PC端SDK集成部署
-
支持CPU和GPU硬件配置部署
同樣識別性能情況下,支持CPU和GPU硬件配置部署,節(jié)約硬件投入成本
產(chǎn)品優(yōu)勢
國家科技進步二等獎
- TH-OCR技術(shù)榮獲國家科技進步二等獎、科技進步一等獎等多個獎項
拓展應(yīng)用
- 支持與AI掃描儀等硬件產(chǎn)品拓展應(yīng)用,實現(xiàn)大量數(shù)據(jù)檔案的管理與數(shù)字化
自動校正
- 支持對圖像由于掃描引起的傾斜進行自動校正
支持版面分析、版面還原
- 支持對圖像進行自動版面分析,根據(jù)分析結(jié)果 1:1還原版面格式及信息
智能識別
- 在線可識別字在原文中的位置和大小,可識別多頁PDF文件
支持識別生僻字
- TH-OCR文字識別可高精度識別多種生僻字
可擦除下劃線、濾色后識別
- 可過濾圖片上的紅色或粉色等干擾背景
保證數(shù)據(jù)安全
- 企業(yè)內(nèi)網(wǎng)部署,滿足用戶數(shù)據(jù)安全的需求
秒級識別、識別率高
- 識別速度快,識別速度在1秒以內(nèi),識別準確率高達99%以上
應(yīng)用范圍廣
- 可廣泛應(yīng)用于檔案系統(tǒng)、大模型、RPA等多領(lǐng)域
應(yīng)用場景
- 電子檔案安全管理系統(tǒng)
- 系統(tǒng)辦公軟件
- 檔案數(shù)字化加工
- 智能硬件
- 合同管理
- 大模型
-
電子檔案安全管理系統(tǒng)
將文通科技OCR文字識別系統(tǒng)應(yīng)用于計算機終端保密檢查系統(tǒng)、電子文檔安全管理系統(tǒng)、郵件防控管理系統(tǒng)、電子檔案安全管理等系統(tǒng),超高識別率為數(shù)據(jù)安全和風(fēng)險防范提供高效技術(shù)支持。
-
系統(tǒng)辦公軟件
將文通科技TH-OCR文字識別SDK嵌入到RPA等辦公軟件中,可應(yīng)用于金融、醫(yī)療保健、企業(yè)、政府、招標機構(gòu)等各領(lǐng)域,為終端客戶提供各類文檔或者內(nèi)部資料的文字提取功能,操作便捷,提升整體的工作效率、節(jié)約人力成本。
-
檔案數(shù)字化加工
將文通科技OCR文字識別系統(tǒng)應(yīng)用于大量數(shù)據(jù)檔案的管理與數(shù)字化場景,通過掃描企業(yè)紙質(zhì)檔案,可導(dǎo)出雙層PDF、TXT、WORD、XML、XLS等格式文件,方便企業(yè)編輯、查找檔案信息,應(yīng)用于圖書館數(shù)字化項目、歷史檔案數(shù)字化、軍政檔案管理、軍政檔案管理等項目,實現(xiàn)檔案數(shù)字化管理,提升效率和智能化水平。
-
智能硬件
將文通科技文字識別SDK嵌入到多功能一體機、掃描儀或其他智能硬件中,在進行文檔錄入的工作時,可快速識別和提取文字,實現(xiàn)企業(yè)信息數(shù)字化管理。
-
合同管理
合同比對基于文通科技TH-OCR文字識別,自動抽取合同文本中的關(guān)鍵信息,可識別字在原文中的位置和大小,將圖像識別輸出為可編輯的文件格式,進行存儲,實現(xiàn)計算機替代人工審核比對,解決合同管理工作中人工審核時間成本高、人力成本高的難題。
-
大模型
文通科技OCR識別技術(shù)與大模型相結(jié)合,通過對文檔整體內(nèi)容和結(jié)構(gòu)的理解,能夠更準確地識別和分類信息,從而顯著提升文檔檢索和管理的效率。例如,深度學(xué)習(xí)模型可以理解復(fù)雜的文檔版面,自動提取關(guān)鍵信息,處理各種文字和排版風(fēng)格,確保轉(zhuǎn)換后的電子文本質(zhì)量和可編輯性,極大地減少了人工操作的時間和成本。