功能介紹
-
模型管理
支持展示所有模型列表,提供新建模型功能,可對模型進行導入導出操作,且每個模型可顯示模板ID、模板名稱、訓練時間等模型詳情
-
模型訓練
自動/手動框選圖片中文字及位置固定的內容,對模板圖像進行自動分析,快速設定參考區和識別區,可對每個模型進行編輯、測試、發布、刪除等操作,幾分鐘即可完成,正式發布后即可調用該模板
-
模型標注
自動進行全版面的分析與識別,訓練時可以基于此結果標注參考區和識別區,可對模板圖像進行旋轉、放大、縮小、移動等操作
-
無框線/有框線明細表自動分析
可對無框線/有框線列表明細區域進行自動列分析,支持對自動分析的明細列進行增加、刪除和修改,識別率高
-
平臺內置豐富的識別核心
支持識別中文簡體、手寫、中文繁體、印刷混排樣本、英文和數字,識別率高,用戶可自行設置識別字段
-
自定義分類器
針對需要分類的企業格式文檔,每類上傳30張訓練圖片即可創建分類器,實現對不同版式圖片的自動分類
-
輸出結構化數據
返回各類表單/卡證的JSON、XML結構化數據,方便編輯,實現電子和紙質文件信息即時同步
-
高級設置
可對每個識別區進行更多高級設置,包括行數限制、字符集限制、正則表達式限制,以提升識別率
-
關鍵字段信息智能抽取
表單識別AI訓練平臺,支持在多行內容中抽取固定行或固定同一字段信息
-
字符替換
表單識別AI訓練平臺,內置正則表達式,可對易出錯文本進行校對并替換
-
復雜不規則樣本模型訓練
支持對復雜不規則樣本模型(例如:藥瓶瓶身說明書)進行識別訓練
產品優勢
智能濾色
- 可智能過濾樣本中的紅藍色,提升識別率
內嵌多種成熟模型可直接調用
- 內嵌傳統證卡、票據等成熟模型,可直接選擇使用,識別率高
靈活編輯、修改
- 如多次測試效果滿意即可進行發布,如效果不滿意可返回繼續編輯
深度學習算法技術
- 傾斜、旋轉、拍照畸變、背景、證件不全等復雜樣本均可識別
支持識別多種文件格式圖片
- 支持JPEG、PNG、PDF等多種文件格式上傳,可支持拍照、掃描、打印、網銀等多種獲取形式的表單識別
私有化部署
- 支持私有化部署,部署至用戶本地服務器,保障數據性
應用場景
- 銀行票據識別
- 企業經營分析
- 醫療票據識別
- 卡證、文件電子化
-
銀行票據識別
、信貸審批、后督等各類業務審批過程中,工作人員需要審查多種材料,時間跨度大、電子與紙質數據共通難,人工審閱、審批效率低。應用OCR訓練平臺,對業務憑證、申請書、回單、對賬單、匯票、銀行流水等常用銀行票據進行模板制作,實現自動分類和結構化識別,可應用于、信貸、后督等場景,實現自動化信息提取,并智能錄入到業務系統中,有效降低人力成本,控制業務風險。
-
企業經營分析
銀行流水單是了解企業運營情況的重要依據,通過OCR訓練平臺,可實現多種版式銀行流水信息的智能提取,輔助用戶審核賬戶流水時段是否完整,便于分析、核查企業是否存在流水造假、虛構利潤等情況,解決流水賬戶眾多、版式難統一、數據獲取難等問題。
-
醫療票據識別
應用OCR訓練平臺對檢驗報告單、門診收費票據、住院收費票據等常用醫療票據進行模板制作,實現自動分類和結構化識別,可應用于醫療數據分析、醫藥費用報銷、醫療票據電子化等場景,實現相關票據信息的自動識別和錄入,有效降低人力成本,大幅度提升醫療信息化程度。
-
卡證、文件電子化
應用OCR訓練平臺對版式不統一的選票卡、準考證等各類卡證、文件進行結構化識別,實現各類卡證和文件的電子化管理,可應用于紙質文件分類歸檔、信息統計分析、關鍵內容提取等場景,有效降低人工錄入成本,大幅度提升信息管理效率。