ITBear旗下自媒體矩陣:

百度智能云TechDay業(yè)界首發(fā)EasyDL OCR,定制化、自動化產(chǎn)品特性掀起效能風暴

   時間:2020-11-02 10:04:13 來源:互聯(lián)網(wǎng)編輯:星輝 發(fā)表評論無障礙通道

OCR(文字識別)技術是最早應用于企業(yè)降本增效的 AI 方向之一,如今已逐漸下沉為企業(yè)智能化升級的一項重要基礎設施能力。10月29日,百度智能云線上線下同期舉辦了TechDay OCR技術創(chuàng)新沙龍,深度分享OCR產(chǎn)品矩陣、功能、應用案例等最新進展,并重磅全新發(fā)布EasyDL OCR自訓練平臺。泰康保險集團、北京融匯金信等企業(yè)伙伴在現(xiàn)場分享了OCR在企業(yè)內的應用經(jīng)驗和心得。百度智能云OCR產(chǎn)品為企業(yè)打造了技術領先、類型豐富同時支持便捷自定制的解決方案,已廣泛應用于金融服務、財稅報銷、快遞物流、法律政務、交通出行、教育培訓、內容審核等全行業(yè)領域,加快推動企業(yè)實現(xiàn)產(chǎn)業(yè)智能化升級。

業(yè)界首發(fā)EasyDL OCR自訓練平臺,低成本滿足OCR定制化需求

近年來,OCR的識別能力不斷突破,逐漸在更加復雜的數(shù)字化場景發(fā)揮作用,有效降低信息提取和錄入的人力成本,幫助企業(yè)專注于上層業(yè)務應用。與此同時,企業(yè)對于OCR識別模型定制化的需求日益旺盛,包括OCR在特定場景下是否有高精度識別效果、能否高效響應自身業(yè)務需求、是否能在模型訓練過程中保證數(shù)據(jù)安全,以上三點成為行業(yè)共性訴求。

為滿足企業(yè)快速定制OCR識別模型的訴求,EasyDL OCR自訓練平臺應運而生。據(jù)介紹,EasyDL OCR 自訓練平臺具有兩大核心產(chǎn)品功能,即自動訓練OCR和定制化訓練OCR;同時具備三大產(chǎn)品特性,包括內置成熟OCR技術方案,預置經(jīng)過真實業(yè)務檢驗的多種自動化機制,如智能標注、自動數(shù)據(jù)預處理、虛擬數(shù)據(jù)生成等,同時還開放了調參能力,滿足多種場景OCR模型定制訓練需求,保證高準確率;可視化模型訓練,預置領先的OCR算法,可實現(xiàn)零門檻模型訓練,高效響應業(yè)務需求;支持本地私有化部署,數(shù)據(jù)無需出廠,有效保障數(shù)據(jù)安全。

會上,EasyDL OCR產(chǎn)品負責人還分別演示了自動化訓練OCR和定制化訓練OCR模型訓練過程,并在最后總結了適合應用的不同場景和優(yōu)勢。

具體而言,自動化訓練OCR每個版式僅需1張訓練圖片,“智能標注”功能支持快速標注關鍵字段,顯著提升標注效率,系統(tǒng)自動完成模板分類,可應用于版式多樣、識別特定字段、圖像質量統(tǒng)一的場景,同時模型重訓功能支持新增版式的快速擴充。定制化訓練OCR則具有數(shù)據(jù)自動生成能力,可模擬各類真實場景中復雜數(shù)據(jù)狀況,如模糊、變形、缺角等,少量標注數(shù)據(jù)即可獲得更高的識別準確率,可應用于版式固定、全字段識別、圖片質量復雜的場景。

百度OCR“技術+產(chǎn)品+應用”行業(yè)領先,助力企業(yè)智能化升級

百度OCR是國內應用最廣泛的文字識別服務,依托業(yè)界領先的深度學習技術和海量優(yōu)質數(shù)據(jù),提供多場景、多語種、高精度的文字檢測與識別服務,并針對圖片模糊、傾斜、翻轉等情況進行深度優(yōu)化,魯棒性強,多項ICDAR指標居世界第一,通用、主流卡證識別準確率高達99%。

而其背后正是由百度AI核心技術引擎——百度大腦支撐,如今升級到6.0的百度大腦已成為AI新型基礎設施。從基礎層的算力、數(shù)據(jù)、飛槳深度學習平臺,到感知層的語音、視覺、AR/VR,再到認知層的語言與知識,以及平臺層的AI平臺與生態(tài),百度大腦始終保持核心技術持續(xù)領先,不斷夯實“軟硬一體AI大生產(chǎn)平臺”,并通過百度智能云整合輸出產(chǎn)品服務,加速產(chǎn)業(yè)智能轉型升級。截至目前,百度大腦已經(jīng)開放了273項AI能力,凝聚超過230萬開發(fā)者,培養(yǎng)了超過100萬AI人才,在眾多行業(yè)領域落地應用,推動了中國AI技術研發(fā)、實踐應用與生態(tài)建設。

產(chǎn)業(yè)智能化升級一個核心前提就是,信息數(shù)字化和結構化。OCR作為最早應用于企業(yè)效率提升的AI方向之一,顯著提升了信息提取和錄入的效率,實現(xiàn)了信息處理的“電子化”、“自動化”,為上層業(yè)務應用提供有力支撐。

據(jù)現(xiàn)場介紹,百度OCR技術經(jīng)過多年沉淀和實踐打磨,在多項行業(yè)競賽評比當中持續(xù)摘得桂冠。例如:2019年從90多支參賽隊伍中脫穎而出,獲得中國最高等級商業(yè)領域人工智能技術競賽唯一A級別證書;在OCR領域最具影響力的ICDAR 19 MLT (多語種task)榜單當中獲得文字檢測領域世界冠軍;。同時,百度OCR也在不斷推進算法創(chuàng)新和突破,引領行業(yè)技術發(fā)展,例如:發(fā)布了業(yè)界最大的中文OCR數(shù)據(jù)集,首次提出端到端OCR-部分監(jiān)督算法End2End-PSL,實現(xiàn)精標數(shù)據(jù)+弱標數(shù)據(jù)的混合訓練,克服精標數(shù)據(jù)成本高問題,使得標注成本降低至1/90。

依托百度大腦領先的深度學習技術,百度OCR已開放全系列50多款產(chǎn)品,不僅可以實現(xiàn)通用場景的文字識別,還可滿足各類垂直場景的信息電子化、結構化識別需求,例如財務票據(jù)識別、醫(yī)療票據(jù)識別、教育場景的公式識別和試卷識別等等。

打破封閉研發(fā)生態(tài),積極賦能企業(yè)在具體場景落地

作為保險醫(yī)療領域的代表,泰康保險集團科技研究院、圖文分析實驗室負責人劉興旺在會上表示:“如何提高理賠效率,降低成本成為各大保險公司非常關注的一點?;诎俣萇CR識別提取各類醫(yī)療票據(jù)/單據(jù)字段信息的技術能力,我們共同首創(chuàng)的端到端關系識別模型,整個質檢分類準確率可達到97%,實際復雜生產(chǎn)環(huán)境中的結構化識別準確率可達86%,大大節(jié)約了人力成本,同時顯著提升了理賠業(yè)務效率。”

北京融匯金信信息技術有限公司創(chuàng)始人羅彤從金融服務的角度發(fā)表了自己的看法,他講到:“金融主要做的兩件事其實就是,需要大量數(shù)據(jù)進行預測,以及大量文檔、圖片等信息進行客戶服務。而百度OCR提供的解決方案,可以讓我們把數(shù)據(jù)和知識打通,解決人工錄入信息出錯率高、效率低等行業(yè)痛點的同時,能夠顯著節(jié)約成本、得到更加精準的預測結果,同時提升整體業(yè)務效率。”據(jù)悉,在金融服務領域,百度OCR已在銀行、保險、證券、信貸、支付等場景應用落地。

除此之外,百度OCR還已廣泛應用于財稅報銷、快遞物流、法律政務、交通出行、教育培訓、內容審核等眾多領域,為企業(yè)降本增效,提升用戶體驗。例如:代賬公司借助百度OCR,為中小企業(yè)提供智能報賬服務,大幅提升業(yè)務流程效率;中國移動設計院使用百度OCR對內部報賬系統(tǒng)進行智能化改造,20分鐘的人工填報流程縮短至1分多鐘;在快遞物流領域,則可以綜合應用OCR、NLP地址識別、語音識別等多項AI能力,提升分揀、配送效率及用戶使用體驗。

目前,使用百度OCR的用戶已超過70萬。未來,百度OCR作為百度智能云服務的重要一環(huán),在百度大腦領先技術的支持下,將持續(xù)快速迭代,不斷優(yōu)化產(chǎn)品服務,探索更多應用場景,同時賦能更多合作伙伴,助力企業(yè)開啟智能化升級快速通道,創(chuàng)造更大價值。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內容
網(wǎng)站首頁  |  關于我們  |  聯(lián)系方式  |  版權聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報  |  開放轉載  |  滾動資訊  |  English Version