ITBear旗下自媒體矩陣:

百度大腦OCR技術(shù)加持白描App:讓AI成為視障者的眼睛

   時(shí)間:2021-08-27 14:13:32 來(lái)源:互聯(lián)網(wǎng)編輯:星輝 發(fā)表評(píng)論無(wú)障礙通道

現(xiàn)實(shí)中,你可以輕松無(wú)障礙的閱讀各類(lèi)平面印刷文字以及身邊的一切,或許你未曾想過(guò),視障人群該怎么辦呢?

統(tǒng)計(jì)數(shù)據(jù)顯示,中國(guó)大約有1700萬(wàn)的視障群體,相當(dāng)于每100個(gè)人中就有超過(guò)1位是視障人士。但我們?cè)谌粘I钪袇s很少見(jiàn)到他們,那是因?yàn)橐曊先后w在日常生活中會(huì)有諸多不便,出門(mén)對(duì)他們而言危機(jī)四伏。AI有可能成為他們的“眼睛”嗎?

成為他們的眼睛:白描App與視障群體的故事

如果手機(jī)上只能有一款A(yù)pp,你會(huì)選擇哪一款?視障人士安之堅(jiān)定地給出了答案——白描。因?yàn)榘酌鐰pp讓視力不佳的他用另一種方式“看”清世界,文字不再遙不可及。他用白描“看”過(guò)優(yōu)美的詩(shī)篇,“聽(tīng)”過(guò)動(dòng)人的樂(lè)章,甚至在獨(dú)自上樓看不清所在樓層時(shí),白描也準(zhǔn)確地將答案告訴了他,將他從窘境中解救出來(lái)。一個(gè)App讓曾經(jīng)望“字”興嘆的他更加勇敢的走出家門(mén),參與豐富多彩的生活。

“白描是我的眼。”同為視障人士的小杰從不吝嗇對(duì)白描的夸贊,甚至直言白描是視障伙伴賴以生存的工具。白描幫助他解決了生活的難題,從各類(lèi)電器、數(shù)碼產(chǎn)品、藥品說(shuō)明書(shū)到各種洗漱用品包裝都可以識(shí)別,他還可以給可愛(ài)的小侄女講繪本故事。如果沒(méi)有白描,這種事情是他難以想象的。

白描是如何做到被視障群體視若珍寶的呢?白描App是一款簡(jiǎn)潔高效的OCR文字識(shí)別軟件,不僅簡(jiǎn)單好用,而且設(shè)計(jì)美觀,可以輕松實(shí)現(xiàn)“拍照-識(shí)別文字-朗讀結(jié)果”一系列流程。同時(shí),白描適配了手機(jī)無(wú)障礙輔助功能,視障者可以在手機(jī)上非常輕松地操作。

“白描”這個(gè)詞本意是一種文學(xué)寫(xiě)作手法,魯迅先生曾把這種手法概括成十二個(gè)字,即“有真意,去粉飾,少做作,勿賣(mài)弄”。白描App的開(kāi)發(fā)者陶新樂(lè)正是這樣的一個(gè)人,他觀察到了不同人群的實(shí)際需求,用虛擬世界的代碼滿足了現(xiàn)實(shí)世界有需求的人,讓他們的生活變得更加美好、便捷。

白描App開(kāi)發(fā)者的心路歷程:切入不同場(chǎng)景、優(yōu)化產(chǎn)品細(xì)節(jié)

你或許很難想象,作為一名個(gè)人開(kāi)發(fā)者的陶新樂(lè),他最早開(kāi)發(fā)白描App是為了女朋友。陶新樂(lè)的女友熱愛(ài)閱讀,經(jīng)常做讀書(shū)筆記。為了減輕抄錄壓力,她嘗試使用了當(dāng)時(shí)市面上的各類(lèi)文字識(shí)別軟件,但她發(fā)現(xiàn):有的軟件操作流程繁瑣,有的費(fèi)用高昂,有的則識(shí)別不準(zhǔn)確……看到女朋友痛苦不已,陶新樂(lè)當(dāng)下決定親自做個(gè)體驗(yàn)好、效果佳的OCR文字識(shí)別工具給女朋友使用,并且很快付諸了行動(dòng)。這或許就是開(kāi)發(fā)者獨(dú)有的浪漫。

然而,一款A(yù)pp的開(kāi)發(fā)過(guò)程是充滿未知與挑戰(zhàn)的。在當(dāng)時(shí)的條件下,開(kāi)發(fā)一款具有OCR功能的軟件,面臨的一個(gè)巨大挑戰(zhàn)是:如何讓文字識(shí)別的又快又準(zhǔn)。因此,他調(diào)研了市面上提供此服務(wù)的廠商,并對(duì)不同廠商的產(chǎn)品進(jìn)行了對(duì)比,嘗試識(shí)別不同場(chǎng)景的圖片,找出識(shí)別效果最好的那個(gè)。于是他發(fā)現(xiàn),百度大腦AI開(kāi)放平臺(tái)的OCR技術(shù)能力和使用體驗(yàn)都是最好的,尤其是識(shí)別準(zhǔn)確度更領(lǐng)先于其他廠商,所以在2017年他就毫不猶豫的選擇了百度OCR技術(shù),并一直使用至今。

但是優(yōu)秀的底層技術(shù)并不意味著全部,百度大腦OCR已提供近60項(xiàng)技術(shù)能力,好的技術(shù)也需要應(yīng)用于匹配的場(chǎng)景才能發(fā)揮更大的價(jià)值。

于是,陶新樂(lè)首先對(duì)白描的使用場(chǎng)景做了細(xì)分研究,比如:學(xué)生上課拍PPT提取文字記筆記、企業(yè)員工把紙質(zhì)合同掃描成電子版并且制作PDF、把紙質(zhì)表格轉(zhuǎn)成Excel電子版、翻譯圖片上的文字、老師拍攝并識(shí)別試題后對(duì)試題再加工、律師用來(lái)提取紙質(zhì)文書(shū)上的文字等等。特別的是,視障人群特殊的使用需求,他都有關(guān)注和調(diào)研。

考慮完用戶的使用場(chǎng)景之后,再者就是對(duì)產(chǎn)品的不斷打磨。當(dāng)時(shí),圖片轉(zhuǎn)文字常常會(huì)有識(shí)別錯(cuò)誤的情況發(fā)生,為了彌補(bǔ)這一問(wèn)題,在識(shí)別之前,白描APP會(huì)進(jìn)行一些技術(shù)上的處理,比如圖像壓縮如何保證清晰度又盡量減小圖片大小;如何在進(jìn)行長(zhǎng)圖自動(dòng)裁剪時(shí),檢測(cè)到長(zhǎng)圖的空行位置自動(dòng)裁剪,且不會(huì)裁到文字;如何針對(duì)文章進(jìn)行自動(dòng)分段,更便于讀者閱讀等等。這些精細(xì)化的產(chǎn)品設(shè)計(jì)保證了圖片的清晰度,讓文字信息更易于被識(shí)別。而在識(shí)別之后,白描的校對(duì)功能,可以讓識(shí)別結(jié)果與原圖顯示在同一界面上,方便用戶快速找到需要修改的地方,在此基礎(chǔ)上進(jìn)行編輯。

依托百度優(yōu)秀的深度學(xué)習(xí)算法和基于海量?jī)?yōu)質(zhì)數(shù)據(jù)的預(yù)訓(xùn)練模型,以及白描App的圖像預(yù)處理能力,最終實(shí)現(xiàn)了關(guān)鍵字段識(shí)別準(zhǔn)確率99%+。看到女友使用白描時(shí)綻放的笑顏,陶新樂(lè)覺(jué)得一切都是值得的,他也希望更多人能夠享受到這份快樂(lè)。

成功的背后:用“匠人”之心雕琢產(chǎn)品之光

程序員出身的陶新樂(lè)在做產(chǎn)品這件事上一直懷揣一顆“匠人”之心。陶新樂(lè)提到,AI在落地的過(guò)程中會(huì)遇到很多的困難,很多時(shí)候都是一邊踩坑一邊向前走。當(dāng)遇到無(wú)法解決的問(wèn)題時(shí),就需要不斷學(xué)習(xí),攻堅(jiān)克難。

百度大腦OCR技術(shù)與無(wú)數(shù)像陶新樂(lè)一樣的開(kāi)發(fā)者并肩同行。作為最早規(guī)?;瘧?yīng)用的AI技術(shù)之一,OCR技術(shù)的產(chǎn)業(yè)級(jí)應(yīng)用持續(xù)取得突破。百度大腦OCR技術(shù)可提供多場(chǎng)景、多語(yǔ)種、高精度的文字檢測(cè)與識(shí)別服務(wù),多項(xiàng)ICDAR指標(biāo)居世界第一,已廣泛適用于遠(yuǎn)程身份認(rèn)證、財(cái)稅報(bào)銷(xiāo)、文檔電子化等場(chǎng)景,為企業(yè)降本增效,為用戶帶來(lái)更智能化的應(yīng)用體驗(yàn)。

當(dāng)然,AI技術(shù)的應(yīng)用落地,除了需要有百度大腦這樣提供領(lǐng)先AI技術(shù)能力的平臺(tái)外,還需要更多像陶新樂(lè)這樣的開(kāi)發(fā)者們,發(fā)揮想象將AI應(yīng)用在更多真實(shí)場(chǎng)景中,滿足不同用戶群體,甚至是容易被忽視的殘障人群的需求,讓社會(huì)更有“AI”。同時(shí),為了降低獨(dú)立開(kāi)發(fā)者和企業(yè)自主訓(xùn)練OCR文字識(shí)別模型的門(mén)檻,百度大腦推出業(yè)界首個(gè)EasyDL OCR自訓(xùn)練平臺(tái),提供零門(mén)檻、定制化、低成本的一站式OCR模型訓(xùn)練服務(wù)。保證高準(zhǔn)確率的同時(shí),滿足多元化的場(chǎng)景需求,并有效保障數(shù)據(jù)安全。

在這個(gè)科技為大眾生活賦能的時(shí)代,產(chǎn)品的設(shè)計(jì)更是一種普惠理念的輸出。已擁有超過(guò)800萬(wàn)用戶的白描App,已經(jīng)成為業(yè)界的口碑產(chǎn)品。相信,未來(lái)還將有越來(lái)越多的開(kāi)發(fā)者通過(guò)百度大腦AI開(kāi)放平臺(tái)提供的AI技術(shù)與服務(wù),創(chuàng)造出更多與場(chǎng)景相結(jié)合的智能應(yīng)用,讓更多人生活更便捷、更美好。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類(lèi)資訊
全站最新
熱門(mén)內(nèi)容
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報(bào)  |  開(kāi)放轉(zhuǎn)載  |  滾動(dòng)資訊  |  English Version