ITBear旗下自媒體矩陣:

谷歌新AI技術(shù)InkSight:超越OCR,精準(zhǔn)識(shí)別手寫(xiě)文字

   時(shí)間:2024-11-05 19:12:54 來(lái)源:ITBEAR編輯:快訊團(tuán)隊(duì) 發(fā)表評(píng)論無(wú)障礙通道

【ITBEAR】Google Research近日推出了一項(xiàng)革新的人工智能技術(shù)——InkSight系統(tǒng),該技術(shù)能夠直接識(shí)別并轉(zhuǎn)換手寫(xiě)文字圖片中的信息,省去了傳統(tǒng)轉(zhuǎn)換方式中的中間環(huán)節(jié)。

與傳統(tǒng)的光學(xué)字符識(shí)別(OCR)技術(shù)相比,InkSight在處理模糊、低光照或背景復(fù)雜的手寫(xiě)文本時(shí),展現(xiàn)出更高的識(shí)別準(zhǔn)確率。這一技術(shù)模仿了人類學(xué)習(xí)閱讀的過(guò)程,通過(guò)不斷重寫(xiě)來(lái)深入“理解”文字的外觀和意義,從而提高了識(shí)別的精準(zhǔn)度。

實(shí)驗(yàn)結(jié)果顯示,人們?cè)陂喿x由InkSight生成的文本時(shí),識(shí)別準(zhǔn)確率高達(dá)87%,且其中三分之二的輸出與真實(shí)手寫(xiě)難以區(qū)分。

這項(xiàng)技術(shù)對(duì)于那些喜歡手寫(xiě)記錄的人來(lái)說(shuō),無(wú)疑是一大福音。今后,他們只需拍照上傳手寫(xiě)筆記,即可輕松轉(zhuǎn)換為可搜索和編輯的數(shù)字文本。即便是字跡難以辨認(rèn)的潦草手寫(xiě),InkSight也能精準(zhǔn)轉(zhuǎn)換,生成清晰、準(zhǔn)確的文本。

InkSight技術(shù)在文化遺產(chǎn)保護(hù)領(lǐng)域也大有可為。它能夠?qū)⒄滟F的手寫(xiě)文獻(xiàn)數(shù)字化,為歷史研究提供便利,同時(shí)也有助于保護(hù)和傳承那些數(shù)字化程度較低的語(yǔ)言和文化。

谷歌并非手寫(xiě)識(shí)別AI領(lǐng)域的唯一探索者。亞馬遜的Kindle Scribe以及Goodnotes等應(yīng)用也在該領(lǐng)域取得了顯著進(jìn)展,共同推動(dòng)著手寫(xiě)識(shí)別技術(shù)的發(fā)展。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開(kāi)放轉(zhuǎn)載  |  滾動(dòng)資訊  |  爭(zhēng)議稿件處理  |  English Version