ITBear旗下自媒體矩陣:

谷歌新AI技術(shù)InkSight:超越OCR,精準(zhǔn)識(shí)別手寫文字

   時(shí)間:2024-11-05 19:12:54 來源:ITBEAR作者:楊凌霄編輯:瑞雪 發(fā)表評(píng)論無障礙通道

【ITBEAR】Google Research近日推出了一項(xiàng)革新的人工智能技術(shù)——InkSight系統(tǒng),該技術(shù)能夠直接識(shí)別并轉(zhuǎn)換手寫文字圖片中的信息,省去了傳統(tǒng)轉(zhuǎn)換方式中的中間環(huán)節(jié)。

與傳統(tǒng)的光學(xué)字符識(shí)別(OCR)技術(shù)相比,InkSight在處理模糊、低光照或背景復(fù)雜的手寫文本時(shí),展現(xiàn)出更高的識(shí)別準(zhǔn)確率。這一技術(shù)模仿了人類學(xué)習(xí)閱讀的過程,通過不斷重寫來深入“理解”文字的外觀和意義,從而提高了識(shí)別的精準(zhǔn)度。

實(shí)驗(yàn)結(jié)果顯示,人們?cè)陂喿x由InkSight生成的文本時(shí),識(shí)別準(zhǔn)確率高達(dá)87%,且其中三分之二的輸出與真實(shí)手寫難以區(qū)分。

這項(xiàng)技術(shù)對(duì)于那些喜歡手寫記錄的人來說,無疑是一大福音。今后,他們只需拍照上傳手寫筆記,即可輕松轉(zhuǎn)換為可搜索和編輯的數(shù)字文本。即便是字跡難以辨認(rèn)的潦草手寫,InkSight也能精準(zhǔn)轉(zhuǎn)換,生成清晰、準(zhǔn)確的文本。

InkSight技術(shù)在文化遺產(chǎn)保護(hù)領(lǐng)域也大有可為。它能夠?qū)⒄滟F的手寫文獻(xiàn)數(shù)字化,為歷史研究提供便利,同時(shí)也有助于保護(hù)和傳承那些數(shù)字化程度較低的語言和文化。

谷歌并非手寫識(shí)別AI領(lǐng)域的唯一探索者。亞馬遜的Kindle Scribe以及Goodnotes等應(yīng)用也在該領(lǐng)域取得了顯著進(jìn)展,共同推動(dòng)著手寫識(shí)別技術(shù)的發(fā)展。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動(dòng)資訊  |  爭(zhēng)議稿件處理  |  English Version