【ITBEAR】Google Research近日推出了一項(xiàng)革新的人工智能技術(shù)——InkSight系統(tǒng),該技術(shù)能夠直接識(shí)別并轉(zhuǎn)換手寫文字圖片中的信息,省去了傳統(tǒng)轉(zhuǎn)換方式中的中間環(huán)節(jié)。
與傳統(tǒng)的光學(xué)字符識(shí)別(OCR)技術(shù)相比,InkSight在處理模糊、低光照或背景復(fù)雜的手寫文本時(shí),展現(xiàn)出更高的識(shí)別準(zhǔn)確率。這一技術(shù)模仿了人類學(xué)習(xí)閱讀的過程,通過不斷重寫來深入“理解”文字的外觀和意義,從而提高了識(shí)別的精準(zhǔn)度。
實(shí)驗(yàn)結(jié)果顯示,人們?cè)陂喿x由InkSight生成的文本時(shí),識(shí)別準(zhǔn)確率高達(dá)87%,且其中三分之二的輸出與真實(shí)手寫難以區(qū)分。
這項(xiàng)技術(shù)對(duì)于那些喜歡手寫記錄的人來說,無疑是一大福音。今后,他們只需拍照上傳手寫筆記,即可輕松轉(zhuǎn)換為可搜索和編輯的數(shù)字文本。即便是字跡難以辨認(rèn)的潦草手寫,InkSight也能精準(zhǔn)轉(zhuǎn)換,生成清晰、準(zhǔn)確的文本。
InkSight技術(shù)在文化遺產(chǎn)保護(hù)領(lǐng)域也大有可為。它能夠?qū)⒄滟F的手寫文獻(xiàn)數(shù)字化,為歷史研究提供便利,同時(shí)也有助于保護(hù)和傳承那些數(shù)字化程度較低的語言和文化。
谷歌并非手寫識(shí)別AI領(lǐng)域的唯一探索者。亞馬遜的Kindle Scribe以及Goodnotes等應(yīng)用也在該領(lǐng)域取得了顯著進(jìn)展,共同推動(dòng)著手寫識(shí)別技術(shù)的發(fā)展。