ITBear旗下自媒體矩陣:

攜手央視上線虛擬主播“紀小萌” 科大訊飛人工智能又有新突破

   時間:2019-05-05 18:22:42 來源:互聯(lián)網編輯:星輝 發(fā)表評論無障礙通道

近幾年,人工智能大火,各種A.I.產品如雨后春筍般出現(xiàn),錄音筆、翻譯機、虛擬主播,給人們的生活帶來了些許樂趣,也不斷影響著今后的科技發(fā)展。

最近,央視《中國新聞》欄目播出了一條名為“人工智能虛擬主播圖像誕生記”的新聞報道。在這條視頻中,央視主播紀萌近距離走進人工智能,親自體驗了虛擬主播的誕生過程。

僅需要經過語音、唇形、表情動作等一系列的信息采集,并且輸入文本合成主播圖像之后,虛擬主播“紀小萌”便開始自己的第一次上崗工作,其語音相似程度,連紀萌本人都不禁感嘆稱其“聲音相似程度很高”。

其實,虛擬主播圖像是經過提取真人主播動作特征,運用深度學習技術聯(lián)合建模而成。在音視頻數(shù)據(jù)全部采集之后,人工智能根據(jù)現(xiàn)有數(shù)據(jù)進行學習分析,生成一個獨一無二的信息數(shù)據(jù)。經過數(shù)據(jù)處理和深度學習后,虛擬主播可以實現(xiàn)實時完成音視頻的播報。這項技術的成熟應用,有利于提高新聞記者的工作效率,更智能的幫助主播完成播報工作,同時也為未來的廣播、電視報道方向提供了新的借鑒思路。

本次虛擬主播“紀小萌”的上線,除了依靠科大訊飛人工智能虛擬主播圖像技術外,還離不開其“聲音復刻”技術。我們都知道,聲音是一種具有一定振蕩頻率的聲波,而聲波有振蕩頻率、振幅、波形等物理參數(shù)或特性。所以在現(xiàn)實生活中,由于每個人的聲帶發(fā)育程度,導致聲音各有不同。對于聲音技術來講,想要對于音量、音調的模仿可以簡單做到,但是如果能達到音色、語調等方面的完美呈現(xiàn)卻很難。

借助科大訊飛“聲音復刻”技術的突破進展,通過對所收集的音頻素材進行分析計算及建模,便可以打造出音色高保真還原的聲音。

此外,人工智能在聲音復刻方面的應用,也讓我們的生活更加有愛。今年年初,在一綜藝檔節(jié)目里,科大訊飛團隊便利用聲音復刻技術幫助小女孩實現(xiàn)了“留住已故爸爸的聲音”的心愿。

 

根據(jù)科大訊飛業(yè)務線負責人邵靜文介紹,聲音復刻技術在日常生活中已經有著廣泛的應用。通過智能設備每個人都可以定制自己的聲音,用這項技術創(chuàng)造一個虛擬的自己,讓家人朋友感受到我們更貼心的陪伴,實現(xiàn)“聲音分身”,并且她還希望人工智能技術在給人類減少一些(重復性)工作的同時,給生活帶來溫度,能夠幫助到更多的人。

作為一位奔走在科技前線的小編,基哥的辦公場所當然不單單局限于辦公室,還可以是上下班的地鐵上,以及各種發(fā)布會的現(xiàn)場。

而基哥平時工作的親密伙伴除了Leo、電腦外,就要數(shù)基哥的手機了。畢竟碼字這件事是不限端口的,在地鐵上也能用手機碼字,多方便啊!

不過常年碼字也使基哥深刻的明白了,選擇一款了解你的輸入法是一件多么重要的事。

那今天基哥就從橫向測評一下市面上幾大品牌旗艦機的輸入法,分析一下到底哪家,才是比較“懂你的”輸入法。

先來看下完整的成績單吧,下面的表格就是基哥在做完各項測試之后,對5款輸入法對應測試項目的排名:

可能有小伙伴想問基哥這個排名是怎么來的,當然是基哥純手工統(tǒng)計來的,為了貫徹落實公平、公開、公正原則,詳細的測試步驟和排名依據(jù),基哥也都一一羅列出來了。

#FormatImgID_2#

拼音輸入準確率PK

日常打字基哥都習慣用拼音輸入方式,就是將句子拆成多個詞輸入,對于單個單詞,還會用全拼音和首拼音混合輸入。

拼音輸入方式也是市面上最為主流的輸入方式,所以拼音輸入準確率,便是衡量一款輸入法成熟程度的重要指標。

為了保證公平,基哥向身邊30位小伙伴收集日常聊天內容,每位小伙伴超過500個字,針對這些內容標注拼音,然后在各個手機輸入這些內容,每輸入一份聊天內容就清除一次數(shù)據(jù),避免互相影響。

最后,再根據(jù)輸入法的選詞欄的結果與收集到的內容進行對比,看看候選詞是否為基哥想要輸入的字,以此來計算拼音輸入法的準確率。

考慮到拼音輸入法9鍵和26鍵的用戶數(shù)不相上下,所以基哥就兩個都測了,而且還分首選詞準確率和前5候選詞命中準確率。

首選命中是指,當用戶是在輸入完拼音后,用戶想要打的詞,出現(xiàn)在輸入法選詞欄的推送詞的首位,即算首選命中。再用首選命中次數(shù)除以總輸入語料數(shù),結果就是首選準確率。

同理,當想要打的詞出現(xiàn)在選詞欄備選詞的前5個中,則算是前5名中。而前5準確率便是用前5命中次數(shù)除以總輸入語料數(shù)。

最終的測評結果如下表:

在拼音準確率這一局百度輸入法華為版完勝,無論是9鍵輸入,還是26鍵輸入,百度輸入法華為版的拼音準確率都要優(yōu)于其他4款輸入法的。蘋果的系統(tǒng)輸入法的表現(xiàn)則有點差,幾項準確率都是墊底的情況。

除了拼音準確率,基哥還測試了5款輸入法的整句準確率,就是測試用戶在打完句子的完整拼音之后,各個輸入法對詞的推算準確率。

對此,基哥共選取了1000條收集來的短句(每句5~10個字),邀請5位小伙伴,用拼音9鍵和26鍵全拼音輸入的方式,用相同的拼音輸入這1000條語料,再根據(jù)輸入結果,來統(tǒng)計對應輸入法的首選準確率和前5準確率。

從測試結果可以看出,蘋果的系統(tǒng)輸入法這一項還是比較優(yōu)秀的,各項準確率都是最高。百度輸入法華為版在9鍵和26鍵的前5準確率中都和蘋果系統(tǒng)輸入法并列第一,在首選準確率方面則以微小差距排名第二。

搜狗輸入法的準確率也在可以接受的范圍內,但是在識別一些非日常用語時,搜狗輸入法的組詞功能就要吃力些,需要用戶將句子切成一個一個詞再進行組句。

(原句:深化國家監(jiān)察體制改革)

也就是說,搜狗輸入法要經過一番調教才能達到較高的準確率。

訊飛拼音9鍵輸入方式就很是不友好了,識別準確率要遠低于其他幾款輸入法。

所以就拼音輸入法來說,蘋果的系統(tǒng)輸入法和百度輸入法華為版都是不錯的選擇。但是習慣用拼音9鍵的同學,基哥建議還是直接繞開訊飛吧。

在測試過程中基哥也發(fā)現(xiàn)了,雖說26鍵的精確度高、打字快,但是因為鍵位小,就很容易按錯鍵,而且還容易鬧笑話。

本著看熱鬧不嫌事大的準則,基哥便對這幾款輸入法的誤觸進行測試,看看哪家的輸入法最尷尬。

基哥共選取了1000條短句,每部手機各邀請了五位長期使用該品牌手機的26鍵用戶(使用同品牌手機超過半年),每位受邀者在對應的手機上,都用26鍵全拼音輸入1000句語料。

然后再將每位用戶的輸入的總誤觸次數(shù),除以1000句短句的總拼音數(shù),得出的結果即為26鍵誤觸率。

別說,幾款輸入法還都挺智能的,都能自動識別輸入拼音中的誤觸。就算基哥不更正錯誤拼音,輸入法也能推測出正確的句子,真是貼心!

不過,幾款輸入法在誤觸率上的差異還是比較大的,其中,百度輸入法華為版的誤觸率為0.83%,是誤觸率最小的,而的搜狗輸入法OPPO版的誤觸率則高達1.90%,誤觸率居然比百度的2倍還有多。

基哥建議,如果經常要和客戶或老板發(fā)信息的同學,盡量不要用搜狗輸入法OPPO版。不然哪天打錯字,把老板給調戲了,那飯碗可能就跟著丟了!

#FormatImgID_10#

語音識別準確率PK

在節(jié)奏快的現(xiàn)代生活,語音打字也成了不少人的備用輸入法。像在擁擠的公車上,想要雙手打字是不太可能的,語音打字便成了不錯的選擇。

所以基哥也就對這5款輸入法的語音準確率也進行了比較。

基哥召喚了10位小伙伴來錄音,每位小伙伴分別錄100個包含了聊天、搜索、中英混合場景的語料。

然后在安靜環(huán)境下,5部手機連接同一無線網絡,再分別用語音輸入模式,識別所播放的1000條錄音。最后將輸入法正確識別出的字數(shù),除以總字數(shù),所得結果就是對應輸入法的語音準確率。

從測試結果可以看出,除了蘋果的系統(tǒng)輸入法外,其他幾款輸入法的識別能力都還是很強的。不過,訊飛輸入法和搜狗輸入法,在語音輸入期間,要一直按著屏幕,略顯麻煩。

語音方面,基哥還測試了一下中英混合模式,畢竟我們都很international.

在中英混合模式下,蘋果的系統(tǒng)輸入法和搜狗的兩款輸入法,都未能完全準確的識別出句子。而百度輸入法華為版的和訊飛輸入法小米版的識別能力,要遠比前三款強,所以基哥在這里點名表揚一下。

(原句:See you可以表示什么)

#FormatImgID_15#

手寫輸入準確率PK

除了拼音輸入準確率和語音識別能力外,手寫輸入的識別能力也是考驗一款輸入法成熟能力的標準之一。

基哥再次請出,出鏡率很高的5位小伙伴,讓每位小伙伴分別在5部手機上用手寫輸入方式打500個常用字,記錄每次手寫字后,各輸入法的識別結果。

搜狗的兩款輸入法在首選準確率和前五準確率上的差異不大,百度輸入法華為版的手寫首選準確率和前5準確率都是最高的。

重點是百度輸入法華為版顯示的書寫軌跡,讓基哥特別心動!就算是基哥把字寫得龍飛鳳舞,在百度輸入法華為版顯示出來的書寫軌跡,卻還是很整潔、很好看。

而蘋果的系統(tǒng)輸入法在手寫輸入這塊的首選準確率要比較低,除此之外,其手寫輸入體驗也是比較差的。由于寫字區(qū)域太小,一旦書寫觸到選詞欄,系統(tǒng)就都會判定為無效書寫。然后基哥就得小心翼翼地慢慢寫,一點都不人性化!

#FormatImgID_18#

性能PK

一款好的輸入法,光是準確率高是不行的,還要速度跟得上,所以基哥決定拍一個慢動作視頻,來測試一下哪家的輸入法響應比較快。

一、鍵盤響應速度

速度測試的第一項內容就是,測試在拼音9鍵和26鍵的輸入字母的響應時間。

基哥分別在5部手機的短信應用中調起面板,然后在拼音9鍵和26鍵模式下,分別輸入字符輸“a”,并用高速攝像機拍攝記錄。再根據(jù)視頻計算各輸入法,從點擊a后到候選字完整展現(xiàn),所用的時間。

在拼音9鍵和26鍵的輸入響應時間這兩項中,百度輸入法華為版的測試結果都是一百毫秒左右,訊飛輸入法小米版的響應時間也還可以,其他的的3款的測試結果則都是在在一百五十毫秒上下。Emmmm~距離還是很明顯的。

輸入法打字是否流暢,除了和字母響應速度有關,氣泡響應速度也是影響因素之一。

按鍵氣泡響應的速度,是用于提醒用戶是否成功輸入,所以氣泡的響應速度,也是會影響到我們日常的打字速度和流暢度的感受。

那基哥再用同樣的記錄方法,來測試一下各輸入法,在做完同一點擊后,氣泡完全展現(xiàn)出來所用的時間。

這一項則是蘋果的系統(tǒng)輸入法險勝了百度輸入法華為版,其他3款輸入法的氣泡響應速度則略微吃力。

可能有人會說,雖然這兩項數(shù)據(jù)的差距很大,但在平常打字中并沒有什么較大的區(qū)別。這樣說是沒錯,但幾十毫秒的差距,對基哥這種追求速度的碼字一族來說,就是很大的差距了。


二、刪除速度、手寫識別速度

比完輸入響應速度,再來比下刪除速度和識別速度。

刪除速度一樣也很重要,像我們在日常打字的時候,一旦誤觸或想刪除輸入,都會下意識的直接按“×”鍵來刪除,所以刪除速度也是影響我們輸入速度的一大關鍵。

還是老辦法,用高速攝像機來記錄,5款輸入法對輸入法選詞欄已經有的“啊”字進行刪除。從手指觸到拼音9鍵下的“×”鍵,到選詞欄上“啊”字被完全刪除所用的時間,即為上屏刪除時間。

統(tǒng)計完上屏刪除時間,基哥再對信息框中已經有的“啊”字進行刪除。計算從手指觸到拼音9鍵下的“×”鍵,到“啊”字完全被刪除所用的時間,所得結果即為刪除上屏漢字時間。

手寫識別速度則是計算5款輸入法,在手寫輸入方式下,寫完同一個字后,手指從寫完字的那一幀,到輸入法完全識別出該字所用的時間,就作為手寫識別速度的比較依據(jù)。

看來,蘋果的系統(tǒng)果真不是吹的,連輸入法的性能都很能打。不過安卓系統(tǒng)里的,百度輸入法華為版的性能也是優(yōu)秀的,幾項速度都是安卓中的第一,在手寫識別速度上更是遙遙領先于其他3款。

不過基哥還是要吐槽一下蘋果的系統(tǒng)輸入法的體驗,建議優(yōu)化下輸入法的書寫軌跡,畢竟基哥寫字真的沒有那么難看!真的!

三、語音識別速度

接下來,基哥再來用慢鏡頭的方法,測試下5款手機不同輸入法語音識別的速度。

評測方法是預先錄制好10名用戶共計500句語音,分別在同樣的網絡環(huán)境、相對位置的情況下,播放錄音用5部手機的語音輸入功能進行語音識別輸入,記錄從播放完錄音后,到各輸入法完成識別所用的時間。

百度輸入法華為版在這一局,以200多毫秒的最快速度穩(wěn)坐第一的寶座,訊飛輸入法小米版以346毫秒緊追其后,搜狗的2款輸入法和蘋果的系統(tǒng)輸入法則被遠遠的甩在了后面。

四、內存、CPU占比

而輸入法的打字內存、后臺內存、打字CPU占用率等性能,同樣也是不少同學所關心的,畢竟如果內存和CPU占比過大的話,是會影響手機的流暢度的。

對此基哥專門用測試APP測試了一下。

看到測試結果后,基哥不得不夸一下百度輸入法華為版,居然能在4項測試全面領跑,加個雞腿表揚一下。

近幾年來,輸入法越來越智能化,這一番測試下來,基哥也深刻的感受到了這一點。所以基哥有個大膽的想法,什么時候能用意念輸入啊,各大輸入法程序員安排一下啊!

跑遠了,回歸正題!總的來說,這5款輸入法,從準確度、速度及智能程度方面,百度輸入法華為版還是比較讓基哥心水的,除了各項成績優(yōu)異外,體驗感也是幾款里面最好的,所以深得基哥的心。

而蘋果的系統(tǒng)輸入法,雖然在整句準確率和刪除速度上表現(xiàn)比較好,但是智能程度則是幾款里面最差的。其他3款輸入法表現(xiàn)平平,沒有什么特別突出的,但拖后腿項倒是不少。所以經常被輸入法坑害的同學,不妨往百度輸入法華為版這邊看一下哦!

說完了,“在看”在哪里?

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯(lián)系方式  |  版權聲明  |  RSS訂閱  |  開放轉載  |  滾動資訊  |  爭議稿件處理  |  English Version