ITBear旗下自媒體矩陣:

攜手央視上線虛擬主播“紀(jì)小萌” 科大訊飛人工智能又有新突破

   時(shí)間:2019-05-05 18:22:42 來源:互聯(lián)網(wǎng)編輯:星輝 發(fā)表評(píng)論無障礙通道

近幾年,人工智能大火,各種A.I.產(chǎn)品如雨后春筍般出現(xiàn),錄音筆、翻譯機(jī)、虛擬主播,給人們的生活帶來了些許樂趣,也不斷影響著今后的科技發(fā)展。

最近,央視《中國新聞》欄目播出了一條名為“人工智能虛擬主播圖像誕生記”的新聞報(bào)道。在這條視頻中,央視主播紀(jì)萌近距離走進(jìn)人工智能,親自體驗(yàn)了虛擬主播的誕生過程。

僅需要經(jīng)過語音、唇形、表情動(dòng)作等一系列的信息采集,并且輸入文本合成主播圖像之后,虛擬主播“紀(jì)小萌”便開始自己的第一次上崗工作,其語音相似程度,連紀(jì)萌本人都不禁感嘆稱其“聲音相似程度很高”。

其實(shí),虛擬主播圖像是經(jīng)過提取真人主播動(dòng)作特征,運(yùn)用深度學(xué)習(xí)技術(shù)聯(lián)合建模而成。在音視頻數(shù)據(jù)全部采集之后,人工智能根據(jù)現(xiàn)有數(shù)據(jù)進(jìn)行學(xué)習(xí)分析,生成一個(gè)獨(dú)一無二的信息數(shù)據(jù)。經(jīng)過數(shù)據(jù)處理和深度學(xué)習(xí)后,虛擬主播可以實(shí)現(xiàn)實(shí)時(shí)完成音視頻的播報(bào)。這項(xiàng)技術(shù)的成熟應(yīng)用,有利于提高新聞?dòng)浾叩墓ぷ餍?,更智能的幫助主播完成播?bào)工作,同時(shí)也為未來的廣播、電視報(bào)道方向提供了新的借鑒思路。

本次虛擬主播“紀(jì)小萌”的上線,除了依靠科大訊飛人工智能虛擬主播圖像技術(shù)外,還離不開其“聲音復(fù)刻”技術(shù)。我們都知道,聲音是一種具有一定振蕩頻率的聲波,而聲波有振蕩頻率、振幅、波形等物理參數(shù)或特性。所以在現(xiàn)實(shí)生活中,由于每個(gè)人的聲帶發(fā)育程度,導(dǎo)致聲音各有不同。對(duì)于聲音技術(shù)來講,想要對(duì)于音量、音調(diào)的模仿可以簡單做到,但是如果能達(dá)到音色、語調(diào)等方面的完美呈現(xiàn)卻很難。

借助科大訊飛“聲音復(fù)刻”技術(shù)的突破進(jìn)展,通過對(duì)所收集的音頻素材進(jìn)行分析計(jì)算及建模,便可以打造出音色高保真還原的聲音。

此外,人工智能在聲音復(fù)刻方面的應(yīng)用,也讓我們的生活更加有愛。今年年初,在一綜藝檔節(jié)目里,科大訊飛團(tuán)隊(duì)便利用聲音復(fù)刻技術(shù)幫助小女孩實(shí)現(xiàn)了“留住已故爸爸的聲音”的心愿。

 

根據(jù)科大訊飛業(yè)務(wù)線負(fù)責(zé)人邵靜文介紹,聲音復(fù)刻技術(shù)在日常生活中已經(jīng)有著廣泛的應(yīng)用。通過智能設(shè)備每個(gè)人都可以定制自己的聲音,用這項(xiàng)技術(shù)創(chuàng)造一個(gè)虛擬的自己,讓家人朋友感受到我們更貼心的陪伴,實(shí)現(xiàn)“聲音分身”,并且她還希望人工智能技術(shù)在給人類減少一些(重復(fù)性)工作的同時(shí),給生活帶來溫度,能夠幫助到更多的人。

作為一位奔走在科技前線的小編,基哥的辦公場(chǎng)所當(dāng)然不單單局限于辦公室,還可以是上下班的地鐵上,以及各種發(fā)布會(huì)的現(xiàn)場(chǎng)。

而基哥平時(shí)工作的親密伙伴除了Leo、電腦外,就要數(shù)基哥的手機(jī)了。畢竟碼字這件事是不限端口的,在地鐵上也能用手機(jī)碼字,多方便啊!

不過常年碼字也使基哥深刻的明白了,選擇一款了解你的輸入法是一件多么重要的事。

那今天基哥就從橫向測(cè)評(píng)一下市面上幾大品牌旗艦機(jī)的輸入法,分析一下到底哪家,才是比較“懂你的”輸入法。

先來看下完整的成績單吧,下面的表格就是基哥在做完各項(xiàng)測(cè)試之后,對(duì)5款輸入法對(duì)應(yīng)測(cè)試項(xiàng)目的排名:

可能有小伙伴想問基哥這個(gè)排名是怎么來的,當(dāng)然是基哥純手工統(tǒng)計(jì)來的,為了貫徹落實(shí)公平、公開、公正原則,詳細(xì)的測(cè)試步驟和排名依據(jù),基哥也都一一羅列出來了。

#FormatImgID_2#

拼音輸入準(zhǔn)確率PK

日常打字基哥都習(xí)慣用拼音輸入方式,就是將句子拆成多個(gè)詞輸入,對(duì)于單個(gè)單詞,還會(huì)用全拼音和首拼音混合輸入。

拼音輸入方式也是市面上最為主流的輸入方式,所以拼音輸入準(zhǔn)確率,便是衡量一款輸入法成熟程度的重要指標(biāo)。

為了保證公平,基哥向身邊30位小伙伴收集日常聊天內(nèi)容,每位小伙伴超過500個(gè)字,針對(duì)這些內(nèi)容標(biāo)注拼音,然后在各個(gè)手機(jī)輸入這些內(nèi)容,每輸入一份聊天內(nèi)容就清除一次數(shù)據(jù),避免互相影響。

最后,再根據(jù)輸入法的選詞欄的結(jié)果與收集到的內(nèi)容進(jìn)行對(duì)比,看看候選詞是否為基哥想要輸入的字,以此來計(jì)算拼音輸入法的準(zhǔn)確率。

考慮到拼音輸入法9鍵和26鍵的用戶數(shù)不相上下,所以基哥就兩個(gè)都測(cè)了,而且還分首選詞準(zhǔn)確率和前5候選詞命中準(zhǔn)確率。

首選命中是指,當(dāng)用戶是在輸入完拼音后,用戶想要打的詞,出現(xiàn)在輸入法選詞欄的推送詞的首位,即算首選命中。再用首選命中次數(shù)除以總輸入語料數(shù),結(jié)果就是首選準(zhǔn)確率。

同理,當(dāng)想要打的詞出現(xiàn)在選詞欄備選詞的前5個(gè)中,則算是前5名中。而前5準(zhǔn)確率便是用前5命中次數(shù)除以總輸入語料數(shù)。

最終的測(cè)評(píng)結(jié)果如下表:

在拼音準(zhǔn)確率這一局百度輸入法華為版完勝,無論是9鍵輸入,還是26鍵輸入,百度輸入法華為版的拼音準(zhǔn)確率都要優(yōu)于其他4款輸入法的。蘋果的系統(tǒng)輸入法的表現(xiàn)則有點(diǎn)差,幾項(xiàng)準(zhǔn)確率都是墊底的情況。

除了拼音準(zhǔn)確率,基哥還測(cè)試了5款輸入法的整句準(zhǔn)確率,就是測(cè)試用戶在打完句子的完整拼音之后,各個(gè)輸入法對(duì)詞的推算準(zhǔn)確率。

對(duì)此,基哥共選取了1000條收集來的短句(每句5~10個(gè)字),邀請(qǐng)5位小伙伴,用拼音9鍵和26鍵全拼音輸入的方式,用相同的拼音輸入這1000條語料,再根據(jù)輸入結(jié)果,來統(tǒng)計(jì)對(duì)應(yīng)輸入法的首選準(zhǔn)確率和前5準(zhǔn)確率。

從測(cè)試結(jié)果可以看出,蘋果的系統(tǒng)輸入法這一項(xiàng)還是比較優(yōu)秀的,各項(xiàng)準(zhǔn)確率都是最高。百度輸入法華為版在9鍵和26鍵的前5準(zhǔn)確率中都和蘋果系統(tǒng)輸入法并列第一,在首選準(zhǔn)確率方面則以微小差距排名第二。

搜狗輸入法的準(zhǔn)確率也在可以接受的范圍內(nèi),但是在識(shí)別一些非日常用語時(shí),搜狗輸入法的組詞功能就要吃力些,需要用戶將句子切成一個(gè)一個(gè)詞再進(jìn)行組句。

(原句:深化國家監(jiān)察體制改革)

也就是說,搜狗輸入法要經(jīng)過一番調(diào)教才能達(dá)到較高的準(zhǔn)確率。

訊飛拼音9鍵輸入方式就很是不友好了,識(shí)別準(zhǔn)確率要遠(yuǎn)低于其他幾款輸入法。

所以就拼音輸入法來說,蘋果的系統(tǒng)輸入法和百度輸入法華為版都是不錯(cuò)的選擇。但是習(xí)慣用拼音9鍵的同學(xué),基哥建議還是直接繞開訊飛吧。

在測(cè)試過程中基哥也發(fā)現(xiàn)了,雖說26鍵的精確度高、打字快,但是因?yàn)殒I位小,就很容易按錯(cuò)鍵,而且還容易鬧笑話。

本著看熱鬧不嫌事大的準(zhǔn)則,基哥便對(duì)這幾款輸入法的誤觸進(jìn)行測(cè)試,看看哪家的輸入法最尷尬。

基哥共選取了1000條短句,每部手機(jī)各邀請(qǐng)了五位長期使用該品牌手機(jī)的26鍵用戶(使用同品牌手機(jī)超過半年),每位受邀者在對(duì)應(yīng)的手機(jī)上,都用26鍵全拼音輸入1000句語料。

然后再將每位用戶的輸入的總誤觸次數(shù),除以1000句短句的總拼音數(shù),得出的結(jié)果即為26鍵誤觸率。

別說,幾款輸入法還都挺智能的,都能自動(dòng)識(shí)別輸入拼音中的誤觸。就算基哥不更正錯(cuò)誤拼音,輸入法也能推測(cè)出正確的句子,真是貼心!

不過,幾款輸入法在誤觸率上的差異還是比較大的,其中,百度輸入法華為版的誤觸率為0.83%,是誤觸率最小的,而的搜狗輸入法OPPO版的誤觸率則高達(dá)1.90%,誤觸率居然比百度的2倍還有多。

基哥建議,如果經(jīng)常要和客戶或老板發(fā)信息的同學(xué),盡量不要用搜狗輸入法OPPO版。不然哪天打錯(cuò)字,把老板給調(diào)戲了,那飯碗可能就跟著丟了!

#FormatImgID_10#

語音識(shí)別準(zhǔn)確率PK

在節(jié)奏快的現(xiàn)代生活,語音打字也成了不少人的備用輸入法。像在擁擠的公車上,想要雙手打字是不太可能的,語音打字便成了不錯(cuò)的選擇。

所以基哥也就對(duì)這5款輸入法的語音準(zhǔn)確率也進(jìn)行了比較。

基哥召喚了10位小伙伴來錄音,每位小伙伴分別錄100個(gè)包含了聊天、搜索、中英混合場(chǎng)景的語料。

然后在安靜環(huán)境下,5部手機(jī)連接同一無線網(wǎng)絡(luò),再分別用語音輸入模式,識(shí)別所播放的1000條錄音。最后將輸入法正確識(shí)別出的字?jǐn)?shù),除以總字?jǐn)?shù),所得結(jié)果就是對(duì)應(yīng)輸入法的語音準(zhǔn)確率。

從測(cè)試結(jié)果可以看出,除了蘋果的系統(tǒng)輸入法外,其他幾款輸入法的識(shí)別能力都還是很強(qiáng)的。不過,訊飛輸入法和搜狗輸入法,在語音輸入期間,要一直按著屏幕,略顯麻煩。

語音方面,基哥還測(cè)試了一下中英混合模式,畢竟我們都很international.

在中英混合模式下,蘋果的系統(tǒng)輸入法和搜狗的兩款輸入法,都未能完全準(zhǔn)確的識(shí)別出句子。而百度輸入法華為版的和訊飛輸入法小米版的識(shí)別能力,要遠(yuǎn)比前三款強(qiáng),所以基哥在這里點(diǎn)名表揚(yáng)一下。

(原句:See you可以表示什么)

#FormatImgID_15#

手寫輸入準(zhǔn)確率PK

除了拼音輸入準(zhǔn)確率和語音識(shí)別能力外,手寫輸入的識(shí)別能力也是考驗(yàn)一款輸入法成熟能力的標(biāo)準(zhǔn)之一。

基哥再次請(qǐng)出,出鏡率很高的5位小伙伴,讓每位小伙伴分別在5部手機(jī)上用手寫輸入方式打500個(gè)常用字,記錄每次手寫字后,各輸入法的識(shí)別結(jié)果。

搜狗的兩款輸入法在首選準(zhǔn)確率和前五準(zhǔn)確率上的差異不大,百度輸入法華為版的手寫首選準(zhǔn)確率和前5準(zhǔn)確率都是最高的。

重點(diǎn)是百度輸入法華為版顯示的書寫軌跡,讓基哥特別心動(dòng)!就算是基哥把字寫得龍飛鳳舞,在百度輸入法華為版顯示出來的書寫軌跡,卻還是很整潔、很好看。

而蘋果的系統(tǒng)輸入法在手寫輸入這塊的首選準(zhǔn)確率要比較低,除此之外,其手寫輸入體驗(yàn)也是比較差的。由于寫字區(qū)域太小,一旦書寫觸到選詞欄,系統(tǒng)就都會(huì)判定為無效書寫。然后基哥就得小心翼翼地慢慢寫,一點(diǎn)都不人性化!

#FormatImgID_18#

性能PK

一款好的輸入法,光是準(zhǔn)確率高是不行的,還要速度跟得上,所以基哥決定拍一個(gè)慢動(dòng)作視頻,來測(cè)試一下哪家的輸入法響應(yīng)比較快。

一、鍵盤響應(yīng)速度

速度測(cè)試的第一項(xiàng)內(nèi)容就是,測(cè)試在拼音9鍵和26鍵的輸入字母的響應(yīng)時(shí)間。

基哥分別在5部手機(jī)的短信應(yīng)用中調(diào)起面板,然后在拼音9鍵和26鍵模式下,分別輸入字符輸“a”,并用高速攝像機(jī)拍攝記錄。再根據(jù)視頻計(jì)算各輸入法,從點(diǎn)擊a后到候選字完整展現(xiàn),所用的時(shí)間。

在拼音9鍵和26鍵的輸入響應(yīng)時(shí)間這兩項(xiàng)中,百度輸入法華為版的測(cè)試結(jié)果都是一百毫秒左右,訊飛輸入法小米版的響應(yīng)時(shí)間也還可以,其他的的3款的測(cè)試結(jié)果則都是在在一百五十毫秒上下。Emmmm~距離還是很明顯的。

輸入法打字是否流暢,除了和字母響應(yīng)速度有關(guān),氣泡響應(yīng)速度也是影響因素之一。

按鍵氣泡響應(yīng)的速度,是用于提醒用戶是否成功輸入,所以氣泡的響應(yīng)速度,也是會(huì)影響到我們?nèi)粘5拇蜃炙俣群土鲿扯鹊母惺堋?/p>

那基哥再用同樣的記錄方法,來測(cè)試一下各輸入法,在做完同一點(diǎn)擊后,氣泡完全展現(xiàn)出來所用的時(shí)間。

這一項(xiàng)則是蘋果的系統(tǒng)輸入法險(xiǎn)勝了百度輸入法華為版,其他3款輸入法的氣泡響應(yīng)速度則略微吃力。

可能有人會(huì)說,雖然這兩項(xiàng)數(shù)據(jù)的差距很大,但在平常打字中并沒有什么較大的區(qū)別。這樣說是沒錯(cuò),但幾十毫秒的差距,對(duì)基哥這種追求速度的碼字一族來說,就是很大的差距了。


二、刪除速度、手寫識(shí)別速度

比完輸入響應(yīng)速度,再來比下刪除速度和識(shí)別速度。

刪除速度一樣也很重要,像我們?cè)谌粘4蜃值臅r(shí)候,一旦誤觸或想刪除輸入,都會(huì)下意識(shí)的直接按“×”鍵來刪除,所以刪除速度也是影響我們輸入速度的一大關(guān)鍵。

還是老辦法,用高速攝像機(jī)來記錄,5款輸入法對(duì)輸入法選詞欄已經(jīng)有的“啊”字進(jìn)行刪除。從手指觸到拼音9鍵下的“×”鍵,到選詞欄上“啊”字被完全刪除所用的時(shí)間,即為上屏刪除時(shí)間。

統(tǒng)計(jì)完上屏刪除時(shí)間,基哥再對(duì)信息框中已經(jīng)有的“啊”字進(jìn)行刪除。計(jì)算從手指觸到拼音9鍵下的“×”鍵,到“啊”字完全被刪除所用的時(shí)間,所得結(jié)果即為刪除上屏漢字時(shí)間。

手寫識(shí)別速度則是計(jì)算5款輸入法,在手寫輸入方式下,寫完同一個(gè)字后,手指從寫完字的那一幀,到輸入法完全識(shí)別出該字所用的時(shí)間,就作為手寫識(shí)別速度的比較依據(jù)。

看來,蘋果的系統(tǒng)果真不是吹的,連輸入法的性能都很能打。不過安卓系統(tǒng)里的,百度輸入法華為版的性能也是優(yōu)秀的,幾項(xiàng)速度都是安卓中的第一,在手寫識(shí)別速度上更是遙遙領(lǐng)先于其他3款。

不過基哥還是要吐槽一下蘋果的系統(tǒng)輸入法的體驗(yàn),建議優(yōu)化下輸入法的書寫軌跡,畢竟基哥寫字真的沒有那么難看!真的!

三、語音識(shí)別速度

接下來,基哥再來用慢鏡頭的方法,測(cè)試下5款手機(jī)不同輸入法語音識(shí)別的速度。

評(píng)測(cè)方法是預(yù)先錄制好10名用戶共計(jì)500句語音,分別在同樣的網(wǎng)絡(luò)環(huán)境、相對(duì)位置的情況下,播放錄音用5部手機(jī)的語音輸入功能進(jìn)行語音識(shí)別輸入,記錄從播放完錄音后,到各輸入法完成識(shí)別所用的時(shí)間。

百度輸入法華為版在這一局,以200多毫秒的最快速度穩(wěn)坐第一的寶座,訊飛輸入法小米版以346毫秒緊追其后,搜狗的2款輸入法和蘋果的系統(tǒng)輸入法則被遠(yuǎn)遠(yuǎn)的甩在了后面。

四、內(nèi)存、CPU占比

而輸入法的打字內(nèi)存、后臺(tái)內(nèi)存、打字CPU占用率等性能,同樣也是不少同學(xué)所關(guān)心的,畢竟如果內(nèi)存和CPU占比過大的話,是會(huì)影響手機(jī)的流暢度的。

對(duì)此基哥專門用測(cè)試APP測(cè)試了一下。

看到測(cè)試結(jié)果后,基哥不得不夸一下百度輸入法華為版,居然能在4項(xiàng)測(cè)試全面領(lǐng)跑,加個(gè)雞腿表揚(yáng)一下。

近幾年來,輸入法越來越智能化,這一番測(cè)試下來,基哥也深刻的感受到了這一點(diǎn)。所以基哥有個(gè)大膽的想法,什么時(shí)候能用意念輸入啊,各大輸入法程序員安排一下啊!

跑遠(yuǎn)了,回歸正題!總的來說,這5款輸入法,從準(zhǔn)確度、速度及智能程度方面,百度輸入法華為版還是比較讓基哥心水的,除了各項(xiàng)成績優(yōu)異外,體驗(yàn)感也是幾款里面最好的,所以深得基哥的心。

而蘋果的系統(tǒng)輸入法,雖然在整句準(zhǔn)確率和刪除速度上表現(xiàn)比較好,但是智能程度則是幾款里面最差的。其他3款輸入法表現(xiàn)平平,沒有什么特別突出的,但拖后腿項(xiàng)倒是不少。所以經(jīng)常被輸入法坑害的同學(xué),不妨往百度輸入法華為版這邊看一下哦!

說完了,“在看”在哪里?

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報(bào)  |  開放轉(zhuǎn)載  |  滾動(dòng)資訊  |  English Version