近日,阿里達(dá)摩院語言技術(shù)實(shí)驗(yàn)室取得一系列突破,斬獲自然語言處理(NLP)領(lǐng)域6大權(quán)威技術(shù)榜單冠軍。其中,在 MS MARCO 自然語言生成NLG公開評(píng)測上取得了排行榜第一的生成式語言模型PALM,不久將在斑馬智行系統(tǒng)大規(guī)模商用。
自Google提出模仿人類注意力機(jī)制的BERT模型以來,預(yù)訓(xùn)練語言模型已成為NLP領(lǐng)域的熱點(diǎn)研究方向。達(dá)摩院早在2018年就開始布局通用的預(yù)訓(xùn)練語言模型,其自研通用語言模型StructBERT、多語言模型VECO、多模態(tài)語言模型StructVBERT、生成式語言模型PALM等6大自研模型分別刷新了世界紀(jì)錄。
【達(dá)摩院自研生成式預(yù)訓(xùn)練模型PALM在MS MARCO NLG榜單中位居第一(僅次于人類水平)】
據(jù)了解,這些技術(shù)已應(yīng)用于閱讀理解、機(jī)器翻譯、人機(jī)交互等場景。PALM在 MS MARCO 自然語言生成NLG公開評(píng)測上取得了排行榜第一,同時(shí)在摘要生成標(biāo)準(zhǔn)數(shù)據(jù)集CNN/DailyMail和Gigaword上超過現(xiàn)有的各個(gè)預(yù)訓(xùn)練生成語言模型。未來,PALM將被深度應(yīng)用在斑馬智行系統(tǒng)上,成為車載場景下該技術(shù)的首次大規(guī)模商業(yè)應(yīng)用。
斑馬網(wǎng)絡(luò)高級(jí)算法專家張濤指出“自然連續(xù)對(duì)話是一個(gè)系統(tǒng)的工程,涉及到從車機(jī)端的聲學(xué)前端處理、語音喚醒、語音識(shí)別、語義理解、對(duì)話管理、自然語言生成、語音合成等多個(gè)核心交互技術(shù)。其中,NLP(自然語言處理)是非常重要的環(huán)節(jié),只有先識(shí)別處理才能有后面的生成和交互,生成式語言模型PALM的應(yīng)用,讓斑馬智行系統(tǒng)和用戶交互更流暢,更智能。”
當(dāng)前,在達(dá)摩院技術(shù)加持下斑馬智行AI語音已實(shí)現(xiàn)僅需一次喚醒,就可準(zhǔn)確識(shí)別,實(shí)現(xiàn)自然連續(xù)對(duì)話,并且指令可以隨時(shí)打斷,內(nèi)容隨心切換,整個(gè)對(duì)話體驗(yàn)自然流暢,給用戶帶來情景化、有溫度的用車體驗(yàn)。
(斑馬智行VENUS系統(tǒng)語音交互界面)
基于阿里自研的AliOS,斑馬網(wǎng)絡(luò)面向全行業(yè)提供智能汽車操作系統(tǒng)整體解決方案,斑馬智行系統(tǒng)已經(jīng)運(yùn)行在100多萬臺(tái)智能網(wǎng)聯(lián)汽車上。斑馬在出行領(lǐng)域的持續(xù)探索,為阿里達(dá)摩院AI技術(shù)在車載環(huán)境下創(chuàng)造了最佳的商業(yè)應(yīng)用場景,也將為用戶帶來更加智能的產(chǎn)品體驗(yàn)。