ITBear旗下自媒體矩陣:

豆包大模型升級(jí):語言理解能力提升33.3%

   時(shí)間:2024-08-24 13:20:22 來源:ITBEAR編輯:汪淼 發(fā)表評(píng)論無障礙通道

近日,2024火山引擎AI創(chuàng)新巡展上海站活動(dòng)正式舉辦。會(huì)上,火山引擎發(fā)布了豆包大模型一系列產(chǎn)品升級(jí)?;鹕揭婵偛米T待表示,自豆包大模型正式發(fā)布以來,模型調(diào)用量快速增長,更豐富的業(yè)務(wù)場(chǎng)景也促進(jìn)了模型關(guān)鍵能力的持續(xù)迭代升級(jí)。

以語言大模型為例,在過去的兩個(gè)月里,豆包通用模型pro、通用模型lite都完成了多項(xiàng)重要更新。測(cè)試數(shù)據(jù)表明,最新版豆包通用模型pro,對(duì)比三個(gè)月前的版本綜合能力提升了20.3%。

其中,角色扮演能力提升了38.3%,使得豆包模型帶來的對(duì)話更加生動(dòng)、擬人度更高,AI交互流程更自然連貫,從而帶來更好的用戶留存。

語言理解能力則提升了33.3%,這讓大模型在信息分類、抽取、摘要總結(jié)、理解、知識(shí)問答等多項(xiàng)能力都有顯著增強(qiáng),使其越來越多地出現(xiàn)在企業(yè)的生產(chǎn)力環(huán)節(jié)中,幫助企業(yè)解決真實(shí)的業(yè)務(wù)需求。

圖片1.png

圖像創(chuàng)作方面,豆包大模型對(duì)“文生圖”模型做了升級(jí)迭代。新模型對(duì)長文本有了更精準(zhǔn)的圖文匹配能力,并且對(duì)于多主體、多位置,以及手部結(jié)構(gòu)等難題,新模型都有大幅提升。

同時(shí),新“文生圖”模型對(duì)于中國本土的人物、物品、藝術(shù)風(fēng)格都有更深一層的理解,可以圖文一致的創(chuàng)造出更多中國風(fēng)格的高美感圖片,進(jìn)而廣泛應(yīng)用到設(shè)計(jì)、廣告、營銷、電商等多個(gè)領(lǐng)域,幫企業(yè)解決實(shí)際問題。

語音模型方面,火山引擎對(duì)語義識(shí)別準(zhǔn)確性進(jìn)行了相關(guān)升級(jí),尤其是利用大模型豐富的知識(shí)儲(chǔ)備和強(qiáng)大的推理能力,結(jié)合上下文感知,提升語音識(shí)別的準(zhǔn)確性。

圖片2.png

對(duì)此,譚待以滑雪運(yùn)動(dòng)為例進(jìn)行解釋。滑雪運(yùn)動(dòng)里有非常多專業(yè)術(shù)語,如立刃、搓雪等,如果沒有上下文理解,模型很難識(shí)別。豆包語音識(shí)別模型通過更精準(zhǔn)的上下文感知,就可以讓模型更好理解其意義,讓整個(gè)語音識(shí)別的召回率提升15%,錯(cuò)誤率比國內(nèi)公開的其他語音識(shí)別大模型相對(duì)降低了10%至40%。

同時(shí),火山引擎還將豆包大模型和實(shí)時(shí)音頻技術(shù)(RTC)結(jié)合在一起,從而能夠提供端到端的大模型實(shí)時(shí)對(duì)話能力,企業(yè)可以將其接入自己的AI應(yīng)用中,讓用戶真正和模型直接、自由對(duì)話,讓用戶獲得與真人交流的體驗(yàn)。

譚待介紹,通過推理,以及RTC的端到端優(yōu)化,火山引擎已經(jīng)可以把這類對(duì)話的延遲做到1秒以內(nèi),即使在網(wǎng)絡(luò)環(huán)境很差,可能80%丟包的情況下,仍保持清晰流暢的通話質(zhì)量。

譚待表示,火山引擎通過降價(jià),將企業(yè)的試錯(cuò)創(chuàng)新成本降到足夠低,使大模型真正成為了創(chuàng)新源泉?;鹕揭娌粌H提供了更低的價(jià)格,也提供了更好的性能和吞吐。豆包通用模型pro支持初始800K的TPM,比行業(yè)平均水平高出4—5倍。

//
舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報(bào)  |  開放轉(zhuǎn)載  |  滾動(dòng)資訊  |  English Version