ITBear旗下自媒體矩陣:

OpenAI重磅升級(jí):Whisper語音轉(zhuǎn)錄模型提速8倍,質(zhì)量不減!

   時(shí)間:2024-10-03 12:12:11 來源:ITBEAR作者:陸辰風(fēng)編輯:瑞雪 發(fā)表評(píng)論無障礙通道

【ITBEAR】在近日舉辦的DevDay活動(dòng)日中,科技巨頭OpenAI宣布推出全新的語音轉(zhuǎn)錄模型——Whisper large-v3-turbo。該模型擁有8.09億參數(shù),以其卓越的性能和速度引起了業(yè)界的廣泛關(guān)注。

作為large-v3的優(yōu)化版,Whisper large-v3-turbo在保持高質(zhì)量轉(zhuǎn)錄的同時(shí),實(shí)現(xiàn)了速度的大幅提升,比原版large-v3快8倍。新模型僅包含4層解碼器層,相較于large-v3的32層,結(jié)構(gòu)更為精簡。

Whisper large-v3-turbo在參數(shù)規(guī)模上也有所調(diào)整,略大于7.69億參數(shù)的medium模型,但遠(yuǎn)小于15.5億參數(shù)的large模型,實(shí)現(xiàn)了性能與效率的平衡。同時(shí),新模型所需的VRAM降低至6GB,相較于large模型的10GB,進(jìn)一步減輕了硬件負(fù)擔(dān)。

OpenAI表示,新模型的大小僅為1.6GB,便于用戶下載和使用。同時(shí),公司將繼續(xù)遵循MIT許可證,提供包括代碼和模型權(quán)重在內(nèi)的Whisper資源,以支持開發(fā)者社區(qū)的創(chuàng)新和發(fā)展。

據(jù)Awni Hannun的測試結(jié)果顯示,在M2 Ultra平臺(tái)上,使用Whisper large-v3-turbo將12分鐘的內(nèi)容轉(zhuǎn)錄僅需14秒,展現(xiàn)了其強(qiáng)大的實(shí)時(shí)轉(zhuǎn)錄能力。

感興趣的用戶可以通過GitHub、Hugging Face等平臺(tái)獲取模型并在線體驗(yàn)其卓越性能。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報(bào)  |  開放轉(zhuǎn)載  |  滾動(dòng)資訊  |  English Version