【ITBEAR科技資訊】6月17日消息,元繼推出了一款名為Voicebox的全新生成式AI模型。該模型為創(chuàng)作者和普通用戶提供了便捷的語音生成任務工具,幫助用戶進行音頻編輯、采樣和風格化等操作。不僅如此,meta還強調Voicebox對于視障人士來說具有重要意義,他們可以通過該模型聽到好友的回復信息。此外,普通用戶還能使用自己的語調和語氣來說外語。
Voicebox模型以其出色的性能和多樣的功能受到了廣泛關注。它能生成高質量的音頻剪輯,同時消除了背景噪音,如汽車喇叭等,保留了音頻的內容和風格。該模型還能使用六種語言進行語音生成,使得用戶可以在不同語言之間切換。meta還展望了Voicebox的未來發(fā)展,表示該模型有望在元宇宙游戲中為視覺助理和非玩家角色提供自然的聲音。
與Vall-E、YourTTS等其他音頻AI模型相比,meta對Voicebox進行了比較,并表示Voicebox更為先進。在單詞錯誤率和樣式相似性方面,Voicebox明顯優(yōu)于這兩種模型,進一步展示了其卓越的性能。
據(jù)ITBEAR科技資訊了解,meta公司的Voicebox模型在音頻生成領域帶來了許多創(chuàng)新,并為用戶提供了更廣闊的應用空間。未來,隨著Voicebox的不斷發(fā)展,我們可以期待它在語音合成技術方面的更多突破,為用戶帶來更出色的體驗和應用場景。