滾動資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

英偉達(dá)用 AI 給紀(jì)錄片配音：情緒節(jié)奏穩(wěn)穩(wěn)拿捏，不說根本聽不出來

時間：2021-09-01 16:11:13 來源：量子位編輯：星輝 發(fā)表評論無障礙通道

雖然日常和你對話的 Siri 聲音機(jī)械，還常常胡亂斷句，但實際上，最新的技術(shù)進(jìn)展顯示，AI 的語音合成能力已經(jīng)可以說得上是以假亂真。

比如英偉達(dá)，最近就發(fā)布了一個更懂節(jié)奏、更具感情的語音合成 AI。

在英偉達(dá)的紀(jì)錄片中，她的自我介紹口齒清晰自不必說，氣息頓挫、情緒把控，播音員范兒絕對夠正。

幀級控制合成語音

英偉達(dá)將在 9 月 3 日的語音技術(shù)頂會 Interspeech 2021 上展示該項目的最新成果。

不過，其背后的技術(shù)，此前就已經(jīng)幫助自家數(shù)字人在 SIGGRAPH Real-Time Live 上摘下了最佳展示獎。

核心是名為 RAD-TTS 的語音合成方法。

這是一個并行的端到端 TTS 模型。與此前的并行方法不同，RAD-TTS 將語音節(jié)奏作為一個單獨(dú)的生成分布來建模。如此，在推理過程中，語音的持續(xù)時間就能被更好地控制。

從 RAD-TTS 的演示界面中也可以看出，用戶可以在幀級別上控制合成語音的音調(diào)、持續(xù)時間和節(jié)奏力度。

研究人員還介紹，RAD-TTS 既可以將任意文本轉(zhuǎn)換成說話人的聲音，也可以將一個說話人的聲音(甚至是歌聲)轉(zhuǎn)換成另一個人的聲音。

也就是說，合成語音的制作人可以像指導(dǎo)配音演員一樣去“指導(dǎo)”AI，讓它學(xué)會哪個單詞應(yīng)該重點突出、節(jié)奏如何把控更符合創(chuàng)作基調(diào)等等。

機(jī)器語音能有多真實?

其實，不只是英偉達(dá)，此前，小冰也發(fā)布過超級自然語音技術(shù)。

把一句人類的語音混進(jìn)小冰的語音里，你能分辨到底哪一句來自真正的人類嗎?

不過，小冰公司 CEO 李笛此前曾表示，AI 的聲音太接近真人，就很有可能被濫用。因此小冰禁止為普通個人訓(xùn)練聲音。

但這樣的技術(shù)，也正在通過電臺、便利店等更多商業(yè)場景，走進(jìn)人們的日常生活。

參考鏈接：

[1] 論文地址：https://openreview.net/forum?id=0NQwnnwAORi

[2]https://blogs.nvidia.com/blog/2021/08/31/conversational-ai-research-speech-synthesis-interspeech/

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

值得買科技榮獲卓越發(fā)展大獎，創(chuàng)新驅(qū)動消費(fèi)產(chǎn)業(yè)高質(zhì)量發(fā)展

12-19

訊飛智作斬獲獵云網(wǎng)2024“年度生成式AI創(chuàng)新”大獎，AIGC未來可期

12-19

榮耀MagicOS 9.0升級全解析：新功能適配進(jìn)度與長焦拍照優(yōu)化進(jìn)行時

12-19

閃極AI“拍拍鏡”來襲：智能眼鏡新體驗，售價999元起接入大模型

12-19

閃極AI拍拍鏡震撼上市！國內(nèi)首款量產(chǎn)，售價僅999元起

12-19

蘋果中國AI大模型合作引關(guān)注，字節(jié)騰訊誰將脫穎而出？

值得一題的是，12月19日，北京智源人工智能研究院（智院研究員）發(fā)布國內(nèi)外100余個開源和商業(yè)閉源模型多份評測結(jié)果，作為今年英偉達(dá)全球第二大買家、擁有23萬張GPU的字節(jié)跳動豆包大模型名列前茅，語言模型結(jié)果…

12-19

張一鳴私募新動作，重心已悄然轉(zhuǎn)向大模型與AI戰(zhàn)略？

12-19

算力硬件引領(lǐng)市場熱潮，豆包概念股能否持續(xù)走強(qiáng)？

12-19

市場分化算力硬件爆發(fā)，抖音微信小店概念股活躍，后市如何演繹？

12-19

北證50深V反轉(zhuǎn)，AI硬件與微信小店成市場新寵？

12-19

OpenAI Canvas大升級：React渲染與文本格式化新工具來襲

12-19

OpenAI新招！ChatGPT熱線電話服務(wù)上線，老年機(jī)座機(jī)也能聊

12-19

AMD蘇姿豐領(lǐng)投，Liquid AI崛起：機(jī)器人之母帶隊，AI賽道再掀狂瀾

12-19

AI創(chuàng)業(yè)熱潮下，清北復(fù)交畢業(yè)生都偏愛在哪座城市扎根？

12-19

小紅書搜索量激增，百度MEG能否避免重蹈極越覆轍？

12-19

點擊查看更多 +

全站最新

TCL萬象分區(qū)技術(shù)：Mini LED電視畫質(zhì)躍升的新篇章

挪威電動車熱銷，特斯拉陶琳：寒冷地區(qū)電動車可完全替代燃油車

寶馬Skytop M8 Targa限量版來襲，概念車終成真！

蕪湖造心臟，驅(qū)動國家級無人直升機(jī)救援平臺展雄風(fēng)！

《黑神話：悟空》獲贊，海信E8共繪中國文化出海新篇章

值得買科技榮獲卓越發(fā)展大獎，創(chuàng)新驅(qū)動消費(fèi)產(chǎn)業(yè)高質(zhì)量發(fā)展

熱門內(nèi)容

本欄最新

值得買科技榮獲卓越發(fā)展大獎，創(chuàng)新驅(qū)動消費(fèi)產(chǎn)業(yè)高質(zhì)量發(fā)展

訊飛智作斬獲獵云網(wǎng)2024“年度生成式AI創(chuàng)新”大獎，AIGC未來可期

榮耀MagicOS 9.0升級全解析：新功能適配進(jìn)度與長焦拍照優(yōu)化進(jìn)行時

閃極AI“拍拍鏡”來襲：智能眼鏡新體驗，售價999元起接入大模型

閃極AI拍拍鏡震撼上市！國內(nèi)首款量產(chǎn)，售價僅999元起

算力硬件引領(lǐng)市場熱潮，豆包概念股能否持續(xù)走強(qiáng)？

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

英偉達(dá)用 AI 給紀(jì)錄片配音：情緒節(jié)奏穩(wěn)穩(wěn)拿捏，不說根本聽不出來

英偉達(dá)用 AI 給紀(jì)錄片配音：情緒節(jié)奏穩(wěn)穩(wěn)拿捏，不說根本聽不出來