滾動資訊

網易云信亮相LiveVideoStackCon2020，分享RTC中AI音頻算法產品化經驗

時間：2020-11-05 17:04:22 來源：上海之聲編輯：星輝 發(fā)表評論無障礙通道

10月31日-11月1日，LiveVideoStackCon2020音視頻技術大會在北京隆重舉辦。本次大會以“多媒體開啟新視界”為主題，聚焦在音頻、視頻、圖像等技術的最新探索與應用實踐，覆蓋教育、娛樂、醫(yī)療、安防、旅游、電商、社交、游戲、智能設備等行業(yè)領域，數(shù)十位業(yè)內知名講師與來自全國各地的音視頻工程師、多媒體工程師、圖像算法工程師、運維與物聯(lián)網工程師等分享了技術創(chuàng)新與最佳實踐。

本次大會中，人工智能相關話題十分火爆，AI已經滲透到多媒體技術的各個環(huán)節(jié)，無論內容生產、編解碼、音視頻前后處理等，AI都有一席之地，甚至被寄予厚望。網易云信資深音頻算法工程師郝一亞博士受邀參會，在“音頻技術：逼近人耳極限”專題會場進行了題為《RTC中AI音頻算法的產品化》的主題演講，并在“5G、AI，新技術與新變革”圓桌論壇中分享了AI在音視頻領域應用的實踐經驗。

主題分享中，郝一亞博士首先介紹了AI在音頻處理中日漸強大的力量。隨著AI在計算機視覺等領域的成功應用，CNN、RNN等深度學習網絡被迅速應用到了音頻領域，AI在音頻降噪、場景分類、回聲控制、盲源分離等方向著發(fā)揮著越來越重要的作用。

雖然AI在音頻領域的價值日漸明顯，但在目前的算法中，特別是RTC音頻中，還沒有被大范圍的應用起來。針對音頻處理中AI的挑戰(zhàn)與局限，郝一亞博士概括為三點。一是計算復雜度。AI模型通常需要巨大的計算量，就目前我們大部分終端設備的計算能力來說壓力很大，對RTC中的實時性提出了考驗。二是泛化能力。AI算法是基于有限的數(shù)據(jù)集訓練出來的，泛化能力有限一直是問題所在。而RTC中覆蓋的業(yè)務場景非常多，AI算法要覆蓋所有場景更是難上加難。三是魯棒性。RTC豐富的應用場景中會有很多突發(fā)情況，對于AI算法魯棒性的要求也非常高。

由于算力、數(shù)據(jù)和AI模型本身的限制，現(xiàn)在AI還達不到替換傳統(tǒng)信號處理方法的階段，但音頻AI在效果上的優(yōu)勢已經被證實。郝一亞博士提出，在RTC領域，要想更好地發(fā)揮出AI的優(yōu)勢，有效規(guī)避不足，進行“模塊化”處理是一個有效的途徑。把端到端、長鏈路的處理拆分，分別找到合適的AI模塊，讓專業(yè)的“人”做專業(yè)的事。

以音頻降噪中的AI算法為例，傳統(tǒng)降噪算法中包含了很多模塊，其中“噪聲估計”模塊很適合做深度學習訓練，特別是針對一些穩(wěn)態(tài)噪聲。在這里，不用端到端地去訓練整個AI模型，而是把這一模塊訓練成單獨的噪聲估計模型。通過模塊化的處理，實現(xiàn)了輕量級模型、簡單的訓練目標以及更適合DNN模型，從而最大程度的發(fā)揮了AI的優(yōu)勢。

郝一亞博士認為，未來越來越多的AI技術將融入到RTC中，一些新的爆發(fā)點可能是更先進的神經網絡模型，更高效的GPU等，但是，有一項關鍵點不會變，那就是大量的數(shù)據(jù)。目前，網易云信已配備了全套工具和環(huán)境采集多種來源的數(shù)據(jù)集用于訓練AI算法，已經在音頻降噪和視頻超分等場景中實踐應用。

2015年10月至今，網易云信一直專注于即時通訊和音視頻技術領域的前沿探索和應用實踐，已幫助100萬企業(yè)開發(fā)者成功發(fā)送10000億條消息，日活突破3億，在百家爭鳴的PaaS市場中實現(xiàn)穩(wěn)中增長。近期，網易云信再度加碼技術能力，全面升級的音視頻通話2.0產品上線，AI等新興技術已融入產品開始服務客戶。未來，網易云信將堅持不斷創(chuàng)新，探索融合通訊領域的新技術、新產品、新應用，與行業(yè)共創(chuàng)美好新時代。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

蕪湖造心臟，驅動國家級無人直升機救援平臺展雄風！

12-19

神策智能運營新升級，如何助力企業(yè)實現(xiàn)高效精準營銷？

12-19

順豐控股11月收入穩(wěn)健增長6.73%，供應鏈及國際業(yè)務增速亮眼

三言科技12月19日消息，今日，順豐控股公告，2024年11月公司速運物流業(yè)務及供應鏈和國際業(yè)務合計收入為251.96億元，較2023年同期236.08億元增長6.73%。其中，速運物流業(yè)務收入為188.02…

12-19

榮耀股東變動引關注，官方稱系股權架構調整

三言科技12月19日消息，近日，多則網傳榮耀新一輪股改已完成。據(jù)媒體報道，榮耀的股東名單已經發(fā)生變更，有國資背景的股東顯示退出。信息顯示，9月剛剛加入的新股東杭州微同股權投資合伙企業(yè)（有限合伙），于11月退出…

12-19

順豐航空引領！國內全貨機首次SAF商業(yè)飛行成功落地

12-19

中央經濟工作會議力推哪些新興經濟模式？

12-19

水滴公司Q3財報亮點：營收穩(wěn)步增長，運營利潤達2650萬

12-19

技嘉冰雕X870I主板全白亮相，AORUS PRO ICE圖賞來襲！

12-19

寵物糧市場亂象頻發(fā)，鏟屎官如何為寵物選對糧？

據(jù)“趣解商業(yè)”了解，“源鮮”曾是網易嚴選、喵梵思等國產中高端品牌多次合作的代工廠，在不少養(yǎng)寵人心中有較高信任度；“源鮮”的塌房，再次挑動了許多養(yǎng)寵人的神經。 Erica還提到，寵糧本質上屬于快消行業(yè)，并不是靠…

12-19

柔韌機器人：具身智能的新賽道與革命性突破？

相比于現(xiàn)階段普遍使用的基于電機關節(jié)、金屬材料、復雜傳感器和精密加工工藝的“剛性”機器人技術，萬勛科技通過使用軟性材料與氣/液驅動，以軟材料仿生肌肉和神經元智能復刻人類肌肉柔韌特性，具備輕巧靈活、安全互動、易…

12-19

北京中關村科學城國際醫(yī)谷開工，打造醫(yī)療健康產業(yè)集聚新高地

作為項目建設推進方，北京海新域城市更新集團相關負責人介紹，中關村科學城國際醫(yī)谷項目將在產業(yè)鏈上游吸引頂尖研發(fā)機構和企業(yè)，匯聚創(chuàng)新源頭力量；在中游通過公共技術服務平臺降低研發(fā)門檻，助力創(chuàng)新的想法實施；在下游建…

12-19

《獵人克萊文》IGN僅評3分，高成本制作卻換來低質口碑？

12-19

中興通訊股價異動，公司稱生產經營正常，無未公開重大信息影響股價

12-19

順豐控股11月速運物流營收微增，供應鏈及國際業(yè)務增長超兩成

12-19

澳門風情畫軸展開，智界新S7穿梭其中成焦點

12-19

點擊查看更多 +

全站最新

TCL萬象分區(qū)技術：Mini LED電視畫質躍升的新篇章

挪威電動車熱銷，特斯拉陶琳：寒冷地區(qū)電動車可完全替代燃油車

寶馬Skytop M8 Targa限量版來襲，概念車終成真！

蕪湖造心臟，驅動國家級無人直升機救援平臺展雄風！

《黑神話：悟空》獲贊，海信E8共繪中國文化出海新篇章

值得買科技榮獲卓越發(fā)展大獎，創(chuàng)新驅動消費產業(yè)高質量發(fā)展

熱門內容

本欄最新

蕪湖造心臟，驅動國家級無人直升機救援平臺展雄風！

神策智能運營新升級，如何助力企業(yè)實現(xiàn)高效精準營銷？

順豐航空引領！國內全貨機首次SAF商業(yè)飛行成功落地

中央經濟工作會議力推哪些新興經濟模式？

水滴公司Q3財報亮點：營收穩(wěn)步增長，運營利潤達2650萬

技嘉冰雕X870I主板全白亮相，AORUS PRO ICE圖賞來襲！

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

網易云信亮相LiveVideoStackCon2020，分享RTC中AI音頻算法產品化經驗

網易云信亮相LiveVideoStackCon2020，分享RTC中AI音頻算法產品化經驗