滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

RTE大會十年：聲網(wǎng)如何從實時音視頻拓荒者走向AI融合前沿？

時間：2025-01-08 19:45:54 來源：ITBEAR編輯：快訊團隊 發(fā)表評論無障礙通道

2015年，聲網(wǎng)公司勇敢地邁出了第一步，將WebRTC大會引入中國，成功舉辦了首屆面向國內(nèi)開發(fā)者、業(yè)務人員及用戶的RTC（實時視音頻）大會。在那場大會前夕，時任聲網(wǎng)市場VP及RTC大會主策人的彭小歡，心中滿是對大會能否吸引足夠參與者的忐忑。然而，十年后的今天，這一擔憂早已煙消云散。RTE（實時互聯(lián)網(wǎng)）大會已步入第十個年頭，10月25日，RTE 2024大會如期舉行，現(xiàn)場座無虛席，熱鬧非凡。

在RTE2024大會的現(xiàn)場，國內(nèi)大模型領域的佼佼者紛紛亮相，智譜、MiniMax、零一萬物團隊均現(xiàn)身其中。自ChatGPT發(fā)布以來，智譜和MiniMax分別在B端和C端市場深耕細作，積累了豐富的經(jīng)驗。通義千問團隊也帶著國內(nèi)最大的開發(fā)者生態(tài)，加入了此次RTE大會的討論。AI領域的知名創(chuàng)業(yè)者如賈揚清，這位全球矚目的AI科學家，也在RTE大會的主論壇上分享了他在AI Infra領域創(chuàng)業(yè)18個月后的心得，以及對RTE+AI趨勢的獨到見解。

谷歌、螞蟻、面壁智能、生數(shù)科技、商湯、曠視、WPS、Soul等企業(yè)也在大會上分享了他們在ChatGPT時代下的AI探索成果。今年的RTE大會，大咖云集，AI內(nèi)容占據(jù)了主導地位。

從RTC大會到RTE大會，十年間，聲網(wǎng)始終堅守初心，從未間斷地舉辦這一盛會。如今，RTE大會已成為全球規(guī)模最大的音視頻行業(yè)峰會之一，規(guī)模從最初的一個主會場、一個分論壇和一個workshop，發(fā)展到如今的20多個論壇，觀眾人數(shù)上限一度達到六七千人。據(jù)聲網(wǎng)官方統(tǒng)計，這十年間，大會累計影響了200多萬開發(fā)者，覆蓋了300多個行業(yè)場景，吸引了2000多名專家講師參與分享。

聲網(wǎng)創(chuàng)始人趙斌在大會上表示，生成式AI正在推動IT行業(yè)發(fā)生深刻變革，主要體現(xiàn)在終端、軟件、云和人機界面四個層面，其中AI Native Cloud將成為主流。Lepton AI創(chuàng)始人兼CEO賈揚清也認為，AI是云的第三次浪潮，實時的交流和智能的結(jié)合在用戶體驗環(huán)節(jié)至關重要。

在大會的圓桌討論環(huán)節(jié)，五位嘉賓圍繞AI的6000億美金難題，探討了從AI基礎設施到AI商業(yè)化落地的機會與挑戰(zhàn)。賈揚清認為基于開源架構(gòu)的應用會越來越普遍，而王鐵震則強調(diào)了開源模型的基礎設施和數(shù)據(jù)閉環(huán)的重要性。MiniMax合伙人魏偉分享了模型在藝術和影視等領域的創(chuàng)新應用，面壁智能聯(lián)合創(chuàng)始人及CTO曾國洋則預測未來算力成本將不斷優(yōu)化。

聲網(wǎng)在此次大會上發(fā)布了RTE+AI能力全景圖，從實時AI基礎設施、RTE+AI生態(tài)能力、聲網(wǎng)AI Agent、實時多模態(tài)對話式AI解決方案、RTE+AI應用場景五個維度，全面展示了RTE與AI相結(jié)合的技術能力與應用方案。趙斌指出，生成式AI與RTE結(jié)合帶來的場景創(chuàng)新，將成為下一個十年的主題。

今年5月，GPT-4o的發(fā)布再次引發(fā)了業(yè)內(nèi)的熱議，其展示的實時語音交互能力令人印象深刻。GPT-4o通過采用RTC方案，實現(xiàn)了自然、流暢的低延時語音交互體驗。這一成果再次證明了RTC技術在連接多模態(tài)大模型與實時互動場景中的關鍵作用。

聲網(wǎng)CEO趙斌表示，生成式AI的一個重要發(fā)展方向是向多模態(tài)深度進化。目前，文字訓練數(shù)據(jù)已得到充分利用，而聲音和視覺數(shù)據(jù)的獲取和運用將為大模型提供幾乎無限的數(shù)據(jù)空間。因此，多模態(tài)成為當下的重要發(fā)展方向。在推進多模態(tài)深度進化上，聲網(wǎng)通過與多個行業(yè)伙伴的深度合作，發(fā)現(xiàn)多模態(tài)對話體驗的關鍵在于聲音體驗和人與大模型支持的agent對話時的互動體驗。

趙斌認為，只有把RTE技術運用得足夠好，部署到全球各個云和邊緣節(jié)點，大模型的多模態(tài)能力才能普遍地、高質(zhì)量地走進各種實時互動場景。在這場多模態(tài)帶來的實時對話式AI的競爭中，擁有核心技術和具備行業(yè)解決方案能力的實時音視頻廠商將占據(jù)優(yōu)勢。

OpenAI在10月初發(fā)布了實時API公測版，并公布了三家語音API合作者的身份，其中就包括聲網(wǎng)的兄弟公司Agora。從底層的RTC等音視頻能力來看，Agora和聲網(wǎng)都擁有深厚的技術積累。相較于市面上大部分2-3秒的AI互動延遲實踐，聲網(wǎng)的對話式AI解決方案將對話響應延時優(yōu)化至500毫秒，實現(xiàn)了真實、自然的AI語音交互體驗。

聲網(wǎng)在AI領域的探索并非一時興起，早在四年前，當transformer在學術界嶄露頭角時，聲網(wǎng)就率先將AI技術引入RTE技術棧，用于改善音視頻傳輸保障。如今，聲網(wǎng)正與MiniMax合作，打磨國內(nèi)首個Realtime API，為人工智能體提供流暢、自然的實時語音對話能力。這一創(chuàng)新成果再次證明了聲網(wǎng)在實時音視頻領域的領先地位和深厚的技術實力。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

字節(jié)跳動加速全球化布局，歐洲AI研發(fā)中心即將落地？

01-08

外貿(mào)行業(yè)率先邁入全面AI化，系統(tǒng)升級引領商業(yè)變革新篇章

01-08

英偉達Blackwell服務器全面投產(chǎn)，適配全球數(shù)據(jù)中心超200種配置

01-08

2024，Agent賽道：混亂中探索，生死未卜

以前是無數(shù)個小模型疊加起來服務一個業(yè)務場景，現(xiàn)在是”大模型+小模型”，兩者是泛化能力和精準度的組合，Agent在其中起到了連接的作用，以低代碼項目形式快速搭建起一個應用供客戶使用。合作推進的方式有兩種，一種是…

01-08

手機廠商與APP爭搶用戶數(shù)據(jù)，AI手機發(fā)展面臨隱私與利益分配難題

針對該問題，抖音客服表示，對于涉及消費者的個人信息問題完全可以放心，抖音會保障個人隱私數(shù)據(jù)；美團客服針對各家廠商的示例都是用美團點外賣時表示，平臺對用戶都是有隱私保護的，可以放心使用。視覺的方法也有自己的弊端…

01-08

阿里云通義靈碼AI程序員上線，能否真的10分鐘搞定網(wǎng)頁開發(fā)？

01-08

愛詩科技PixVerse V3.5：10秒生成高質(zhì)量AI視頻，領跑新年創(chuàng)作賽

AI生成的視頻速度一直是用戶關注度高的一個重點，PixVerse新上線的 V3.5 就在速度上卷出了新高度，據(jù)說是全球首個接近實時生成的高質(zhì)量AI 視頻模型。在動漫效果上，看大家的視頻展現(xiàn)也是比較出色的…

01-08

算法治理潮來襲，互聯(lián)網(wǎng)巨頭如何應對？抖音美團等積極行動

至于具體如何治理平臺算法亂象，曾參與“大數(shù)據(jù)殺熟第一案”胡女士訴攜程平臺案的朱曉陽律師認為，“收集并利用與所提供服務無關的個人信息、精細化消費者畫像，并對消費者進行價格歧視,，這種行為超出了法律允許的范圍，…

01-08

百度迎戰(zhàn)UGC巨頭，「AI搜」能否守住搜索基本盤？

而在搜索功能之外，「AI搜」還內(nèi)置了包括智能創(chuàng)作、畫圖修圖、AI閱讀和精選智能體在內(nèi)的不少功能，但大多都只是做了一個集合而已。譬如變清晰功能當前大多都是由手機廠商內(nèi)置的，很少有大模型應用會把這樣的功能內(nèi)置于…

01-08

追覓再掀掃地機革命：仿生多關節(jié)機械手，行業(yè)新里程碑？

01-08

中科原動力B1輪融資近億，全力推進智慧農(nóng)業(yè)新時代

01-08

智平方完成數(shù)億Pre-A輪融資，通用智能機器人Alpha Bot引領行業(yè)創(chuàng)新

01-08

微軟裁員風暴來襲，嚴管績效能否助其破局？

01-08

CES 2025：易微聯(lián)攜創(chuàng)新方案亮相，攜手制造商共拓全球市場

01-08

華為DevEco CodeGenie：AI助力鴻蒙萬能卡片開發(fā)，效率倍增

01-08

點擊查看更多 +

全站最新

電車與油車輪胎大不同，這些差異你真的了解嗎？

禾賽科技裁員背后：訂單不斷卻難掩虧損困境，未來何去何從？

老舊電車報廢補貼來襲，電車壽命真的“短命”嗎？

新能源爭霸，智能化決戰(zhàn)！自主品牌車企2025銷量目標大揭秘

老牌人氣股卷土重來，A字走勢后漲停頻現(xiàn)，短線資金活躍布局哪些方向？

哪吒汽車官網(wǎng)異常真相：服務器升級遇技術故障，已恢復并警告造謠自媒體

熱門內(nèi)容

本欄最新

阿里云通義靈碼AI程序員上線，能否真的10分鐘搞定網(wǎng)頁開發(fā)？

愛詩科技PixVerse V3.5：10秒生成高質(zhì)量AI視頻，領跑新年創(chuàng)作賽

算法治理潮來襲，互聯(lián)網(wǎng)巨頭如何應對？抖音美團等積極行動

百度迎戰(zhàn)UGC巨頭，「AI搜」能否守住搜索基本盤？

追覓再掀掃地機革命：仿生多關節(jié)機械手，行業(yè)新里程碑？

中科原動力B1輪融資近億，全力推進智慧農(nóng)業(yè)新時代

本網(wǎng)站LOGO小熊標志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

RTE大會十年：聲網(wǎng)如何從實時音視頻拓荒者走向AI融合前沿？

RTE大會十年：聲網(wǎng)如何從實時音視頻拓荒者走向AI融合前沿？