【ITBEAR】在RTE2024第十屆實時互聯(lián)網(wǎng)大會的舞臺上,聲網(wǎng)的首席科學(xué)家兼CTO鐘聲帶來了一場引人深思的演講。他深入探討了AI基礎(chǔ)設(shè)施的進化趨勢,以及AI應(yīng)用在未來社會的廣泛前景。
鐘聲指出,隨著技術(shù)的進步,AI分身和AI助手將成為可能,它們能夠極大地緩解人們時間上的稀缺性,并提升生活的整體體驗。他特別強調(diào)了分布式端邊云結(jié)合的AI系統(tǒng),這種系統(tǒng)將計算和傳輸在各節(jié)點進行合理配置,智能地根據(jù)任務(wù)需求進行編排,從而降低成本,提高效率。
在探討信息傳播與消費的歷史演變時,鐘聲提到了印刷技術(shù)如何改變?nèi)祟悮v史的走向,以及互聯(lián)網(wǎng)如何進一步提升了信息傳播的效率和范圍。他認(rèn)為,現(xiàn)在我們正處于一個新時代,生成式AI的快速發(fā)展正打破內(nèi)容生成的瓶頸,為用戶帶來更加個性化和沉浸式的體驗。
鐘聲也坦誠地談到了當(dāng)前AI大模型面臨的挑戰(zhàn),包括高昂的成本、隱私保護的問題以及用戶體驗的局限性。他提出,分布式端邊云結(jié)合的AI系統(tǒng)正是解決這些問題的關(guān)鍵。這種系統(tǒng)不僅能有效降低成本,還能在技術(shù)機制層面為隱私數(shù)據(jù)提供更好的保護,并優(yōu)化用戶體驗。
在演講中,鐘聲還現(xiàn)場演示了一個由STT、LLM、TTS、RTC四個模塊組成的端邊結(jié)合實時對話AI智能體。這個智能體在復(fù)雜的噪聲環(huán)境下表現(xiàn)出了出色的對話能力,展示了實時AI對話技術(shù)的巨大潛力。
鐘聲還探討了未來AI基礎(chǔ)設(shè)施的要素,包括允許多云策略、深度異構(gòu)計算模型的優(yōu)化,以及生成式視頻模型的新思路。他強調(diào),這些技術(shù)的發(fā)展將極大地拓展AI的應(yīng)用范圍,并提升用戶體驗。
最后,鐘聲以meta最新推出的AR眼鏡Orin為例,展望了未來端設(shè)備的多樣化和能力提升將如何推動AI技術(shù)的普及和應(yīng)用。他相信,隨著AI技術(shù)的不斷發(fā)展和優(yōu)化,我們將能夠利用AI分身和AI助手更有效地服務(wù)和幫助人們,從而創(chuàng)造更加美好的未來。