滾動資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

CNCC見證：國產(chǎn)AI大模型智譜已能現(xiàn)場點咖啡，AGI之路還有多遠(yuǎn)？

時間：2025-01-08 19:49:04 來源：ITBEAR編輯：快訊團(tuán)隊 發(fā)表評論無障礙通道

在今年的中國計算機(jī)大會（CNCC）上，參會者們不僅享受了一場科技盛宴，還意外地體驗了一把由AI帶來的便捷服務(wù)。大會舉辦地——橫店圓明新園，以其宏大的規(guī)模和精美的建筑，給所有參會者留下了深刻印象。然而，園區(qū)之大，也讓不少人感到腿酸腳痛。

面對這一挑戰(zhàn)，有人突發(fā)奇想：能否讓AI在橫店幫我們點一杯咖啡？這個想法很快得到了實現(xiàn)。在CNCC現(xiàn)場，智譜公司發(fā)布了其最新研發(fā)的自主智能體AutoGLM，這一功能強(qiáng)大的手機(jī)操作助手和瀏覽器助手，讓參會者們體驗了一把“動口不動手”的便利。

通過簡單的語音指令，AutoGLM就能打開美團(tuán)，并根據(jù)指令點購咖啡，整個過程中，除了付款環(huán)節(jié)，完全不需要人的參與。這一功能不僅讓參會者們驚嘆不已，更讓他們在現(xiàn)場成功喝上了由AI點購的咖啡。

智譜公司此次發(fā)布的GLM-4-Voice情感語音模型，更是讓人眼前一亮。這一模型不僅擁有極高的響應(yīng)速度和打斷速度，還能準(zhǔn)確感知和共鳴用戶的情緒，其語音表達(dá)更是自然流暢，充滿了“活人感”。在實測中，GLM-4-Voice不僅在英語陪練和日語練習(xí)上表現(xiàn)出色，還能輕松駕馭北京腔、臺灣腔、東北腔和粵語等多種方言。

在CNCC的會場外，參會者們還帶著AutoGLM游覽了橫店知名景點“秦王宮”，并讓它以李白的身份即興作詩一首。小智不負(fù)眾望，創(chuàng)作了一首充滿豪情壯志的詩句，贏得了大家的陣陣掌聲。

除了情感語音助手外，智譜公司還在CNCC上展示了其在AGI（通用人工智能）技術(shù)路徑上的新思考。香港大學(xué)馬毅教授在大會主題圓桌論壇中提到，人類智能有兩個“原生大模型”：DNA和語言，它們都具備自我學(xué)習(xí)的能力。而當(dāng)前的大模型雖然知識豐富，但在智能方面仍有不足。因此，要實現(xiàn)AGI，還需要在多模態(tài)、推理與自我學(xué)習(xí)等方面進(jìn)行深入研究。

智譜公司的AutoGLM，正是其在工具能力上的新研究，也是其AGI實現(xiàn)路徑之一。通過端到端的語音模型，GLM-4-Voice避免了傳統(tǒng)級聯(lián)方案中的信息損失和誤差積累，實現(xiàn)了更高的建模上限。在預(yù)訓(xùn)練方面，智譜將Speech2Speech任務(wù)解耦合為Speech2Text和Text2Speech兩個任務(wù)，并設(shè)計了兩種預(yù)訓(xùn)練目標(biāo)來適配這兩種任務(wù)形式。

智譜公司還對AGI進(jìn)行了深入的思考和探索。他們認(rèn)為，盡管多模態(tài)是實現(xiàn)AGI的必經(jīng)之路，但在多模態(tài)模型的研究中，仍需保持科學(xué)的懷疑和驗證精神。目前，多模態(tài)研究仍存在諸多挑戰(zhàn)，如不同模態(tài)之間的Gap、如何將不同模態(tài)結(jié)合起來等。

智譜公司的AGI路徑是先聚焦文本大模型的能力提升，然后再逐步擴(kuò)展到圖像、視覺、語音等其他模態(tài)。他們不僅注重單一模態(tài)的單點能力提升，還注重雙模態(tài)、多模態(tài)的結(jié)合。目前，智譜的AGI研究已經(jīng)超越了追趕OpenAI的階段，形成了一套自己的技術(shù)指南和路線圖。

在CNCC現(xiàn)場，智譜公司還透露了其即將推出的生成視頻模型CogVideoX的升級版本CogVideoX-Plus。這一新版本將支持60幀幀率、4K畫質(zhì)、10秒時長、任意比例圖生視頻，并大幅提升運(yùn)動穩(wěn)定性。這一消息無疑為參會者們帶來了更多的期待和驚喜。

盡管距離AGI的實現(xiàn)還有很長的路要走，但智譜公司已經(jīng)在這條路上邁出了堅實的步伐。他們的研究和探索不僅為AGI的發(fā)展提供了新的思路和方向，也為人工智能的未來發(fā)展注入了更多的活力和可能。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

騰訊Robotics X：堅守前沿研究，人才流動背后的機(jī)器人未來

01-08

CNCC 2024圓桌論壇：AI+影視創(chuàng)作，是“詩”還是“坑”？

01-08

RTE大會十年：聲網(wǎng)如何從實時音視頻拓荒者走向AI融合前沿？

01-08

字節(jié)跳動加速全球化布局，歐洲AI研發(fā)中心即將落地？

01-08

外貿(mào)行業(yè)率先邁入全面AI化，系統(tǒng)升級引領(lǐng)商業(yè)變革新篇章

01-08

英偉達(dá)Blackwell服務(wù)器全面投產(chǎn)，適配全球數(shù)據(jù)中心超200種配置

01-08

2024，Agent賽道：混亂中探索，生死未卜

以前是無數(shù)個小模型疊加起來服務(wù)一個業(yè)務(wù)場景，現(xiàn)在是”大模型+小模型”，兩者是泛化能力和精準(zhǔn)度的組合，Agent在其中起到了連接的作用，以低代碼項目形式快速搭建起一個應(yīng)用供客戶使用。合作推進(jìn)的方式有兩種，一種是…

01-08

手機(jī)廠商與APP爭搶用戶數(shù)據(jù)，AI手機(jī)發(fā)展面臨隱私與利益分配難題

針對該問題，抖音客服表示，對于涉及消費(fèi)者的個人信息問題完全可以放心，抖音會保障個人隱私數(shù)據(jù)；美團(tuán)客服針對各家廠商的示例都是用美團(tuán)點外賣時表示，平臺對用戶都是有隱私保護(hù)的，可以放心使用。視覺的方法也有自己的弊端…

01-08

阿里云通義靈碼AI程序員上線，能否真的10分鐘搞定網(wǎng)頁開發(fā)？

01-08

愛詩科技PixVerse V3.5：10秒生成高質(zhì)量AI視頻，領(lǐng)跑新年創(chuàng)作賽

AI生成的視頻速度一直是用戶關(guān)注度高的一個重點，PixVerse新上線的 V3.5 就在速度上卷出了新高度，據(jù)說是全球首個接近實時生成的高質(zhì)量AI 視頻模型。在動漫效果上，看大家的視頻展現(xiàn)也是比較出色的…

01-08

算法治理潮來襲，互聯(lián)網(wǎng)巨頭如何應(yīng)對？抖音美團(tuán)等積極行動

至于具體如何治理平臺算法亂象，曾參與“大數(shù)據(jù)殺熟第一案”胡女士訴攜程平臺案的朱曉陽律師認(rèn)為，“收集并利用與所提供服務(wù)無關(guān)的個人信息、精細(xì)化消費(fèi)者畫像，并對消費(fèi)者進(jìn)行價格歧視,，這種行為超出了法律允許的范圍，…

01-08

百度迎戰(zhàn)UGC巨頭，「AI搜」能否守住搜索基本盤？

而在搜索功能之外，「AI搜」還內(nèi)置了包括智能創(chuàng)作、畫圖修圖、AI閱讀和精選智能體在內(nèi)的不少功能，但大多都只是做了一個集合而已。譬如變清晰功能當(dāng)前大多都是由手機(jī)廠商內(nèi)置的，很少有大模型應(yīng)用會把這樣的功能內(nèi)置于…

01-08

追覓再掀掃地機(jī)革命：仿生多關(guān)節(jié)機(jī)械手，行業(yè)新里程碑？

01-08

中科原動力B1輪融資近億，全力推進(jìn)智慧農(nóng)業(yè)新時代

01-08

智平方完成數(shù)億Pre-A輪融資，通用智能機(jī)器人Alpha Bot引領(lǐng)行業(yè)創(chuàng)新

01-08

點擊查看更多 +

全站最新

雷鳥Air 3影音AR眼鏡來襲，1699元開啟全民AR時代新篇章！

RTE大會十年：聲網(wǎng)如何從實時音視頻拓荒者走向AI融合前沿？

iPhone SE 4大升級！4月發(fā)布，售價或不到3642元

CES 2025英偉達(dá)發(fā)布會：黃仁勛8990美元鱷魚紋皮衣成焦點

外貿(mào)行業(yè)率先邁入全面AI化，系統(tǒng)升級引領(lǐng)商業(yè)變革新篇章

英偉達(dá)Blackwell服務(wù)器全面投產(chǎn)，適配全球數(shù)據(jù)中心超200種配置

熱門內(nèi)容

本欄最新

騰訊Robotics X：堅守前沿研究，人才流動背后的機(jī)器人未來

RTE大會十年：聲網(wǎng)如何從實時音視頻拓荒者走向AI融合前沿？

外貿(mào)行業(yè)率先邁入全面AI化，系統(tǒng)升級引領(lǐng)商業(yè)變革新篇章

英偉達(dá)Blackwell服務(wù)器全面投產(chǎn)，適配全球數(shù)據(jù)中心超200種配置

2024，Agent賽道：混亂中探索，生死未卜

手機(jī)廠商與APP爭搶用戶數(shù)據(jù)，AI手機(jī)發(fā)展面臨隱私與利益分配難題

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

CNCC見證：國產(chǎn)AI大模型智譜已能現(xiàn)場點咖啡，AGI之路還有多遠(yuǎn)？

CNCC見證：國產(chǎn)AI大模型智譜已能現(xiàn)場點咖啡，AGI之路還有多遠(yuǎn)？