ITBear旗下自媒體矩陣:

CNCC閉幕:國產(chǎn)大模型新進化,橫店點咖啡成真?

   時間:2024-10-28 12:00:53 來源:ITBEAR作者:顧青青編輯:瑞雪 發(fā)表評論無障礙通道

【ITBEAR】在今年的CNCC大會上,智譜科技的一項新技術(shù)引發(fā)了廣泛關(guān)注——AutoGLM,一個能夠模擬用戶在手機和網(wǎng)頁上操作的智能助手。這一創(chuàng)新不僅展示了AI在日常生活中的應(yīng)用潛力,還標(biāo)志著智譜在通往通用人工智能(AGI)道路上的又一重要進展。

智譜發(fā)布的AutoGLM功能強大,現(xiàn)場實測中,用戶只需一句話即可指令A(yù)I在美團上點咖啡,全程無需人工干預(yù),除了付款環(huán)節(jié)。智譜還展示了其最新的GLM-4-Voice情感語音模型,該模型在情感表達(dá)、語音控制等方面表現(xiàn)出色,甚至能模仿多種方言和情緒。

在CNCC的圓桌論壇中,專家們討論了AGI的實現(xiàn)路徑,強調(diào)了多模態(tài)、推理與自我學(xué)習(xí)的重要性。智譜的AutoGLM正是其在工具能力上的新探索,也是其AGI實現(xiàn)路徑的一部分。

智譜的清言情感語音助手在多方面實現(xiàn)了突破,如響應(yīng)速度、情緒感知、情感共鳴等。在實測中,該助手不僅能進行英語陪練,還能切換至日語,甚至能模仿多種方言,如北京腔、臺灣腔、東北腔和粵語。

技術(shù)方面,AutoGLM基于智譜的GLM-4大模型家族,特別是新發(fā)布的GLM-4-Voice情感語音模型。該模型采用端到端的設(shè)計,避免了傳統(tǒng)級聯(lián)方案中的信息損失和誤差積累,擁有更高的建模上限。

智譜在探索AGI的過程中,經(jīng)歷了從單一模態(tài)到多模態(tài)的轉(zhuǎn)變。其AGI路徑注重文本大模型的能力提升,同時逐步融入圖像、視覺、語音等模態(tài),并持續(xù)迭代代碼模型、視頻生成模型等。

智譜CEO張鵬介紹,智譜將人工智能分為L1到L5五個等級,其中L4和L5體現(xiàn)了AI的自我學(xué)習(xí)能力。目前,智譜發(fā)布的手機助手已達(dá)到L3的工具使用階段,并計劃在本月底推出升級版的視頻生成模型CogVideoX-Plus。

智譜內(nèi)部認(rèn)為,目前距離AGI的實現(xiàn)還有很長的路要走。他們根據(jù)大腦的能力,將AGI的技術(shù)維度分為了多個方面,包括多模態(tài)感知與理解能力、長短期記憶能力、深度思考與推理能力、情感與想象力等。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容