ITBear旗下自媒體矩陣:

商湯“日日新 5o”模型發(fā)布,交互效果直追GPT-4o,開啟智能新紀(jì)元

   時間:2024-07-05 14:19:27 來源:ITBEAR編輯:茹茹 發(fā)表評論無障礙通道

【ITBEAR科技資訊】7月5日消息,商湯科技今日正式發(fā)布了全新的“日日新 SenseNova 5.5”大模型體系,并同時推出了國內(nèi)首款所見即所得模型“日日新 5o”。該模型以其卓越的交互效果,直接對標(biāo)業(yè)界領(lǐng)先的GPT-4o。

“日日新 5o”通過深度整合聲音、文本、圖像和視頻等多種形式的跨模態(tài)信息,為用戶帶來了一種前所未有的AI交互體驗(yàn)——實(shí)時的流式多模態(tài)交互。這種交互方式賦予了模型聽、看以及尋找話題的能力,使其在與用戶的溝通中表現(xiàn)得如同一個真實(shí)的對話伙伴。

據(jù)ITBEAR科技資訊了解,“日日新 5o”的交互模式在實(shí)時對話和語音識別等領(lǐng)域具有廣泛的應(yīng)用前景。其強(qiáng)大的多任務(wù)處理能力使得它可以在同一模型中同時處理多種任務(wù),并且能夠根據(jù)不同的上下文環(huán)境靈活地調(diào)整其響應(yīng)和行為。

作為國內(nèi)首個流式原生多模態(tài)交互模型,“日日新 5.5”的推出無疑是一個重要的里程碑。該模型基于超過10TB的高質(zhì)量訓(xùn)練數(shù)據(jù),其中包括大量精心合成的人工數(shù)據(jù),構(gòu)建起了復(fù)雜而高效的高階思維鏈。通過采用創(chuàng)新的混合端云協(xié)同架構(gòu),“日日新 5.5”擁有高達(dá)6000億的參數(shù),從而確保了模型能夠在云端和邊緣端之間實(shí)現(xiàn)最佳協(xié)同,提供高達(dá)109.5字/秒的快速推理能力。

此外,商湯科技在本次發(fā)布會上還揭曉了另一項(xiàng)重要創(chuàng)新——可控人物視頻生成大模型Vimi。這款面向消費(fèi)者用戶的大模型僅需一張任意風(fēng)格的照片,便能生成與目標(biāo)動作高度一致的人物視頻。Vimi支持通過多種方式進(jìn)行驅(qū)動,包括現(xiàn)有的人物視頻、動畫、聲音以及文字等,為用戶提供了極大的創(chuàng)作靈活性。

舉報(bào) 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報(bào)  |  開放轉(zhuǎn)載  |  滾動資訊  |  English Version