ITBear旗下自媒體矩陣:

智譜清言App新功能上線,CogView3-Plus文生圖模型來了?

   時間:2024-10-14 14:07:57 來源:ITBEAR作者:鐘景軒編輯:瑞雪 發(fā)表評論無障礙通道

【ITBEAR】智譜技術(shù)團(tuán)隊(duì)近日宣布,其最新研發(fā)的文生圖模型CogView3及CogView3-Plus-3B已正式開源,并已在“智譜清言”App上線。這一系列模型展現(xiàn)了強(qiáng)大的文本到圖像的生成能力。

CogView3模型基于級聯(lián)擴(kuò)散機(jī)制,分為三階段:首先生成512x512低分辨率圖像,然后通過中繼擴(kuò)散過程實(shí)現(xiàn)2倍超分辨率,最終生成2048x2048高分辨率圖像。

據(jù)官方介紹,CogView3在人工評估中表現(xiàn)卓越,比目前最先進(jìn)的開源文本到圖像擴(kuò)散模型SDXL高出77.0%,且推理時間僅需SDXL的約十分之一。

而CogView3-Plus模型則在CogView3的基礎(chǔ)上,引入了最新的DiT框架,采用Zero-SNR擴(kuò)散噪聲調(diào)度,并加入文本-圖像聯(lián)合注意力機(jī)制,進(jìn)一步提升了整體性能。

CogView3及CogView3-Plus-3B的開源倉庫地址分別為:https://github.com/THUDM/CogView3 和 https://huggingface.co/THUDM/CogView3-Plus-3B,同時在ModelScope平臺也可獲?。篽ttps://modelscope.cn/models/ZhipuAI/CogView3-Plus-3B

舉報(bào) 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報(bào)  |  開放轉(zhuǎn)載  |  滾動資訊  |  English Version