ITBear旗下自媒體矩陣:

阿里云通義萬(wàn)相推出圖像編輯模型ACE,可實(shí)現(xiàn)一鍵P圖

   時(shí)間:2024-11-27 14:54:06 來(lái)源:互聯(lián)網(wǎng)編輯:茹茹 發(fā)表評(píng)論無(wú)障礙通道

近日,阿里云通義萬(wàn)相團(tuán)隊(duì)推出全新的圖像編輯模型ACE,只需說(shuō)一句話就能生成圖片和修改圖片,可應(yīng)用于風(fēng)格化寫真、分鏡制作、室內(nèi)設(shè)計(jì)等場(chǎng)景。該模型已面向全球開發(fā)者開源,其局部風(fēng)格化功能已上線通義APP。

圖像編輯是圖像生成模型的重要輔助功能,此前業(yè)界常用的方案是將LoRA、ControlNets 和 T2I 模型組合,從而實(shí)現(xiàn)圖像編輯能力。但該方案流程相對(duì)復(fù)雜,且使用門檻較高,大多用戶無(wú)法直接體驗(yàn)。與傳統(tǒng)圖像編輯模型不同,ACE模型可同時(shí)支持文生圖和圖像編輯,用戶輸入口語(yǔ)化指令,可完成可控視覺(jué)編輯、元素編輯、區(qū)域重繪編輯、分層編輯等任務(wù),僅用對(duì)話的方式就能實(shí)現(xiàn)PS的功能,例如輸入文字即可一鍵除水印、修改證件照背景等,極大地提高了編輯效率。

上傳一張照片即可對(duì)圖中特定對(duì)象的風(fēng)格化處理

公開論文顯示,該團(tuán)隊(duì)提出了Long-context Condition Unit模塊(LCU),能支持通用編輯任務(wù)所需的各種多模態(tài)條件輸入,并且搭建了全面的編輯成對(duì)數(shù)據(jù)構(gòu)造鏈路和指令集生成鏈路,最終達(dá)到精準(zhǔn)、高質(zhì)量的圖像指令編輯效果。測(cè)試結(jié)果顯示,ACE模型在MagicBrush的單輪/多輪編輯的多項(xiàng)指標(biāo)和EMU Edit數(shù)據(jù)集的單輪編輯指標(biāo)上都取得了領(lǐng)先成績(jī)。

據(jù)悉,ACE模型在魔搭社區(qū)、Github、Huggingface等開源社區(qū)和社交平臺(tái)引起了國(guó)內(nèi)外開發(fā)者的熱議,一度登上Huggingface周榜第二,總榜第五。同時(shí),該模型局部風(fēng)格化功能已正式上線通義APP,用戶上傳一張照片就能實(shí)現(xiàn)對(duì)圖中特定對(duì)象的風(fēng)格化處理。

ACE登上Huggingface周榜第二,總榜第五

通義萬(wàn)相算法團(tuán)隊(duì)表示:“未來(lái)將進(jìn)一步提升ACE編輯模型的準(zhǔn)確性,同時(shí)將逐步開放重繪、定制化生成、組合生成等能力,讓用戶更便捷地實(shí)現(xiàn)創(chuàng)意設(shè)計(jì)?!? 目前通義萬(wàn)相已推出圖像生成、圖像編輯、視頻生成等能力,累計(jì)生成超2億張圖片。

開源地址:

魔搭社區(qū):https://www.modelscope.cn/models/iic/ACE-0.6B-1024px

Github:https://github.com/ali-vilab/ACE

Huggingface:https://huggingface.co/spaces/scepter-studio/ACE-Chat

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動(dòng)資訊  |  爭(zhēng)議稿件處理  |  English Version