ITBear旗下自媒體矩陣:

Meta 公司展示 CM3Leon:文本指令編輯圖像、生成圖像描述的創(chuàng)新能力

   時間:2023-07-16 17:37:12 來源:ITBEAR編輯:茹茹 發(fā)表評論無障礙通道

【ITBEAR科技資訊】7月16日消息,據(jù)消息來源透露,meta 公司近日宣布研發(fā)出了一款名為CM3Leon的人工智能模型,引起了廣泛關(guān)注。這款模型據(jù)稱在文本到圖像生成方面取得了行業(yè)領(lǐng)先的成果,超越了谷歌和微軟等公司的產(chǎn)品。

CM3Leon是一種基于Transformer的模型,Transformer是一種利用注意力機(jī)制處理輸入數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。相較于其他基于擴(kuò)散的模型,這種基于Transformer的模型更加高效,具備更快的訓(xùn)練速度和更低的計算成本。

meta 公司展示了CM3Leon在多個任務(wù)上的出色表現(xiàn),包括根據(jù)復(fù)雜的文本提示生成圖像、根據(jù)文本指令編輯圖像,以及生成圖像描述和回答。該公司認(rèn)為CM3Leon的問世是圖像生成和理解領(lǐng)域的一大進(jìn)步。

據(jù)ITBEAR科技資訊了解,meta 公司為訓(xùn)練CM3Leon使用了數(shù)百萬張授權(quán)圖片,這些圖片來自Shutterstock。最強大的CM3Leon版本擁有70億個參數(shù),比OpenAI的DALL-E 2模型多出兩倍。

盡管CM3Leon在技術(shù)上取得了顯著的突破,meta 公司也承認(rèn)該模型可能存在數(shù)據(jù)偏見的問題,并呼吁行業(yè)加強透明度和監(jiān)管。關(guān)于CM3Leon是否會公開發(fā)布,目前meta公司尚未透露具體計劃。

CM3Leon的發(fā)布將對圖像生成和理解領(lǐng)域帶來巨大的影響,并為相關(guān)技術(shù)的發(fā)展鋪平道路。這一成果的問世將進(jìn)一步推動人工智能技術(shù)的創(chuàng)新與應(yīng)用,為未來的科技發(fā)展開辟更加廣闊的前景。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報  |  開放轉(zhuǎn)載  |  滾動資訊  |  English Version