在人工智能領(lǐng)域,2025年正見證著基礎(chǔ)大語言模型能力的顯著增強(qiáng)以及文生視頻大模型的嶄露鋒芒。這一趨勢預(yù)示著AGI(通用人工智能)的實現(xiàn)日益接近,而多模態(tài)大模型的市場引入更是為這一進(jìn)程增添了新的動力。
在這場多模態(tài)技術(shù)的激烈競爭中,全球游戲巨頭騰訊已瞄準(zhǔn)了3D生成技術(shù),以滿足日益增長的游戲研發(fā)需求。1月21日,騰訊正式推出了混元3D生成大模型的2.0版本,并同步上線了業(yè)界首個一站式、低門檻的3D內(nèi)容AI創(chuàng)作平臺——混元AI 3D創(chuàng)作引擎。
騰訊混元3D的負(fù)責(zé)人郭春超在交流會上強(qiáng)調(diào),混元AI 3D創(chuàng)作引擎旨在解決3D創(chuàng)作需求廣泛但創(chuàng)作門檻高的問題。他指出,傳統(tǒng)3D模型的創(chuàng)作成本高昂,即便是最便宜的模型也接近百元,而高端模型甚至可達(dá)數(shù)萬元。這一現(xiàn)狀促使騰訊加速了在AI 3D領(lǐng)域的布局,以期成為行業(yè)的引領(lǐng)者。
相較于去年11月發(fā)布的1.0版本,混元3D生成大模型2.0在功能上有了顯著提升。新版本通過將幾何與紋理解耦生成,使得生成的3D模型在幾何結(jié)構(gòu)上更加精細(xì),紋理色彩更加豐富。這一改進(jìn)不僅提升了生成效果,也進(jìn)一步拓寬了3D內(nèi)容的應(yīng)用場景。
混元AI 3D創(chuàng)作引擎提供了多種功能,包括基礎(chǔ)模型生成、3D功能矩陣、3D編輯、3D生成工作流以及創(chuàng)作素材庫等。用戶只需通過一句話、提示詞或圖片,即可快速生成3D模型。這一平臺不僅支持游戲開發(fā)、設(shè)計建模等專業(yè)領(lǐng)域的3D生產(chǎn)管線,也為普通愛好者提供了生成UGC 3D內(nèi)容的便捷途徑。
騰訊一直以來都將“產(chǎn)業(yè)實用”作為發(fā)展大模型的核心戰(zhàn)略,而騰訊自身豐富的業(yè)務(wù)場景也為這一戰(zhàn)略的實施提供了實踐機(jī)會。目前,騰訊混元大模型已在內(nèi)部超過700個業(yè)務(wù)場景中落地應(yīng)用,而混元3D生成大模型也已在游戲、社交、騰訊地圖、騰訊云、機(jī)器人等多個業(yè)務(wù)場景進(jìn)行內(nèi)測。
據(jù)透露,混元生成的3D質(zhì)量已經(jīng)能夠滿足部分游戲的3D資產(chǎn)標(biāo)準(zhǔn),包括幾何布線合理性、貼圖準(zhǔn)確性與骨骼蒙皮合理性等。通過混元3D創(chuàng)作平臺的助力,騰訊游戲業(yè)務(wù)的3D資產(chǎn)制作時間成本已從5-10天級別下降到分鐘級。這一改進(jìn)無疑將極大地提升游戲研發(fā)的效率和質(zhì)量。
騰訊游戲在研項目研發(fā)制作人王智剛在交流會上指出,當(dāng)前市面上AI生成的3D模型在游戲研發(fā)中的應(yīng)用仍面臨諸多挑戰(zhàn),如模型面數(shù)控制能力、布線合理性、綁定骨骼的能力以及蒙皮合理性等。這些問題導(dǎo)致絕大部分AI生成的3D模型無法應(yīng)用于游戲中。而混元3D生成大模型在這些方面有了明顯的改善,特別是在面數(shù)控制能力上。
王智剛強(qiáng)調(diào),面數(shù)控制能力對游戲研發(fā)至關(guān)重要。某些游戲項目需要的3D模型可能只有幾千面,但一些大模型只能生成幾萬面,這會導(dǎo)致游戲運行不暢。騰訊混元團(tuán)隊能夠深入理解游戲研發(fā)的生產(chǎn)流程,因此能夠針對真正的痛點進(jìn)行改進(jìn)。而其他團(tuán)隊可能由于缺乏深入的理解或關(guān)注,導(dǎo)致技術(shù)與業(yè)務(wù)應(yīng)用之間存在脫節(jié)。
隨著多模態(tài)成為大模型領(lǐng)域下階段軍備賽的焦點,3D和視頻技術(shù)的成熟度仍有很大的提升空間。郭春超指出,盡管視覺合格率僅用一年時間就從20%提升到60%,發(fā)展非常迅速,但相較于生文和生圖的高合格率,3D和視頻技術(shù)的成熟度和可用性仍處于前半賽場。未來,騰訊混元3D團(tuán)隊將繼續(xù)在技術(shù)上縱向深挖、橫向拓展,以期實現(xiàn)量變引發(fā)的拐點。