全球計算機輔助設(shè)計(CAD)軟件巨頭Autodesk正積極擁抱生成式人工智能(AI)的浪潮,其最新動態(tài)引發(fā)了業(yè)界的廣泛關(guān)注。Autodesk(納斯達克股票代碼:ADSK)的股票在2024年內(nèi)實現(xiàn)了超過20%的漲幅,截至最近交易日報收于293.32美元每股,公司總市值高達630.64億美元。
Autodesk執(zhí)行副總裁兼首席技術(shù)官Raji Arasu在近期的一次公開活動中透露,公司正在開發(fā)一個與眾不同的生成式AI基礎(chǔ)模型。這個被命名為“Bernini”的項目,于2024年5月首次曝光,其獨特之處在于能夠?qū)⑽谋尽⑹掷L草圖等轉(zhuǎn)化為3D文件。盡管圖生3D功能在大型模型市場上已非新鮮事物,如谷歌DeepMind的Genie 2、騰訊的混元以及生數(shù)科技的VoxCraft等都能實現(xiàn)類似功能,但對于Autodesk這樣的CAD行業(yè)領(lǐng)導(dǎo)者而言,Bernini的推出具有深遠的意義。
Bernini以17世紀(jì)意大利著名雕塑家和建筑師Gian Lorenzo Bernini命名,其訓(xùn)練數(shù)據(jù)基于Autodesk AI實驗室與香港中文大學(xué)的合作,涵蓋了1000萬種公開可用的3D形狀。Raji Arasu強調(diào),Bernini與其他基礎(chǔ)大模型的不同之處在于其三大特性:生成的功能性3D結(jié)構(gòu)、形狀與紋理的分離、以及提供多種變體。這些特性使得Bernini能夠生成具有實際功能的3D圖像,如中空的水壺,同時允許用戶自由調(diào)整形狀和紋理,以及從單一輸入生成多個功能性3D形狀變體。
為了實現(xiàn)這些特性,Bernini需要克服設(shè)計和制造過程中的天然障礙,即AI需要完全貼合設(shè)計工作的輸入輸出邏輯。Raji Arasu介紹稱,Bernini能夠接受多模態(tài)輸入,如文本、草圖、體素和點云,這些輸入方式復(fù)制了創(chuàng)作者的設(shè)計過程。由于生成3D CAD這樣的幾何圖形需要基于物理定律的空間和結(jié)構(gòu)進行推理,對精度和準(zhǔn)確性有著極高的要求。
從時間線上看,Bernini的推出并非迅速。自2024年5月曝光以來,經(jīng)過了大半年的研發(fā),才在Autodesk于圣地亞哥舉行的用戶大會上由CEO Andrew Anagnost放出預(yù)覽版。Andrew Anagnost表示,目前Bernini使用公開數(shù)據(jù)進行訓(xùn)練,尚不能用于商業(yè)用途,但已向AI社區(qū)開放。他同時透露了Bernini可能的商業(yè)計劃:訓(xùn)練Bernini的方法不依賴于特定數(shù)據(jù),因此客戶在需要時可以使用自己的數(shù)據(jù)來優(yōu)化模型。
在構(gòu)建Bernini的過程中,Autodesk大量使用了亞馬遜云科技的Amazon SageMaker服務(wù)。Raji Arasu詳細介紹了構(gòu)建過程,包括數(shù)據(jù)處理、數(shù)據(jù)準(zhǔn)備、兼顧成本與效率的模型訓(xùn)練和模型推理的復(fù)雜性管理。Autodesk基于海量的大型設(shè)計文件構(gòu)建了云端數(shù)據(jù)底座,選擇了Amazon DynamoDB作為主要數(shù)據(jù)庫,并創(chuàng)建了規(guī)范數(shù)據(jù)模型。在解決數(shù)據(jù)性能的基礎(chǔ)上,通過結(jié)合Amazon EMR、Amazon EKS、Amazon Glue和Amazon SageMaker等云服務(wù)完成了數(shù)據(jù)準(zhǔn)備流程。在模型訓(xùn)練階段,Autodesk使用Amazon SageMaker解決了實例測試和基礎(chǔ)設(shè)施管理等問題,將更多精力放在了數(shù)據(jù)準(zhǔn)備、模型開發(fā)和面向客戶的AI功能開發(fā)上。在模型推理管理時,Amazon SageMaker的自動縮放和多模型端點實現(xiàn)了高吞吐量、最小延遲和最大成本效率。
Autodesk通過利用Amazon SageMaker等創(chuàng)新技術(shù),成功將基礎(chǔ)模型的部署時間縮短了一半,同時在保持運營成本穩(wěn)定的情況下將AI生產(chǎn)力提高了30%。Raji Arasu透露,Autodesk已經(jīng)開始向客戶推出基于這些基礎(chǔ)模型構(gòu)建的AI功能,旨在幫助客戶平衡材料強度、成本等參數(shù),以確定最佳設(shè)計,從而最大限度地減少繁瑣任務(wù)并提高創(chuàng)造力。
在ChatGPT之后,英偉達GPU成為了各大AI公司競相追逐的熱門資源。然而,從Bernini的誕生過程來看,雖然GPU至關(guān)重要,但數(shù)據(jù)才是決定大模型訓(xùn)練質(zhì)量的關(guān)鍵。訓(xùn)練一個能夠在業(yè)務(wù)中發(fā)揮作用的大模型是一個涉及多方面的全棧系統(tǒng)問題,需要確保生成式AI能夠利用企業(yè)自己的數(shù)據(jù)來增強大模型的能力。
數(shù)據(jù)的重要性不僅體現(xiàn)在大模型的訓(xùn)練中,還加速了企業(yè)數(shù)據(jù)資產(chǎn)的變現(xiàn)方式。例如,中國的3D空間設(shè)計平臺酷家樂母公司群核科技也公布了新的商業(yè)計劃,面向具身智能等領(lǐng)域推出數(shù)據(jù)訓(xùn)練平臺,并開放全球最大的室內(nèi)場景認(rèn)知深度學(xué)習(xí)數(shù)據(jù)集。該公司擁有超過3.2億的3D模型和每月7780萬的活躍訪問者,計劃向AIGC、具身智能、AR/VR等領(lǐng)域的企業(yè)開放物理正確的3D空間數(shù)據(jù)資產(chǎn)、空間認(rèn)知解決方案以及空間智能訓(xùn)練相關(guān)服務(wù)。