在人工智能領(lǐng)域,一項令人矚目的新突破正在悄然改變3D場景生成的格局。斯坦福大學(xué)教授李飛飛所帶領(lǐng)的WorldLabs團隊,近期推出了一款名為“空間智能”的模型,該模型僅需單張圖片作為輸入,便能生成一個栩栩如生的3D世界。這一創(chuàng)新成果被視為向空間智能領(lǐng)域邁出的重要一步。
與此同時,國內(nèi)智源研究院也不甘落后,他們推出了一款名為See3D的3D生成模型。這款模型的最大特點在于,它利用了大規(guī)模無標(biāo)注的互聯(lián)網(wǎng)視頻進行學(xué)習(xí),從而實現(xiàn)了從視頻到3D場景的生成。這一技術(shù)的推出,無疑為3D生成領(lǐng)域注入了新的活力。
與傳統(tǒng)的3D生成模型相比,See3D采用了全新的視覺條件技術(shù)。它不再依賴于昂貴的相機參數(shù)標(biāo)注,而是僅通過視頻中的視覺線索來生成相機方向可控且?guī)缀我恢碌亩嘁暯菆D像。這一方法不僅降低了成本,還大大提高了生成效率。
See3D的應(yīng)用范圍非常廣泛。它不僅能夠支持零樣本和開放世界的3D生成,還無需微調(diào)即可執(zhí)行3D編輯、表面重建等任務(wù)。這意味著用戶可以在不需要額外學(xué)習(xí)或調(diào)整的情況下,輕松地進行各種3D創(chuàng)作和應(yīng)用。
See3D還支持從文本、單視圖和稀疏視圖到3D的生成。這一功能為用戶提供了更多的創(chuàng)作選擇,使他們能夠根據(jù)自己的需求,靈活地進行3D場景的生成和編輯。同時,See3D還支持3D編輯與高斯渲染,進一步提升了其在3D創(chuàng)作領(lǐng)域的應(yīng)用價值。
隨著See3D和“空間智能”模型的推出,3D生成領(lǐng)域正迎來一場前所未有的變革。這些新技術(shù)不僅降低了3D生成的門檻,還為用戶提供了更加便捷、高效的創(chuàng)作方式。未來,我們可以期待這些技術(shù)在更多領(lǐng)域得到廣泛應(yīng)用,為人們的生活帶來更多便利和樂趣。