【ITBEAR】斯坦福與MIT聯(lián)手推出WonderWorld,為實時生成開放世界游戲帶來革新。該項目實現(xiàn)了從單一圖像出發(fā),在用戶實時交互下生成無限延展的3D場景,極大地縮短了生成時間,將交互式3D世界生成推向?qū)崟r門檻。
用戶只需上傳一張圖片,即可踏入AI創(chuàng)造的虛擬世界。通過移動視角和輸入文本提示,用戶能實時決定探索方向和場景內(nèi)容。無論是魔幻森林、現(xiàn)實都市還是寧靜鄉(xiāng)村,WonderWorld都能迅速呈現(xiàn)。
WonderWorld的核心突破在于其速度。研究團隊開發(fā)的FLAGS場景表示方法,使系統(tǒng)能在短短10秒內(nèi)生成新場景,比現(xiàn)有方法快近100倍。該項目還解決了多個3D場景間常出現(xiàn)的幾何“裂縫”問題。
實驗測試表明,WonderWorld在不同場景類型和視覺風(fēng)格上均表現(xiàn)出色,且明顯優(yōu)于其他基準方法。該項目還展示了從一張輸入圖片接受不同用戶控制生成不同場景內(nèi)容的能力。
WonderWorld由斯坦福大學(xué)吳佳俊團隊與MIT聯(lián)合打造,論文主要作者為斯坦福大學(xué)五年級博士生俞洪興。該項目在硅谷廣受歡迎的Hacker News上也被熱烈討論。