近期,科技巨頭谷歌在人工智能領域再次邁出重要一步,正式推出了其最新的視頻生成模型Veo 2。這一創(chuàng)新技術不僅在分辨率和時長上實現(xiàn)了顯著提升,更在視頻的真實感和細節(jié)呈現(xiàn)上取得了突破性進展。
據(jù)了解,Veo 2能夠生成最高達4K(4096 x 2160像素)分辨率的視頻片段,且時長可達2分鐘。與OpenAI的Sora模型相比,Veo 2在分辨率上提升了整整4倍,視頻時長也增加了6倍之多。這一能力無疑為視頻創(chuàng)作領域帶來了全新的可能性,原生4K的直出效果更是令人驚嘆。
Veo 2的強大之處在于,它不僅能夠根據(jù)給定的文本提示或文本與參考圖像生成視頻,還能更真實地模擬物體的運動、流體動力學以及光的屬性。這一點在推特上一位網友分享的切西紅柿對比視頻中得到了直觀體現(xiàn),Veo 2的表現(xiàn)明顯優(yōu)于Sora模型。
谷歌DeepMind團隊在Veo 2的研發(fā)上投入了大量精力,以確保其在保真度、準確度和相機控制方面達到前所未有的水平。Veo 2在細節(jié)呈現(xiàn)上更為真實,偽影現(xiàn)象大幅減少;同時,它更懂得物理世界的運作規(guī)律,能夠遵循詳細的指令,高度準確地表現(xiàn)各種運動場景。Veo 2還具備電影攝影的獨特語言,能夠創(chuàng)建多種拍攝風格、角度和動作,為用戶帶來豐富的視覺體驗。
為了應對Deepfake等技術的潛在風險,DeepMind團隊還開發(fā)了專有的水印技術SynthID。這一技術能夠將隱形標記嵌入到Veo 2生成的幀中,從而確保視頻內容的可追溯性和真實性。這一舉措無疑為視頻內容的版權保護和真實性驗證提供了有力支持。
除了Veo 2之外,谷歌此次還推出了改進版的AI繪圖模型Imagen3。Imagen3在生成圖像方面同樣表現(xiàn)出色,細節(jié)更為豐富,光照效果更為自然,且干擾更少。這一模型的推出,無疑將進一步推動AI繪圖技術的發(fā)展。
Veo 2和Imagen3的推出,標志著谷歌在人工智能領域又邁出了堅實的一步。這兩項技術的創(chuàng)新和應用,將為視頻創(chuàng)作和圖像生成領域帶來全新的變革和機遇。