【ITBEAR】9月12日消息,生數(shù)科技CEO唐家渝在近日舉辦的媒體開放日活動中,揭示了公司旗下產(chǎn)品VIDU所采用的“U-ViT架構(gòu)”與行業(yè)內(nèi)其他視頻大模型的異同,并表達了對于AI視頻技術(shù)普及的樂觀態(tài)度。
唐家渝指出,盡管U-ViT架構(gòu)與某些模型的底層技術(shù)有相似之處,但生數(shù)科技在模型設(shè)計上更注重實際應用與落地。他通過類比語言模型的發(fā)展,強調(diào)了即便在相同的技術(shù)架構(gòu)下,不同公司在技術(shù)細節(jié)、實踐經(jīng)驗以及破解難點上的能力差異,將決定最終模型性能的優(yōu)劣。
據(jù)ITBEAR了解,生數(shù)科技自2023年3月成立以來,已迅速完成了新一輪融資,并與清華大學聯(lián)合研發(fā)出原創(chuàng)視頻大模型Vidu。該模型面向全球發(fā)布后,短短時間內(nèi)便收到了數(shù)萬個API接入申請,顯示出市場對AI視頻技術(shù)的強烈需求。
在商業(yè)模式上,唐家渝透露,生數(shù)科技目前主要采取SaaS訂閱和MaaS兩種模式。他解釋稱,SaaS模式通過提供免費的額度吸引用戶,而更高級的功能則需要支付訂閱費用;MaaS模式則是針對那些需要將視頻生成能力集成到自身工作流程中的客戶。
談及AI視頻的市場前景,唐家渝認為,盡管當前的主要使用者仍是專業(yè)用戶,如電影工作者等,但AI視頻技術(shù)已經(jīng)來到了普及的臨界點。他通過攝影技術(shù)的演變類比,指出AI視頻正在降低創(chuàng)作門檻,使更多人能夠輕松駕馭這一工具。
此外,唐家渝還透露了生數(shù)科技在技術(shù)研發(fā)方面的最新進展。他表示,公司正在不斷提升模型能力,以突破當前視頻生成技術(shù)的天花板。例如,通過增強模型對復雜結(jié)構(gòu)的生成成功率,以及提升在動態(tài)場景中的表現(xiàn)等。
最后,他強調(diào),在推動技術(shù)原創(chuàng)性和突破性的同時,生數(shù)科技也注重商業(yè)化的平衡發(fā)展。公司正計劃將Vidu的生成時長擴展得更長,以滿足更多創(chuàng)作需求,但同時也會根據(jù)市場反饋和實用角度來調(diào)整產(chǎn)品化的優(yōu)先級。
#生數(shù)科技# #VIDU# #AI視頻# #U-ViT架構(gòu)# #技術(shù)普及#