ITBear旗下自媒體矩陣:

豆包視頻生成大模型來了,行業(yè)又要變天了?

   時間:2024-09-24 17:57:37 來源:ITBEAR作者:鐘景軒編輯:瑞雪 發(fā)表評論無障礙通道

【ITBEAR】9月24日消息,字節(jié)跳動旗下火山引擎今日在深圳成功舉辦AI創(chuàng)新巡展,活動中正式推出了兩款全新的大模型:豆包視頻生成-PixelDance與豆包視頻生成-Seaweed。

火山引擎總裁譚待在活動現(xiàn)場發(fā)表講話,強調(diào)視頻生成領域仍面臨諸多挑戰(zhàn),并承諾豆包的兩款新模型將持續(xù)進化,致力于在解決核心問題上探索更多可能性,并加速AI視頻創(chuàng)作的應用落地與拓展。

據(jù)ITBEAR了解,豆包視頻生成模型在鏡頭切換方面展現(xiàn)出卓越能力,能夠?qū)崿F(xiàn)自然流暢的多拍動作與復雜的多主體交互?;贒iT架構,該模型支持變焦、環(huán)繞、平搖、縮放、目標跟隨等多種鏡頭語言,同時在鏡頭切換時保持主體、風格、氛圍的一致性。

在畫面風格上,經(jīng)過剪映、即夢AI等技術的持續(xù)迭代,豆包視頻生成模型已具備專業(yè)級的光影布局和色彩調(diào)和能力。其Transformer結構經(jīng)過深度優(yōu)化,可支持3D動畫、2D動畫、國畫、黑白、厚涂等多種風格,并能適配不同電子設備的屏幕比例,適用于電商營銷、動畫教育、城市文旅、微劇本等多種場景。

目前,新款豆包視頻生成模型正在即夢AI內(nèi)測版中進行小范圍測試,預計未來將逐步開放給所有用戶。

此次活動還見證了豆包大模型家族的其他重要成員發(fā)布,包括豆包音樂模型和同聲傳譯模型,至此,豆包大模型已全面覆蓋語言、語音、圖像、視頻等多種模態(tài)。

火山引擎披露的數(shù)據(jù)顯示,截至9月,豆包語言模型的日均tokens使用量已超過1.3萬億,與5月首次發(fā)布時相比增長了十倍。同時,多模態(tài)數(shù)據(jù)處理量也分別達到每天5000萬張圖片和85萬小時語音。

關鍵詞:#字節(jié)跳動# #火山引擎# #豆包視頻生成模型# #AI創(chuàng)新# #多模態(tài)數(shù)據(jù)處理#

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關于我們  |  聯(lián)系方式  |  版權聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報  |  開放轉(zhuǎn)載  |  滾動資訊  |  English Version