滾動資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

字節(jié)跳動豆包模型大升級，視覺理解與3D生成能力驚艷亮相

時間：2024-12-18 12:17:36 來源：ITBEAR編輯：快訊團(tuán)隊 發(fā)表評論無障礙通道

近日，字節(jié)跳動在其火山引擎Force大會上，正式揭曉了一項新的技術(shù)成果——豆包視覺理解模型。這一多模態(tài)大模型能力，旨在為企業(yè)提供高效且經(jīng)濟(jì)的視覺處理方案。據(jù)悉，豆包視覺理解模型在處理大量數(shù)據(jù)時展現(xiàn)出了顯著的成本優(yōu)勢，其千tokens輸入價格僅為3厘，換算下來，每處理一張720P的圖片成本不到4分錢，相較于行業(yè)平均水平，價格降低了85%。

在大會現(xiàn)場，字節(jié)跳動還展示了豆包3D生成模型。這款模型與火山引擎的數(shù)字孿生平臺veOmniverse協(xié)同工作，能夠完成從智能訓(xùn)練到數(shù)據(jù)合成，再到數(shù)字資產(chǎn)制作的完整流程。這一組合被字節(jié)跳動譽(yù)為“AIGC創(chuàng)作的物理世界仿真模擬器”，預(yù)示著在數(shù)字內(nèi)容創(chuàng)作領(lǐng)域的一次重要革新。

不僅如此，豆包大模型旗下的多款產(chǎn)品也在此次大會上迎來了更新。其中，豆包通用模型pro全面升級，其功能與GPT-4o不相上下，但使用價格僅為后者的八分之一。音樂模型則新增了生成3分鐘完整音樂作品的能力，為音樂創(chuàng)作提供了更多可能性。文生圖模型也升級到了2.1版本，能夠更精準(zhǔn)地生成漢字，并實現(xiàn)了一句話P圖的功能，目前這一功能已經(jīng)接入了即夢AI和豆包App。

據(jù)字節(jié)跳動透露，豆包視頻生成模型也將在明年春季迎來1.5版本的更新，新版本將具備更強(qiáng)的長視頻生成能力。同時，豆包端到端實時語音模型也即將上線，這一模型將解鎖多角色演繹、方言轉(zhuǎn)換等全新功能，為語音處理領(lǐng)域帶來更多的可能性。

字節(jié)跳動的這一系列動作，無疑展示了其在人工智能領(lǐng)域的深厚積累和持續(xù)創(chuàng)新的能力。隨著豆包大模型及其旗下產(chǎn)品的不斷更新和完善，我們有理由相信，字節(jié)跳動將在未來為更多企業(yè)和個人提供更加智能、高效、經(jīng)濟(jì)的解決方案。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

聯(lián)發(fā)科2024年度盤點(diǎn)：旗艦芯片沖高端，中低端穩(wěn)陣，AI生態(tài)顯神威

12-29

全球AI手機(jī)熱度上升，日本認(rèn)知度墊底，消費(fèi)者購買意愿如何？

12-29

華為“天才少年”入職后如何發(fā)展？彭博：只看貢獻(xiàn)，不論出身資歷

12-29

AI教父預(yù)警：未來30年，人工智能或致人類面臨10%-20%滅絕風(fēng)險？

12-29

谷歌CEO皮查伊：2025年，人工智能Gemini成公司最大關(guān)注點(diǎn)

12-29

OpenAI大動作！營利性子公司將變身特拉華州公益企業(yè)

三言科技12月28日消息，本周五，OpenAI董事會稱目前正評估公司結(jié)構(gòu)，以便更好實現(xiàn)通用人工智能造福人類。 OpenAI計劃將營利性子公司改變性質(zhì)，轉(zhuǎn)變?yōu)樘乩A州公益企業(yè)（PBC），將管理和控制OpenAI…

12-28

榮耀發(fā)布“大王影像”，AI賦能影像新體驗，未來已來？

12-28

北京智源“天寶”仿真線蟲：閉環(huán)探索神經(jīng)與行為奧秘，登《自然》子刊封面

12-28

機(jī)構(gòu)聚焦銅纜高速連接，兆龍互連等熱門股成調(diào)研新寵

12-28

銅纜高速連接概念股火爆！龍頭股頻創(chuàng)新高，機(jī)構(gòu)調(diào)研熱門名單揭曉

12-28

“瑯琊”1.0海洋大模型問世，全球海洋預(yù)報精度獲大幅提升

12-28

DeepMind“可微緩存增強(qiáng)”技術(shù)：大語言模型推理性能躍升新高度

12-28

谷歌CEO皮查伊：2025年挑戰(zhàn)重重，Gemini應(yīng)用推廣成關(guān)鍵之戰(zhàn)

12-28

AI大模型風(fēng)起云涌，安全與治理挑戰(zhàn)何解？

12月28日消息，鈦媒體AGI獲悉，阿里巴巴集團(tuán)于26日聯(lián)合發(fā)布《大模型技術(shù)發(fā)展及治理實踐報告》，再度披露 AI 技術(shù)帶來的治理與安全問題面臨重要挑戰(zhàn)。根據(jù)大模型的技術(shù)特征和應(yīng)用特點(diǎn)，對大模型進(jìn)行有效治理，…

12-28

聯(lián)想天禧AS升級，PC、手機(jī)、平板及IoT終端全面擁抱AI大模型

12-28

點(diǎn)擊查看更多 +

全站最新

太空行走：航天員如何挑戰(zhàn)極限，在宇宙中步步穩(wěn)健？

寶駿旗艦轎車“享境”驚艷亮相，2025上半年開啟中高端市場新征程

華為Mate 70系列升級鴻蒙4.3：裸眼3D新體驗，還能與平板共享網(wǎng)絡(luò)？

理想同學(xué)App上線：Mind GPT大模型賦能的智能助手，功能全解析

榮耀Magic V/Vs折疊屏新升級：YOYO助理智能語音圖片處理來襲！

長安啟源C798亮相：全新外觀配激光雷達(dá)，內(nèi)飾豪華配置曝光

熱門內(nèi)容

本欄最新

聯(lián)發(fā)科2024年度盤點(diǎn)：旗艦芯片沖高端，中低端穩(wěn)陣，AI生態(tài)顯神威

全球AI手機(jī)熱度上升，日本認(rèn)知度墊底，消費(fèi)者購買意愿如何？

華為“天才少年”入職后如何發(fā)展？彭博：只看貢獻(xiàn)，不論出身資歷

榮耀發(fā)布“大王影像”，AI賦能影像新體驗，未來已來？

銅纜高速連接概念股火爆！龍頭股頻創(chuàng)新高，機(jī)構(gòu)調(diào)研熱門名單揭曉

“瑯琊”1.0海洋大模型問世，全球海洋預(yù)報精度獲大幅提升

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

字節(jié)跳動豆包模型大升級，視覺理解與3D生成能力驚艷亮相

字節(jié)跳動豆包模型大升級，視覺理解與3D生成能力驚艷亮相