滾動資訊

當前位置：首頁 > 資訊 > 業(yè)界動態(tài) > 正文內(nèi)容

豆包大模型披露2024技術(shù)進展，亮相7個月綜合能力全面對齊GPT-4o

時間：2024-12-30 13:43:06 來源：互聯(lián)網(wǎng)編輯：茹茹 發(fā)表評論無障礙通道

12月30日，字節(jié)豆包大模型對外披露2024全領(lǐng)域技術(shù)進展。距5月15日首次亮相僅7個月，豆包大模型在通用語言、視頻生成、語音對話、視覺理解等方面模型能力均已跨入國際第一梯隊。豆包大模型團隊表示，“從孩童般學(xué)語，到懵懂看世界，到為創(chuàng)作者繪出想象中的奇幻夢境，一切依然處于最早期?！?/p>

截至2024年12月，最新版豆包通用模型Doubao-pro-1215，綜合能力較5月提升32%，已全面對齊GPT-4o，在數(shù)學(xué)、專業(yè)知識等部分復(fù)雜場景任務(wù)中，效果表現(xiàn)甚至更好。通過海量數(shù)據(jù)優(yōu)化、提升模型稀疏度、引入強化學(xué)習(xí)、系統(tǒng)性工程優(yōu)化等方式，團隊大幅提升了Doubao-Pro理解精度和生成質(zhì)量，并實現(xiàn)了性能與效率的平衡，推理服務(wù)價格僅為GPT-4o的八分之一。

Doubao-pro在主流評測集上能力全面對齊GPT-4o

圖像與視頻能力方面，團隊于9月推出兩款豆包視頻生成模型PixelDance與Seaweed，主打復(fù)雜提示詞精準理解、鏡頭一致、多交互主體和鏡頭靈活控制。豆包文生圖模型不斷迭代，還推出了通用圖像編輯能力，讓“一句話P圖”和“一鍵海報生成”成為現(xiàn)實。此外，12月發(fā)布的豆包視覺理解模型Doubao-vision，可融合視覺與語言多感官深度思考和創(chuàng)作，目前模型能力在十多個主流數(shù)據(jù)集上比肩Gemini 2.0與GPT-4o。

Doubao-vision在主流評測集上能力比肩Gemini 2.0、GPT-4o

語音大模型賦予機器“聽”與“說”的能力，豆包大模型團隊今年推出了全新的語音識別模型Seed-ASR和語音生成基座模型Seed-TTS，通過引入多樣、廣泛的數(shù)據(jù)，融合推理鏈，賦予模型極強的泛化性。據(jù)悉，豆包語音模型可聽懂20種以上方言夾雜的對話，也能邊聽邊思考，并在會話中表達情感，保留吞音、口音等人類習(xí)慣，甚至在交互中可隨時被打斷。

較語音更進一步，豆包大模型已擁有高品質(zhì)的“唱作”能力，從詞曲編輯、演奏生成到人聲演唱，“一個AI也可以是一個樂隊”已經(jīng)成為現(xiàn)實。其背后依托的音樂生成模型框架Seed-Music，結(jié)合了語言模型與擴散模型的優(yōu)勢，實現(xiàn)了音樂生成的通用框架，擁有極高的編輯可控性。

團隊還首次對外披露了豆包大模型300萬字窗口的長文本能力，可一次輕松閱讀上百篇學(xué)術(shù)報告，每百萬tokens處理延遲僅需15秒。這一上下文窗口長度和時延水平達到目前業(yè)界極限。背靠STRING等上下文關(guān)聯(lián)數(shù)據(jù)算法和模型加速優(yōu)化，團隊大幅提升了LLM利用海量外部知識的能力，并通過稀疏化及分布式方案將時延降到十秒級。

代碼能力方面，豆包代碼大模型Doubao-coder編程能力達到專業(yè)級，深度支持超16種編程語言、11類真實應(yīng)用場景，可滿足前后端開發(fā)、機器學(xué)習(xí)等全棧編程開發(fā)需求。

成立極短時間內(nèi)，豆包大模型團隊還對AI基礎(chǔ)研究深入布局。過去幾個月，團隊57篇論文中選ICLR、CVPR、NeurIPS等頂會，研究成果包括下載量超百萬的開源項目及GitHub萬星爆款。

豆包大模型團隊披露2024研究關(guān)鍵詞

同時，豆包大模型團隊與近20所高校深入合作，支持超過40位頂尖學(xué)者參與關(guān)鍵AI技術(shù)攻堅，并與清華AIR、北大分別成立聯(lián)合實驗室。為儲備最具潛力的研究人才，豆包大模型團隊啟動了“Top Seed人才計劃”，在全球范圍招募頂尖博士畢業(yè)生加入，共同挑戰(zhàn)世界級AI課題。

根據(jù)披露，豆包大模型相關(guān)技術(shù)能力目前支撐了包括豆包、即夢、豆包MarsCode等50多個C端應(yīng)用場景，其中，豆包APP已成為國內(nèi)最受歡迎的AI產(chǎn)品。通過火山引擎，豆包大模型服務(wù)了30多個行業(yè)，日均tokens調(diào)用量超4萬億，較5月發(fā)布時增長33倍。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

豹8智駕OTA升級，國貨旗艦如何詮釋智勇雙全新時代？

01-01

2024券商資管亮點紛呈，主動管理轉(zhuǎn)型成效顯著成業(yè)績新引擎

01-01

小米智能桌面魚缸上線，279元眾籌享一鍵喂食多模式燈光

01-01

雷軍直播澄清：小米招聘無35歲限制，謠言止于智者

01-01

小米MK71 Pro機械鍵盤來襲，緊湊布局+LCD屏，眾籌今日開啟！

01-01

Win10逆勢上揚！2024年12月全球桌面Windows份額占比超六成

01-01

加州出新規(guī)：未成年人禁看“上癮”信息流，科技巨頭如何應(yīng)對？

01-01

2024主動權(quán)益基金業(yè)績爭霸：雷志勇奪冠，金梓才霸榜前五，AI成最大贏家？

01-01

小米MK 71 Pro機械鍵盤眾籌開啟，71鍵帶屏旋鈕設(shè)計，449元值不值？

01-01

C919啟航！國產(chǎn)大飛機正式開通上海至香港定期商業(yè)航班

01-01

小米MK 71 Pro機械鍵盤眾籌啟航：Gasket結(jié)構(gòu)，雙色鍵帽新體驗

01-01

小米攜手費翔跨年送福，萊卡攝影大賽佳作共賞迎新年！

01-01

國產(chǎn)長鑫DDR5芯片實測：性能不俗，價格親民！

01-01

TikTok Shop東南亞跨境新策：滿足條件退款無需退貨

01-01

一加手表3健康大升級：ECG、60秒體檢，全面守護你的健康

01-01

點擊查看更多 +

全站最新

TCL萬象分區(qū)、絢彩XDR等新技術(shù)加持，讓T6L電視畫質(zhì)業(yè)內(nèi)無敵手

小米造車真相：雷軍稱SU7總投入超300億，研發(fā)超130億

榮耀海外銷量占比達半壁江山，中國手機品牌全球化步伐加快

2024年度十佳游戲揭曉，《奪寶奇兵：古老之圈》再度問鼎冠軍

華碩預(yù)告AMD新主板，AM5接口沿用獲贊，配置有何亮點？

小米汽車加速布局！1月再增16店，全國門店總數(shù)將破216家

熱門內(nèi)容

本欄最新

豹8智駕OTA升級，國貨旗艦如何詮釋智勇雙全新時代？

2024券商資管亮點紛呈，主動管理轉(zhuǎn)型成效顯著成業(yè)績新引擎

小米智能桌面魚缸上線，279元眾籌享一鍵喂食多模式燈光

雷軍直播澄清：小米招聘無35歲限制，謠言止于智者

Win10逆勢上揚！2024年12月全球桌面Windows份額占比超六成

加州出新規(guī)：未成年人禁看“上癮”信息流，科技巨頭如何應(yīng)對？

本網(wǎng)站LOGO小熊標志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

豆包大模型披露2024技術(shù)進展，亮相7個月綜合能力全面對齊GPT-4o

豆包大模型披露2024技術(shù)進展，亮相7個月綜合能力全面對齊GPT-4o