滾動資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

百川智能全模態(tài)模型Baichuan-Omni-1.5發(fā)布，能否引領(lǐng)AI新潮流？

時間：2025-01-26 15:28:01 來源：ITBEAR編輯：快訊團隊 發(fā)表評論無障礙通道

隨著春節(jié)的腳步日益臨近，國產(chǎn)大模型領(lǐng)域迎來了一波新春大禮包，令人目不暇接。百川智能，作為國產(chǎn)大模型領(lǐng)域的佼佼者，近期頻繁推出新品，從全場景深度推理模型Baichuan-M1-preview到醫(yī)療增強開源模型Baichuan-M1-14B，每一款都引起了業(yè)界的廣泛關(guān)注。

而最新發(fā)布的全模態(tài)模型Baichuan-Omni-1.5，更是被譽為“大模型通才”，以其全面且強大的能力吸引了眾多目光。這款全模態(tài)模型不僅能夠同時處理文本、圖像、音視頻等多種模態(tài)的理解任務(wù)，還支持文本和音頻的雙模態(tài)生成，實現(xiàn)了理解和生成的完美統(tǒng)一。

據(jù)測評結(jié)果顯示，Baichuan-Omni-1.5的多模態(tài)能力整體超越了GPT-4o mini。特別是在百川智能深耕的醫(yī)療領(lǐng)域，該模型在醫(yī)療圖片評測上的表現(xiàn)更是大幅領(lǐng)先，展現(xiàn)了其卓越的專業(yè)能力。這一成就不僅彰顯了百川智能在模型技術(shù)探索上的深厚實力，也為其在醫(yī)療行業(yè)的應(yīng)用落地奠定了堅實基礎(chǔ)。

除了醫(yī)療領(lǐng)域，Baichuan-Omni-1.5在音頻的理解與生成方面同樣表現(xiàn)出色。該模型支持多語言對話，并具備端到端的音頻合成能力，包括ASR（自動語音識別）和TTS（文本轉(zhuǎn)語音）功能。在此基礎(chǔ)上，它還支持音視頻實時交互，進一步提升了用戶體驗。在音頻評測數(shù)據(jù)集上，Baichuan-Omni-1.5的整體表現(xiàn)也遠超其他競品。

百川智能還開源了兩個評測集：OpenMM-Medical和OpenAudioBench，為研究人員和開發(fā)者提供了統(tǒng)一的標(biāo)準數(shù)據(jù)，有助于催生一系列新的語言理解算法和模型架構(gòu)。這些舉措不僅促進了國內(nèi)開源生態(tài)的繁榮，也為Baichuan-Omni-1.5等全模態(tài)模型的應(yīng)用推廣提供了有力支持。

為了實現(xiàn)全模態(tài)模型的理解和生成統(tǒng)一，百川智能的研究團隊在模型結(jié)構(gòu)、訓(xùn)練策略以及訓(xùn)練數(shù)據(jù)等多方面進行了全流程的深度優(yōu)化。在模型結(jié)構(gòu)上，Baichuan-Omni-1.5采用了創(chuàng)新的文本-音頻交錯輸出設(shè)計，使得模型能夠同時生成文本和音頻。同時，為了處理任意分辨率的圖片，該模型還引入了NaViT技術(shù)，全面提升了圖片信息的提取和理解能力。

在數(shù)據(jù)層面，百川智能構(gòu)建了包含3.4億條高質(zhì)量圖片/視頻-文本數(shù)據(jù)和近100萬小時音頻數(shù)據(jù)的龐大數(shù)據(jù)庫，并使用1700萬條全模態(tài)數(shù)據(jù)進行了監(jiān)督微調(diào)（SFT）。為了加強跨模態(tài)理解能力，百川智能還構(gòu)建了高質(zhì)量的視覺-音頻-文本交錯數(shù)據(jù)，并對模型進行了對齊訓(xùn)練。這些舉措共同提升了Baichuan-Omni-1.5的全模態(tài)理解和生成能力。

Baichuan-Omni-1.5的發(fā)布標(biāo)志著AI技術(shù)正在從模型能力向落地應(yīng)用方向發(fā)展。該模型強大的多模態(tài)融合能力將技術(shù)與實際場景緊密結(jié)合，為各行業(yè)的數(shù)字化轉(zhuǎn)型提供了有力支撐。特別是在醫(yī)療行業(yè)，Baichuan-Omni-1.5的理解、生成能力可以用于輔助醫(yī)生診斷，提高診斷準確性和效率，為AI在醫(yī)療場景的應(yīng)用探索開辟了新的道路。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

百度iRAG技術(shù)：萌寵拜年圖也能生成，AI生圖走向?qū)嵱眯聲r代

這項技術(shù)給大模型裝上了一個億級的“視覺外掛知識庫”，在生成圖片時根據(jù)提示詞等信息給大模型查找相關(guān)圖片資源，作為參考數(shù)據(jù)，進而提升圖像生成的準確性，還可降低制作成本。 iRAG技術(shù)就仿佛給大模型加裝了一個“視覺…

01-26

DeepSeek崛起挑戰(zhàn)AI巨頭，開源低成本模式或顛覆英偉達市場地位？

01-26

中美大廠競逐AI智能體，萬億賽道誰將領(lǐng)跑？

智譜推出了AutoGLM、GLM-PC等多個AI智能體應(yīng)用產(chǎn)品；字節(jié)跳動推出的AI應(yīng)用開發(fā)平臺扣子已發(fā)布了超過200萬個智能體，在國內(nèi)處于領(lǐng)先；今年CES上，英偉達CEO黃仁勛也表示，AI Agent應(yīng)用…

01-26

AI軟件市場2024年將膨脹32%至970億美元，未來五年將持續(xù)高漲

01-26

英偉達宣布：Maxwell、Pascal、Volta架構(gòu)GPU CUDA支持即將凍結(jié)

01-26

千億美元“星際之門”項目將部分采用綠能供電，太陽能成首選？

01-26

洛陽博物館奇妙夜：QQ瀏覽器帶你尋寶河洛，穿越最早中國

01-26

DeepSeek-R1發(fā)布，性能媲美OpenAI o1，中國AI黑馬如何震撼美國科技圈？

01-26

遠東控股：綠色發(fā)展新典范，共筑“雙碳”未來夢

01-26

印度出版商向OpenAI發(fā)起版權(quán)訴訟，指控其未經(jīng)授權(quán)使用受保護內(nèi)容

01-26

軟通動力等成立新公司，含AI及物聯(lián)網(wǎng)業(yè)務(wù)

企查查APP顯示，近日，芯通睿思（江西）科技有限公司成立，法定代表人為陳力銘，注冊資本5000萬元，經(jīng)營范圍包含：人工智能基礎(chǔ)資源與技術(shù)平臺，物聯(lián)網(wǎng)應(yīng)用服務(wù)，可穿戴智能設(shè)備銷售，人工智能通用應(yīng)用系統(tǒng)等。企查查…

01-26

芯通睿思科技成立，軟通動力等參股，布局AI與物聯(lián)網(wǎng)新領(lǐng)域

01-26

千億美元“星際之門”項目或?qū)⒂锰柲?電池，解決能源之急？

01-26

馬斯克坦言X公司現(xiàn)狀：用戶增長停滯，收支勉強平衡

正如馬斯克在郵件中提及的那樣，該報道稱，銀行希望利用馬斯克與唐納德?特朗普之間的關(guān)聯(lián)進行宣傳，因為一些不愿透露姓名的投資者可能基于X財務(wù)狀況正在改善這一信念，對收購感興趣。然而，近兩年來，馬斯克一直聲稱公…

01-26

蘋果重振AI團隊，Siri將迎來重大升級？

金?沃拉特（Kim Vorrath）最近助力推出了Vision Pro的軟件，她已在蘋果工作了36年。蘋果此前公布的成果也在緩慢推進，一項能讓Siri 識別屏幕內(nèi)容并采取相應(yīng)操作的重大升級可能要到 iOS …

01-26

點擊查看更多 +

全站最新

《幻獸帕魯》開發(fā)商新設(shè)發(fā)行部，自由合作模式引小型開發(fā)者熱捧

《Pong》加密貨幣疑云！雅達利官方澄清：與我們無關(guān)

美國實體游戲支出大幅下滑，數(shù)字化游戲時代全面來臨？

蛇年新春互動游戲上線，翻啟新歲共尋文化魅力

馬斯克變身游戲主角，力贊《黑神話：悟空》征服全球玩家！

ST凱文游戲業(yè)務(wù)困局：2024年預(yù)計凈虧損4.6億至5.4億，何時能扭虧？

熱門內(nèi)容

本欄最新

DeepSeek崛起挑戰(zhàn)AI巨頭，開源低成本模式或顛覆英偉達市場地位？

中美大廠競逐AI智能體，萬億賽道誰將領(lǐng)跑？

英偉達宣布：Maxwell、Pascal、Volta架構(gòu)GPU CUDA支持即將凍結(jié)

千億美元“星際之門”項目將部分采用綠能供電，太陽能成首選？

洛陽博物館奇妙夜：QQ瀏覽器帶你尋寶河洛，穿越最早中國

DeepSeek-R1發(fā)布，性能媲美OpenAI o1，中國AI黑馬如何震撼美國科技圈？

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

百川智能全模態(tài)模型Baichuan-Omni-1.5發(fā)布，能否引領(lǐng)AI新潮流？

百川智能全模態(tài)模型Baichuan-Omni-1.5發(fā)布，能否引領(lǐng)AI新潮流？