滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 人工智能 > 正文內(nèi)容

清華AI創(chuàng)企無(wú)問(wèn)芯穹開(kāi)源：端側(cè)全模態(tài)理解模型Megrez-3B-Omni震撼登場(chǎng)

時(shí)間：2024-12-16 17:19:22 來(lái)源：ITBEAR編輯：快訊團(tuán)隊(duì) 發(fā)表評(píng)論無(wú)障礙通道

近日，清華背景的AI基礎(chǔ)設(shè)施創(chuàng)新企業(yè)無(wú)問(wèn)芯穹宣布了一項(xiàng)重大開(kāi)源舉措，正式推出了針對(duì)端側(cè)設(shè)備設(shè)計(jì)的全模態(tài)理解小模型Megrez-3B-Omni，以及它的純語(yǔ)言模型版本Megrez-3B-Instruct。這一舉動(dòng)標(biāo)志著無(wú)問(wèn)芯穹在推動(dòng)人工智能技術(shù)在移動(dòng)端設(shè)備上的應(yīng)用邁出了重要一步。

Megrez-3B-Omni是專為手機(jī)、平板等端側(cè)設(shè)備量身打造的，其30億參數(shù)的規(guī)模被視為端側(cè)設(shè)備的“黃金尺寸”。這一模型不僅在結(jié)構(gòu)上緊湊高效，而且在單模態(tài)版本的推理速度上，相較于同精度模型，實(shí)現(xiàn)了最高300%的性能提升。更Megrez-3B-Omni具備圖片、音頻、文本三種模態(tài)數(shù)據(jù)的處理能力，并在多個(gè)測(cè)評(píng)基準(zhǔn)中取得了同尺寸下的最優(yōu)性能。

在實(shí)際應(yīng)用中，Megrez-3B-Omni的多模態(tài)能力展現(xiàn)出了極高的靈活性和響應(yīng)速度。例如，用戶可以先拍攝一張單據(jù)照片發(fā)送給模型，詢問(wèn)“6個(gè)人AA人均多少錢(qián)”，隨后通過(guò)語(yǔ)音輸入要求它編寫(xiě)一個(gè)幽默文案催促大家交錢(qián)，模型能夠立即按要求生成文案。這種無(wú)縫切換模態(tài)的能力，大大提升了用戶體驗(yàn)。

與市場(chǎng)上其他模型相比，Megrez-3B-Omni在主流基準(zhǔn)測(cè)試集上的表現(xiàn)毫不遜色。無(wú)論是與同樣三模態(tài)的VITA、Baichuan-Omni-7B，還是雙模態(tài)的MiniCPM-V 2.6、Qwen2系列模型，以及單一模態(tài)的Qwen、Baichuan等模型相比，Megrez-3B-Omni都展現(xiàn)出了強(qiáng)大的競(jìng)爭(zhēng)力。

Megrez-3B-Instruct版本還提供了WebSearch功能，支持調(diào)用外部工具進(jìn)行網(wǎng)頁(yè)搜索，進(jìn)一步增強(qiáng)了模型的信息獲取和回答問(wèn)題的能力。這一功能使得用戶能夠構(gòu)建屬于自己的AI搜索系統(tǒng)，克服小模型在知識(shí)儲(chǔ)備方面的局限。

無(wú)問(wèn)芯穹由清華大學(xué)電子工程系教授汪玉發(fā)起，其技術(shù)團(tuán)隊(duì)源自清華大學(xué)電子工程系NICS-EFC實(shí)驗(yàn)室，在模型壓縮、推理加速及硬件能耗優(yōu)化等領(lǐng)域擁有深厚的學(xué)術(shù)研究和工程實(shí)踐經(jīng)驗(yàn)。公司致力于成為大模型時(shí)代的首選“算力運(yùn)營(yíng)商”，以“釋放無(wú)穹算力，讓AGI觸手可及”為使命。

自成立以來(lái)，無(wú)問(wèn)芯穹已經(jīng)取得了一些規(guī)?；杖?，主要來(lái)自算力銷售。公司計(jì)劃明年進(jìn)一步擴(kuò)大市場(chǎng)份額，并推出端側(cè)大模型推理處理器LPU的IP形式，與合作伙伴共同發(fā)布芯片，進(jìn)行落地嘗試。內(nèi)部測(cè)算顯示，無(wú)問(wèn)芯穹有望在3到5年內(nèi)實(shí)現(xiàn)盈利。

在圖像理解方面，Megrez-3B-Omni以3B的參數(shù)規(guī)模，實(shí)現(xiàn)了全面超過(guò)34B模型的綜合性能表現(xiàn)。在場(chǎng)景理解、OCR等任務(wù)上，該模型能夠準(zhǔn)確洞察和分析圖像內(nèi)容，高效提取文本信息。即便是模糊截圖或復(fù)雜手寫(xiě)字照片，模型也能快速識(shí)別并提取關(guān)鍵信息。

在文本理解方面，Megrez-3B-Omni同樣表現(xiàn)出色。作為全模態(tài)理解模型，該模型沒(méi)有犧牲文本處理能力，反而以更少的資源消耗實(shí)現(xiàn)了更高的性能輸出。在C-eval、MMLU/MMLU Pro、AlignBench等多個(gè)權(quán)威測(cè)試集上，該模型取得了端上模型最優(yōu)精度。

在語(yǔ)音理解方面，Megrez-3B-Omni支持中文和英文的語(yǔ)音輸入，能夠處理復(fù)雜的多輪對(duì)話場(chǎng)景，并支持對(duì)輸入圖片或文字的語(yǔ)音提問(wèn)，實(shí)現(xiàn)不同模態(tài)間的自由切換。用戶可以就任意模態(tài)內(nèi)容發(fā)出語(yǔ)音指令，模型能夠根據(jù)指令快速響應(yīng)。

Megrez-3B-Instruct的WebSearch功能使得模型能夠智能判斷何時(shí)調(diào)用外部工具進(jìn)行網(wǎng)頁(yè)搜索，輔助回答用戶問(wèn)題。這一功能不僅提升了模型的回答能力，還為用戶提供了更加便捷和個(gè)性化的AI體驗(yàn)。

無(wú)問(wèn)芯穹通過(guò)“端模型+端軟件+端IP”的端上智能一體化解決方案，為端側(cè)設(shè)備提供了更完整、對(duì)硬件利用更高效的智能方案。未來(lái)，隨著技術(shù)的不斷發(fā)展和市場(chǎng)的深入拓展，無(wú)問(wèn)芯穹有望在推動(dòng)端側(cè)智能方面發(fā)揮更加重要的作用。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0

更多>同類資訊

高德地圖紅綠燈AI領(lǐng)航：從讀秒到智能引導(dǎo)，駕車出行新體驗(yàn)！

01-12

谷歌加速AI布局，AI Studio團(tuán)隊(duì)并入DeepMind力促項(xiàng)目提效

01-11

京東健康發(fā)布“AI京醫(yī)”大模型，分診準(zhǔn)確率高達(dá)99.5%引領(lǐng)醫(yī)療智能化

01-11

微軟DirectX新動(dòng)向：協(xié)作向量助力神經(jīng)渲染技術(shù)跨平臺(tái)發(fā)展

01-11

京東健康首推“AI京醫(yī)”體系，數(shù)字醫(yī)生24小時(shí)在線輔助診療

01-11

ChatGPT被用于開(kāi)發(fā)自動(dòng)射擊炮塔，OpenAI緊急叫停并封號(hào)

01-11

抖音重拳出擊！西藏地震后已清理2萬(wàn)余條AI虛假災(zāi)害視頻

01-11

谷歌、OpenAI等巨頭搶購(gòu)創(chuàng)作者未公開(kāi)視頻，高價(jià)訓(xùn)練AI模型？

01-11

Meta陷版權(quán)風(fēng)波，扎克伯格被曝批AI團(tuán)隊(duì)用盜版數(shù)據(jù)訓(xùn)練模型？

01-11

好大夫在線官宣：正式邁入螞蟻集團(tuán)新時(shí)代！

三言科技1月11日消息，今日，在“2025好大夫峰會(huì)”上，好大夫在線創(chuàng)始人王航宣布好大夫正式加入螞蟻集團(tuán)。 “我要正式向大家報(bào)告一個(gè)消息，好大夫在線已經(jīng)迎來(lái)全新的發(fā)展期，正式加入螞蟻集團(tuán)，這是一場(chǎng)雙向奔赴，我…

01-11

螞蟻集團(tuán)與好大夫在線攜手，醫(yī)療服務(wù)AI化新篇章開(kāi)啟！

01-11

扎克伯格炮轟蘋(píng)果：靠舊發(fā)明吃老本，創(chuàng)新乏力？

01-11

微軟rStar-Math技術(shù)助力，小語(yǔ)言模型數(shù)學(xué)推理能力大飛躍！

01-11

抖音重拳出擊！AI生成災(zāi)害場(chǎng)景，23652條不實(shí)信息被嚴(yán)處

01-11

周鴻祎：放棄大模型執(zhí)念，專注應(yīng)用之路同樣偉大

01-11

點(diǎn)擊查看更多 +

全站最新

手機(jī)截圖小技巧：多種方法任你選，隱私安全需注意！

手機(jī)卡頓不用愁，這些妙招讓你手機(jī)流暢如新！

輕松掌握！手機(jī)電量顯示設(shè)置全攻略

比亞迪e7純電新車上演實(shí)力秀，簡(jiǎn)約設(shè)計(jì)與強(qiáng)勁動(dòng)力能否征服市場(chǎng)？

手機(jī)電量一目了然，設(shè)置教程來(lái)啦！輕松掌握電量情況

手機(jī)卡頓不用愁，這些妙招讓你手機(jī)重獲新生！

熱門(mén)內(nèi)容

本欄最新

高德地圖紅綠燈AI領(lǐng)航：從讀秒到智能引導(dǎo)，駕車出行新體驗(yàn)！

京東健康發(fā)布“AI京醫(yī)”大模型，分診準(zhǔn)確率高達(dá)99.5%引領(lǐng)醫(yī)療智能化

ChatGPT被用于開(kāi)發(fā)自動(dòng)射擊炮塔，OpenAI緊急叫停并封號(hào)

抖音重拳出擊！西藏地震后已清理2萬(wàn)余條AI虛假災(zāi)害視頻

螞蟻集團(tuán)與好大夫在線攜手，醫(yī)療服務(wù)AI化新篇章開(kāi)啟！

微軟rStar-Math技術(shù)助力，小語(yǔ)言模型數(shù)學(xué)推理能力大飛躍！

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶提供內(nèi)容聽(tīng)讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) · 齊魯軟件園魯ICP備11015305號(hào)-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.