ITBear旗下自媒體矩陣:

DBRX重磅來(lái)襲:開(kāi)源AI界的新霸主,超越GPT-3.5的壯舉!

   時(shí)間:2024-03-31 15:25:33 來(lái)源:ITBEAR編輯:瑞雪 發(fā)表評(píng)論無(wú)障礙通道

【ITBEAR科技資訊】3月31日消息,近日,Databricks發(fā)布了一款全新的通用大語(yǔ)言模型DBRX,被譽(yù)為“當(dāng)前最強(qiáng)開(kāi)源AI”。據(jù)悉,在各種嚴(yán)格的基準(zhǔn)測(cè)試中,該模型的表現(xiàn)均超越了“市面上所有的開(kāi)源模型”。

DBRX是一款基于Transformer架構(gòu)的大語(yǔ)言模型,它采用了先進(jìn)的MoE(Mixture of Experts)技術(shù),并配備了驚人的1320億個(gè)參數(shù)。更該模型在龐大的12T Token源數(shù)據(jù)上進(jìn)行了深入的預(yù)訓(xùn)練。

據(jù)ITBEAR科技資訊了解,研究人員對(duì)DBRX進(jìn)行了全面的測(cè)試。與LLaMA2-70B、Mixtral、Grok-1等市場(chǎng)上主流的開(kāi)源模型相比,DBRX在語(yǔ)言理解(MMLU)、程式設(shè)計(jì)(Humaneval)以及數(shù)學(xué)邏輯(GSM8K)等多個(gè)關(guān)鍵基準(zhǔn)測(cè)試上均展現(xiàn)出了卓越的性能。DBRX在上述三項(xiàng)基準(zhǔn)測(cè)試中的表現(xiàn)甚至超越了行業(yè)巨頭OpenAI的GPT-3.5。

Databricks AI部門(mén)副總裁Naveen Rao向知名科技媒體TechCrunch透露,DBRX的研發(fā)過(guò)程歷時(shí)兩個(gè)月,并投入了高達(dá)1000萬(wàn)美元的成本。雖然DBRX在各項(xiàng)測(cè)試中取得了令人矚目的成績(jī),但目前該模型仍需要使用四塊英偉達(dá)H100 GPU才能運(yùn)行,這意味著在未來(lái)仍有進(jìn)一步的優(yōu)化空間。

標(biāo)簽: Databricks
舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類(lèi)資訊
全站最新
熱門(mén)內(nèi)容
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報(bào)  |  開(kāi)放轉(zhuǎn)載  |  滾動(dòng)資訊  |  English Version