ITBear旗下自媒體矩陣:

百川智能發(fā)布Baichuan 3:超越GPT-4的中文大語言模型新星

   時間:2024-01-29 13:34:38 來源:ITBEAR編輯:快訊團(tuán)隊 發(fā)表評論無障礙通道

【ITBEAR科技資訊】1月29日消息,近日,由前搜狗公司CEO王小川創(chuàng)立的百川智能宣布推出了一款超千億參數(shù)的大語言模型——Baichuan 3。據(jù)稱,該模型在多項中文任務(wù)評測中表現(xiàn)優(yōu)異,甚至在某些方面超越了GPT-4。

在邏輯推理能力的測試中,Baichuan 3展現(xiàn)出了強(qiáng)大的實(shí)力。無論是在MCMLE、MedExam還是CMExam等醫(yī)療領(lǐng)域的評測上,其中文效果均超過了GPT-4,被譽(yù)為“中文醫(yī)療任務(wù)表現(xiàn)最佳的大模型”。這一突破性的進(jìn)展,無疑為中文醫(yī)療信息處理領(lǐng)域注入了新的活力。

據(jù)ITBEAR科技資訊了解,為了訓(xùn)練出如此強(qiáng)大的模型,百川智能團(tuán)隊在Baichuan 3的訓(xùn)練過程中采用了多種創(chuàng)新技術(shù)手段和方案。其中包括“動態(tài)數(shù)據(jù)選擇”、“重要度保持”以及“異步CheckPoint存儲”等,這些技術(shù)的運(yùn)用不僅保證了訓(xùn)練的穩(wěn)定性,還大大縮短了故障恢復(fù)時間,據(jù)悉,故障恢復(fù)可在10分鐘內(nèi)完成。

除了在技術(shù)層面的突破,Baichuan 3還在語義理解和生成能力上進(jìn)行了進(jìn)一步的提升。通過“迭代式強(qiáng)化學(xué)習(xí)”技術(shù),該模型在詩詞創(chuàng)作方面展現(xiàn)出了驚人的實(shí)力。無論是五言律詩、七言絕句,還是“沁園春”、“定風(fēng)波”等高難度的宋詞文體,Baichuan 3都能生成工整對仗、韻腳和諧的作品,讓每個人都能體驗(yàn)到詩詞創(chuàng)作的樂趣。

百川智能作為一家成立不到一年的公司,能夠在如此短的時間內(nèi)推出這樣一款領(lǐng)先的大語言模型,實(shí)屬不易。目前,Baichuan 3大模型已經(jīng)正式上線,并在百川智能官網(wǎng)上提供了試用服務(wù)。相信在不久的將來,這款模型將會在更多領(lǐng)域發(fā)揮出其強(qiáng)大的實(shí)力。

標(biāo)簽: 百川智能
舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容