ITBear旗下自媒體矩陣:

百川智能發(fā)布Baichuan 3:超越GPT-4的中文大語言模型新星

   時間:2024-01-29 13:34:38 來源:ITBEAR編輯:瑞雪 發(fā)表評論無障礙通道

【ITBEAR科技資訊】1月29日消息,近日,由前搜狗公司CEO王小川創(chuàng)立的百川智能宣布推出了一款超千億參數(shù)的大語言模型——Baichuan 3。據(jù)稱,該模型在多項中文任務評測中表現(xiàn)優(yōu)異,甚至在某些方面超越了GPT-4。

在邏輯推理能力的測試中,Baichuan 3展現(xiàn)出了強大的實力。無論是在MCMLE、MedExam還是CMExam等醫(yī)療領域的評測上,其中文效果均超過了GPT-4,被譽為“中文醫(yī)療任務表現(xiàn)最佳的大模型”。這一突破性的進展,無疑為中文醫(yī)療信息處理領域注入了新的活力。

據(jù)ITBEAR科技資訊了解,為了訓練出如此強大的模型,百川智能團隊在Baichuan 3的訓練過程中采用了多種創(chuàng)新技術手段和方案。其中包括“動態(tài)數(shù)據(jù)選擇”、“重要度保持”以及“異步CheckPoint存儲”等,這些技術的運用不僅保證了訓練的穩(wěn)定性,還大大縮短了故障恢復時間,據(jù)悉,故障恢復可在10分鐘內(nèi)完成。

除了在技術層面的突破,Baichuan 3還在語義理解和生成能力上進行了進一步的提升。通過“迭代式強化學習”技術,該模型在詩詞創(chuàng)作方面展現(xiàn)出了驚人的實力。無論是五言律詩、七言絕句,還是“沁園春”、“定風波”等高難度的宋詞文體,Baichuan 3都能生成工整對仗、韻腳和諧的作品,讓每個人都能體驗到詩詞創(chuàng)作的樂趣。

百川智能作為一家成立不到一年的公司,能夠在如此短的時間內(nèi)推出這樣一款領先的大語言模型,實屬不易。目前,Baichuan 3大模型已經(jīng)正式上線,并在百川智能官網(wǎng)上提供了試用服務。相信在不久的將來,這款模型將會在更多領域發(fā)揮出其強大的實力。

標簽: 百川智能
舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關于我們  |  聯(lián)系方式  |  版權聲明  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報  |  開放轉載  |  滾動資訊  |  English Version