ITBear旗下自媒體矩陣:

國產萬卡萬參大模型訓練完成,TeleChat2-115B開源引領AI新潮!

   時間:2024-09-28 19:57:22 來源:ITBEAR作者:柳晴雪編輯:瑞雪 發(fā)表評論無障礙通道

【ITBEAR】9月28日消息,中國電信人工智能研究院近日取得了重大突破,成功完成了國內首個完全基于國產化萬卡集群訓練的萬億參數大模型,并將千億參數的星辰語義大模型TeleChat2-115B對外開源。

這一里程碑式的成果顯示,國產大模型訓練已全面實現(xiàn)國產化替代,邁入了自主創(chuàng)新、安全可控的新階段。TeleChat2-115B大模型依托于天翼云的“息壤一體化智算服務平臺”及“星海AI平臺”進行訓練,不僅保證了訓練精度,還通過多項優(yōu)化技術顯著提升了訓練效率和穩(wěn)定性。

在模型訓練過程中,TeleAI團隊創(chuàng)新性地采用了小模型Scaling策略,有效驗證了不同模型結構的性能。同時,通過精細的數據配比和回歸預測模型,實現(xiàn)了訓練數據的優(yōu)化配置。

后訓練階段,TeleAI合成了大量針對數學、代碼和邏輯推理的問答數據,用于監(jiān)督式微調。團隊還采用迭代式更新和拒絕采樣技術,進一步提升了模型生成的答案質量和數據代表性。

為便于業(yè)界同仁共同研究與進步,TeleChat2-115B大模型已在多個平臺開源,包括GitHub、Gitee、ModelScope和Modelers,供全球開發(fā)者和研究者免費訪問和使用。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內容