滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

中國電信TeleAI-t1-preview發(fā)布，邏輯推理能力超OpenAI標桿模型

時間：2025-01-25 18:30:54 來源：ITBEAR編輯：快訊團隊 發(fā)表評論無障礙通道

中國電信人工智能研究院近日宣布，其傾力打造的“復雜推理大模型”TeleAI-t1-preview已正式面世，并將很快在天翼AI開放平臺上與公眾見面。該模型采用先進的強化學習訓練技術(shù)，通過引入探索與反思機制，顯著提升了在邏輯推理與數(shù)學推導等復雜問題上的解答精度。

據(jù)官方介紹，TeleAI-t1-preview在美國數(shù)學競賽AIME 2024與MATH500兩項權(quán)威基準測試中，分別以60分和93.8分的優(yōu)異成績，遠超OpenAI的o1-preview和GPT-4o等業(yè)界標桿模型。在研究生級別問答測試GPQA Diamond中，其表現(xiàn)同樣出色，得分超越GPT-4o，與Claude 3.5 Sonnet的性能不相上下。

評測顯示，TeleAI-t1-preview在處理《九章算術(shù)》中的題目時，能夠先對文言文進行精準理解和簡化，再轉(zhuǎn)換成現(xiàn)代漢語，并給出詳細的數(shù)學推導過程和答案。這一過程中，模型展現(xiàn)了將形象思維與抽象思維相結(jié)合的能力，對所涉及場景進行具象化思考，從而更好地理解題目。

尤為TeleAI-t1-preview還能嚴謹?shù)剡M行古今單位換算，確保了答案的準確性。這一成就得益于中國電信人工智能研究院在模型訓練策略上的創(chuàng)新。

在數(shù)據(jù)準備階段，研究院收集并構(gòu)建了一個以數(shù)學為核心、涵蓋多學科的高質(zhì)量推理數(shù)據(jù)集，為模型適應(yīng)不同類型推理任務(wù)打下了堅實基礎(chǔ)。還訓練了一個專門的Judge Model，用于分析和評估模型長思考鏈路的正確性，為模型的反思和錯誤修正提供精準指導。

在監(jiān)督微調(diào)（SFT）階段，研究院采用蒙特卡洛樹搜索（MCTS）構(gòu)造高質(zhì)量長推理數(shù)據(jù)，結(jié)合每個步驟的準確率和解決方案長度，選擇最優(yōu)完整路徑。這不僅保證了推理答案的準確性，還有效拉長了思考鏈路，使推理過程更加細粒度。同時，利用Judge Model對推理過程中正確率較低的路徑進行分析，引導模型對錯誤推理步驟進行反思和修正，從而構(gòu)造出高質(zhì)量的思維鏈數(shù)據(jù)進行SFT訓練。

在強化學習階段，研究院額外構(gòu)造了基于規(guī)則的獎勵模型（Rule-based Reward Model），提供準確獎勵信號，通過在線強化學習算法進一步提升模型的邏輯推理能力。這一系列創(chuàng)新舉措，共同成就了TeleAI-t1-preview在復雜推理領(lǐng)域的卓越表現(xiàn)。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

創(chuàng)新引領(lǐng)，榮譽加冕！一品威客再度上榜廈門市重點軟件企業(yè)名單

01-25

幣安前風投部門更名YZi Labs，趙長鵬以實習生身份助力AI、生物科技投資

YZi Labs 在聲明中表示，它并不是一個家族辦公室，而是“一家致力于促進創(chuàng)新和支持各個領(lǐng)域投資的風投和孵化公司”。早在 YZi Labs更名之前，Binance Labs 就已在探索對去中心化科學項目…

01-25

盤興數(shù)智沖刺港股：年營收近8億，毛利率下滑，估值四年穩(wěn)坐50億

01-25

歌爾股份2024年凈利潤大增，預(yù)計達25.57億至27.75億元

01-25

蘋果“救火隊員”Vorrath掛帥AI，能否讓Siri重獲新生？

01-25

蘋果AI新動向：2025年將重構(gòu)Siri基礎(chǔ)，AI模型升級在即

彭博社馬克?古爾曼（Mark Gurman）今天（1 月 25 日）發(fā)布博文，泄露了一份蘋果公司內(nèi)部備忘錄，在抽調(diào)“救火隊員”KimVorrath 負責 AI 和 Siri 業(yè)務(wù)之外，還提及了蘋果公司 20…

01-25

聯(lián)想天禧AS：AI普惠新紀元，一體多端戰(zhàn)略引領(lǐng)未來生活變革！

01-25

扎克伯格豪擲650億押寶AI，Meta股價波動上演過山車行情

01-25

瑞芯微前高管陳鋒或?qū)⒄贫姘仓\科技，半導體行業(yè)迎新變局？

01-25

林園2025年首秀：A股質(zhì)變在即，滿倉待漲，安心過年！

01-25

Meta豪擲600億押注AI未來，扎克伯格：2025年是決定性一年

01-25

蘋果高管大調(diào)整，AI團隊發(fā)力，Siri升級能否逆襲？

蘋果公司近期正在進行一系列高層人事調(diào)整，旨在加強其在人工智能領(lǐng)域，尤其是Siri業(yè)務(wù)的競爭力。這一變動引發(fā)了外界的廣泛關(guān)注。據(jù)知情人士透露，蘋果內(nèi)部資深員工金·沃拉斯已被調(diào)往人工智能和機器學習部門，擔任該領(lǐng)域主管約翰·詹南德雷亞的高級助手。沃拉斯在蘋果公

01-25

OpenAI重組進行時：PBC部門估值300億，微軟140億投資股份成謎

OpenAI董事會正忙于復雜的談判，以轉(zhuǎn)變成為一家營利性公司。知情人士稱，OpenAI初步為其新成立的慈善部門估值300億美元，但仍難以確定微軟的140億美元投資將從中獲得多少股份。三位知情人士表示，PBC部…

01-25

OpenAI重組進行時：PBC部門估值300億，微軟140億投資股份幾何？

01-25

蘋果AI大動作：Siri核心技術(shù)重建，AI模型升級在即

01-25

點擊查看更多 +

全站最新

小米汽車新里程碑：雷軍宣布SU7交付量突破15萬輛

AMD宣布：DeepSeek-V3模型已融入Instinct MI300X GPU，優(yōu)化AI推理

《影之刃零》蛇年P(guān)V曝光，武俠朋克新高度能否超越期待？

六冠王小豪忍者強度新榜單：雙天王領(lǐng)銜，偽天王何許人也？

中階智駕成2025年智駕市場關(guān)鍵：為何它是未來之戰(zhàn)的制勝法寶？

2024車企業(yè)績預(yù)告揭曉：哪些品牌盈利飆升，哪些陷入虧損泥潭？

熱門內(nèi)容

本欄最新

創(chuàng)新引領(lǐng)，榮譽加冕！一品威客再度上榜廈門市重點軟件企業(yè)名單

幣安前風投部門更名YZi Labs，趙長鵬以實習生身份助力AI、生物科技投資

盤興數(shù)智沖刺港股：年營收近8億，毛利率下滑，估值四年穩(wěn)坐50億

歌爾股份2024年凈利潤大增，預(yù)計達25.57億至27.75億元

蘋果“救火隊員”Vorrath掛帥AI，能否讓Siri重獲新生？

聯(lián)想天禧AS：AI普惠新紀元，一體多端戰(zhàn)略引領(lǐng)未來生活變革！

本網(wǎng)站LOGO小熊標志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

中國電信TeleAI-t1-preview發(fā)布，邏輯推理能力超OpenAI標桿模型

中國電信TeleAI-t1-preview發(fā)布，邏輯推理能力超OpenAI標桿模型