滾動資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

DeepSeek-R1橫空出世，能否挑戰(zhàn)OpenAI o1霸主地位？

時(shí)間：2025-01-22 13:17:33 來源：ITBEAR編輯：快訊團(tuán)隊(duì) 發(fā)表評論無障礙通道

在人工智能領(lǐng)域，一場悄無聲息的革命正在上演。1月20日，DeepSeek團(tuán)隊(duì)震撼發(fā)布了其最新開源模型——DeepSeek-R1，該模型一經(jīng)推出，便在GitHub上迅速收獲了超過4000個(gè)星標(biāo)，成為大模型領(lǐng)域的焦點(diǎn)。

DeepSeek-R1的問世，不僅打破了之前關(guān)于其是否基于OpenAI o1進(jìn)行蒸餾的傳言，團(tuán)隊(duì)更是直接宣稱：“我們的模型可以與開源版的o1一較高下?！边@一聲明無疑為DeepSeek-R1增添了更多神秘色彩。

值得注意的是，DeepSeek-R1在模型訓(xùn)練上實(shí)現(xiàn)了重大突破，摒棄了傳統(tǒng)的SFT數(shù)據(jù)，完全依賴于強(qiáng)化學(xué)習(xí)（RL）進(jìn)行訓(xùn)練。這一改變意味著模型已經(jīng)具備了自我思考的能力，更加貼近人類的思維模式。

網(wǎng)友們對DeepSeek-R1的評價(jià)頗高，甚至有人將其譽(yù)為“開源LLM界的AlphaGo”。這一贊譽(yù)不僅體現(xiàn)了DeepSeek-R1的強(qiáng)大實(shí)力，也反映了公眾對于開源模型發(fā)展的期待。

DeepSeek團(tuán)隊(duì)的自信并非空穴來風(fēng)。在后訓(xùn)練階段，DeepSeek-R1憑借有限的數(shù)據(jù)，在模型推理能力上遠(yuǎn)超o1。在數(shù)學(xué)、代碼和自然語言推理等多個(gè)領(lǐng)域，DeepSeek-R1都展現(xiàn)出了卓越的性能。

例如，在AIME 2024數(shù)學(xué)競賽中，DeepSeek-R1取得了79.8%的成績，略高于OpenAI的o1-1217。在MATH-500測試中，DeepSeek-R1更是達(dá)到了97.3%的高分，與o1-1217相當(dāng)，同時(shí)顯著優(yōu)于其他模型。在編程競賽方面，DeepSeek-R1也表現(xiàn)出了專家級水平，其Codeforces上的Elo評級達(dá)到了2029，超過了96.3%的人類參賽者。

DeepSeek團(tuán)隊(duì)還開源了6個(gè)參數(shù)不同的小模型，包括1.5B、7B、8B、14B、32B和70B。這些蒸餾過的模型在性能上不僅超越了GPT-4o、Claude 3.5 Sonnet和QwQ-32B，甚至與o1-mini的效果相當(dāng)。

更令人驚嘆的是，DeepSeek-R1在成本上僅為o1的五十分之一，卻能實(shí)現(xiàn)與o1相同的效能。這種高性價(jià)比讓DeepSeek-R1成為了“花小錢，辦大事”的典范。

DeepSeek-R1的成功不僅在于其卓越的性能，更在于其開源的訓(xùn)練數(shù)據(jù)集和優(yōu)化工具。這一做法讓不少網(wǎng)友直呼：“這才是真正的Open AI。”DeepSeek團(tuán)隊(duì)的核心技術(shù)包括Self play、Grpo以及Cold start，這些技術(shù)的運(yùn)用使得DeepSeek-R1在訓(xùn)練過程中能夠自主思考、自我優(yōu)化，從而實(shí)現(xiàn)了性能上的飛躍。

DeepSeek-R1的發(fā)布引起了國內(nèi)外大模型從業(yè)者的廣泛關(guān)注。深度賦智CEO吳承霖評價(jià)道：“DeepSeek R1確實(shí)厲害，但方法非常簡單，核心其實(shí)就三點(diǎn)?！边@三點(diǎn)正是Self play、Grpo以及Cold start，它們共同構(gòu)成了DeepSeek-R1成功的基石。

舉報(bào) 0 收藏 0 打賞 0評論 0

更多>同類資訊

字節(jié)跳動豆包大模型1.5 Pro重磅發(fā)布，綜合能力超越GPT-4o等模型

01-22

字節(jié)跳動120億投資AI？官方：消息不實(shí)

01-22

字節(jié)跳動否認(rèn)120億美元投AI基礎(chǔ)設(shè)施，真相如何？

01-22

榮耀前CEO趙明離職背后：上市前夕緣何失去董事會信任？

01-22

陳天橋布局AI新戰(zhàn)略：盛大以研究為魂，雙研究院驅(qū)動未來

01-22

微軟調(diào)整與OpenAI合作：OpenAI獲算力自主權(quán)，共啟5000億“星際之門”項(xiàng)目

01-22

美圖奇想大模型登頂VBench，視頻生成質(zhì)量奪冠展現(xiàn)美學(xué)實(shí)力

01-22

華為Pura 70 Ultra新色登場，瑞紅玄黑賀新春，原生鴻蒙開啟智能新篇章

01-22

網(wǎng)易有道發(fā)布“子曰-o1”推理模型，國內(nèi)首創(chuàng)分步式解題講解

01-22

特朗普宣布OpenAI、軟銀和甲骨文將投500億建AI基礎(chǔ)設(shè)施

Stargate intends to invest $500 billion over the next four yearsbuilding new AI infrastructure for Ope…

01-22

人形機(jī)器人加速進(jìn)廠，家庭服務(wù)市場何時(shí)迎來爆發(fā)？

01-22

榮耀上市路遇挑戰(zhàn)，能否突破重圍實(shí)現(xiàn)商業(yè)奇跡？

01-22

大咖論道：2025節(jié)點(diǎn)增長大會揭秘企業(yè)增長的本質(zhì)與出海挑戰(zhàn)

01-22

榮耀上市前夜趙明離職，四年掌舵路緣何失去董事會信任？

01-22

瀾起科技新突破：PCIe 6.x/CXL 3.x Retimer芯片面世，加速AI云計(jì)算發(fā)展

01-22

點(diǎn)擊查看更多 +

全站最新

日產(chǎn)汽車大裁員，轉(zhuǎn)型求生能否破局？

量子之歌金禧獎加冕，銀發(fā)經(jīng)濟(jì)深耕成果獲資本市場高度認(rèn)可

享界S9銷量波動引關(guān)注，12月回暖能否迎來市場突破？

拼多多現(xiàn)金游戲：一場讓人欲罷不能的“陷阱”？

領(lǐng)克Z20山城閃耀，智趣純電SUV引領(lǐng)出行新風(fēng)尚！

《數(shù)碼紀(jì)元：Elu傳說》登頂Vision Pro，雷鳥創(chuàng)新MR游戲引領(lǐng)新潮流

熱門內(nèi)容

本欄最新

榮耀前CEO趙明離職背后：上市前夕緣何失去董事會信任？

陳天橋布局AI新戰(zhàn)略：盛大以研究為魂，雙研究院驅(qū)動未來

華為Pura 70 Ultra新色登場，瑞紅玄黑賀新春，原生鴻蒙開啟智能新篇章

網(wǎng)易有道發(fā)布“子曰-o1”推理模型，國內(nèi)首創(chuàng)分步式解題講解

大咖論道：2025節(jié)點(diǎn)增長大會揭秘企業(yè)增長的本質(zhì)與出海挑戰(zhàn)

榮耀上市前夜趙明離職，四年掌舵路緣何失去董事會信任？

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時(shí)刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

DeepSeek-R1橫空出世，能否挑戰(zhàn)OpenAI o1霸主地位？

DeepSeek-R1橫空出世，能否挑戰(zhàn)OpenAI o1霸主地位？