ITBear旗下自媒體矩陣:

中國(guó)DeepSeek-R1,能否成為AI推理領(lǐng)域的新星?

   時(shí)間:2025-01-31 10:53:15 來源:ITBEAR編輯:快訊團(tuán)隊(duì) 發(fā)表評(píng)論無障礙通道

近日,Nature自然雜志刊登了一則令人矚目的消息:中國(guó)研發(fā)的大型語言模型DeepSeek-R1在科學(xué)界引發(fā)了廣泛熱議,被視為OpenAI推出的o1推理模型的有力競(jìng)爭(zhēng)對(duì)手,且更加經(jīng)濟(jì)實(shí)惠、開放性強(qiáng)。

據(jù)悉,DeepSeek-R1采用逐步生成響應(yīng)的方式,這一機(jī)制與人類推理過程頗為相似。這使得它在解決科學(xué)問題方面展現(xiàn)出超越早期語言模型的卓越能力,預(yù)示著該模型在科研領(lǐng)域或?qū)⒋笥锌蔀椤?月20日發(fā)布的初步測(cè)試結(jié)果顯示,DeepSeek-R1在化學(xué)、數(shù)學(xué)及編碼等領(lǐng)域的特定任務(wù)上,表現(xiàn)與OpenAI的o1模型旗鼓相當(dāng)。o1模型曾在去年9月發(fā)布時(shí)驚艷四座,而DeepSeek-R1的出現(xiàn)無疑再次刷新了人們的認(rèn)知。

英國(guó)人工智能咨詢公司DAIR.AI的聯(lián)合創(chuàng)始人埃爾維斯·薩拉維亞在社交媒體上感慨道:“這簡(jiǎn)直太瘋狂了,完全出乎我的意料。”

DeepSeek-R1之所以備受矚目,還源于其開放性。該模型由杭州初創(chuàng)公司DeepSeek發(fā)布,并遵循麻省理工學(xué)院的許可證,允許研究人員自由重復(fù)使用。盡管其訓(xùn)練數(shù)據(jù)尚未公開,但這一舉措已足以讓DeepSeek-R1在同類模型中脫穎而出。相比之下,OpenAI的o1及其他模型,包括其最新成果o3,則如同黑匣子一般,缺乏透明度。

在成本方面,DeepSeek-R1同樣展現(xiàn)出巨大優(yōu)勢(shì)。盡管該公司尚未公布訓(xùn)練該模型的全部成本,但其界面收費(fèi)僅為o1運(yùn)行成本的三十分之一。DeepSeek還推出了R1的迷你精簡(jiǎn)版本,旨在滿足計(jì)算能力有限的研究人員的需求。德國(guó)埃爾朗根馬克斯普朗克光科學(xué)研究所的馬里奧·克倫表示:“使用o1進(jìn)行實(shí)驗(yàn)的成本超過370美元,而使用R1的成本則不到10美元。這一巨大差異無疑將對(duì)其未來的應(yīng)用產(chǎn)生深遠(yuǎn)影響?!?/p>

DeepSeek-R1的成功發(fā)布,標(biāo)志著中國(guó)大型語言模型(LLM)領(lǐng)域的蓬勃發(fā)展。DeepSeek從一家對(duì)沖基金中分拆而來,上個(gè)月憑借一款名為V3的聊天機(jī)器人一舉成名。盡管預(yù)算有限,但V3的表現(xiàn)卻超越了主要競(jìng)爭(zhēng)對(duì)手。專家估算,租用訓(xùn)練V3所需的硬件成本約為600萬美元,而meta的Llama 3.1 405B則高達(dá)6000萬美元,計(jì)算資源是V3的11倍。

盡管面臨美國(guó)出口管制的限制,中國(guó)公司在獲取為人工智能處理而設(shè)計(jì)的最佳計(jì)算機(jī)芯片方面面臨挑戰(zhàn),但DeepSeek仍成功研發(fā)出R1。這一事實(shí)表明,高效利用資源比單純的計(jì)算規(guī)模更為重要。西雅圖的人工智能研究員Fran?ois Chollet對(duì)此表示:“R1來自中國(guó),這證明了在資源有限的情況下,創(chuàng)新算法同樣能夠取得突破?!?/p>

DeepSeek的進(jìn)展也引發(fā)了美國(guó)技術(shù)專家的關(guān)注。華盛頓州貝爾維尤的技術(shù)專家Alvin Wang Graylin認(rèn)為,美國(guó)在人工智能領(lǐng)域的領(lǐng)先優(yōu)勢(shì)已經(jīng)大幅縮小。他呼吁中美兩國(guó)應(yīng)采取合作方式,共同推動(dòng)人工智能的發(fā)展,而非陷入無休止的軍備競(jìng)賽。

在LLM領(lǐng)域,模型通過訓(xùn)練數(shù)十億個(gè)文本樣本,學(xué)習(xí)數(shù)據(jù)中的模式,從而預(yù)測(cè)句子中的后續(xù)內(nèi)容。然而,LLM容易捏造事實(shí),且難以進(jìn)行推理。為解決這一問題,DeepSeek-R1采用了與o1相似的思路鏈方法,以提高解決復(fù)雜任務(wù)的能力。該方法包括回溯和評(píng)估其方法,以提高準(zhǔn)確性。DeepSeek通過對(duì)V3進(jìn)行強(qiáng)化學(xué)習(xí)微調(diào),從而打造出R1。強(qiáng)化學(xué)習(xí)會(huì)獎(jiǎng)勵(lì)模型得出正確答案,并以概述其思維的方式解決問題。

愛丁堡大學(xué)的人工智能研究員Wenda Li指出,計(jì)算能力有限促使DeepSeek在算法上進(jìn)行創(chuàng)新。在強(qiáng)化學(xué)習(xí)過程中,該團(tuán)隊(duì)估算了模型在每個(gè)階段的進(jìn)度,而非使用單獨(dú)的網(wǎng)絡(luò)進(jìn)行評(píng)估。這一方法有助于降低培訓(xùn)和運(yùn)行成本。同時(shí),研究人員還采用了混合專家架構(gòu),該架構(gòu)允許模型僅激活與每項(xiàng)任務(wù)相關(guān)的部分,進(jìn)一步提高了效率。

在基準(zhǔn)測(cè)試中,DeepSeek-R1在加州大學(xué)伯克利分校研究人員編寫的數(shù)學(xué)問題MATH-500中取得了97.3%的優(yōu)異成績(jī),并在一項(xiàng)名為Codeforces的編程競(jìng)賽中擊敗了96.3%的人類參與者。這些成績(jī)與o1不相上下。盡管o3未被納入比較范圍,但DeepSeek-R1的出色表現(xiàn)已足以證明其強(qiáng)大的推理和概括能力。

然而,基準(zhǔn)測(cè)試是否真正反映了模型的推理或概括能力,還是僅僅反映了其通過此類測(cè)試的能力,仍是一個(gè)值得探討的問題。但劍橋大學(xué)的計(jì)算機(jī)科學(xué)家Marco Dos Santos認(rèn)為,由于R1是開放的,研究人員可以訪問其思路,這使得模型的推理過程具有更好的可解釋性。這一特點(diǎn)將有助于科學(xué)家更深入地了解R1的工作原理,并為其未來的應(yīng)用提供有力支持。

目前,科學(xué)家們已經(jīng)開始測(cè)試R1的能力??藗愐髢蓚€(gè)競(jìng)爭(zhēng)模型對(duì)3000個(gè)研究想法進(jìn)行有趣程度排序,并將結(jié)果與人工排名進(jìn)行比較。盡管在這一衡量標(biāo)準(zhǔn)下,R1的表現(xiàn)略遜于o1,但在量子光學(xué)的某些計(jì)算上,R1卻勝過了o1。這一結(jié)果無疑令人印象深刻,也進(jìn)一步證明了DeepSeek-R1在特定領(lǐng)域的卓越表現(xiàn)。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動(dòng)資訊  |  爭(zhēng)議稿件處理  |  English Version