ITBear旗下自媒體矩陣:

DeepSeek火爆全球,開源低價引AI行業(yè)變革,新規(guī)則由誰制定?

   時間:2025-02-08 10:57:01 來源:ITBEAR編輯:快訊團隊 發(fā)表評論無障礙通道

在今年的春節(jié)假期期間,全球AI領(lǐng)域迎來了一次震撼性的變革,由中國深度求索公司推出的DeepSeek R1大模型在全球范圍內(nèi)引發(fā)了熱烈討論。

DeepSeek R1直接對標(biāo)了OpenAI去年9月發(fā)布的o1系列模型,其火爆程度從一系列數(shù)據(jù)中可見一斑。1月27日,這款應(yīng)用在中國區(qū)和美國區(qū)的蘋果App Store免費榜上同時登頂,單周下載量更是高達約240萬次。這樣的成績,讓此前一直占據(jù)領(lǐng)先地位的OpenAI o1模型也黯然失色。DeepSeek R1的出現(xiàn),甚至讓OpenAI的CEO奧特曼都發(fā)出了“這是個令人印象深刻的模型”的感慨,英偉達更是將其譽為最先進的大語言模型。

與OpenAI在模型上的閉源策略以及o1模型的付費使用限制不同,DeepSeek R1不僅選擇了開源,還免費供全球用戶無限調(diào)用。這一舉措無疑在全球范圍內(nèi)引發(fā)了AI從業(yè)者的廣泛關(guān)注,同時也帶來了一些恐慌和攻擊。

DeepSeek的崛起,讓“大模型開源之王”meta的內(nèi)部員工爆料稱,meta的生成式人工智能部門陷入了恐慌。OpenAI也感受到了前所未有的壓力,兩周內(nèi)連續(xù)發(fā)布了三個大模型:Operator、Deep Research兩個AI智能體,以及推理模型o3-mini。然而,就在1月28日凌晨,DeepSeek官網(wǎng)卻連續(xù)發(fā)布兩條公告,稱DeepSeek線上服務(wù)遭受了大規(guī)模惡意攻擊。

DeepSeek無疑站在了這場AI風(fēng)暴的中心。更值得關(guān)注的是,DeepSeek打破了大模型行業(yè)長期以來的拼算力共識。DeepSeek用不到OpenAI十分之一的資源,就打造出了性能與OpenAI o1相媲美的DeepSeek R1。這一突破,讓AI上下游產(chǎn)業(yè)的性感程度受到了質(zhì)疑。

資本市場迅速給出了反應(yīng)。截至1月27日美股收盤,美股科技股大幅下跌,費城半導(dǎo)體指數(shù)下跌9.2%,英偉達股價更是暴跌近17%。這一夜之間,與AI相關(guān)的各個環(huán)節(jié)都發(fā)生了微妙的變化。DeepSeek似乎正在成為重新制定游戲規(guī)則的關(guān)鍵角色。

自ChatGPT在2023年春節(jié)橫空出世以來,幾乎每年的春節(jié)都有爆火的大模型出現(xiàn)。2024年是Sora,而2025年則是DeepSeek。與前兩年站在C位的美國OpenAI不同,今年站在C位的是中國的深度求索。DeepSeek連續(xù)多日登頂蘋果App Store全球下載榜,上線20天日活就突破了2000萬。這股來自東方的“神秘力量”,徹底沖擊了AI行業(yè)。

DeepSeek不僅沖擊了OpenAI的行業(yè)地位,更對整個大模型行業(yè)帶來了前所未有的壓力。在登頂中國和美區(qū)蘋果應(yīng)用商店24小時后,DeepSeek就再次站在了風(fēng)暴中心。OpenAI指控DeepSeek未經(jīng)許可“蒸餾”了其專有技術(shù),這一指控迅速引發(fā)了美國多位官員的發(fā)聲支持。所謂的“蒸餾”,即通過更大、更強模型的學(xué)習(xí),讓小型模型能夠在特定任務(wù)上以更低的成本取得類似效果。

DeepSeek的線上服務(wù)也一直在遭受不同程度的攻擊。從最初的SSDP、NTP反射放大攻擊,到后來增加的HTTP代理攻擊,針對DeepSeek的網(wǎng)絡(luò)攻擊一直在不斷升級。然而,在被質(zhì)疑和被攻擊的另一面,也有不少企業(yè)正在迅速適應(yīng)并擁抱DeepSeek帶來的新變化。

在云領(lǐng)域,華為云、騰訊云、阿里云、百度智能云、火山引擎、京東云、360數(shù)字安全等多平臺都宣布上線DeepSeek大模型。而在芯片領(lǐng)域,英偉達、AMD、英特爾等海外芯片巨頭以及國內(nèi)的天數(shù)智芯、摩爾線程等芯片公司也接連宣布支持DeepSeek模型。無論是被攻擊還是被支持,DeepSeek被包圍都是意料之中的事,這也是行業(yè)明星項目的必經(jīng)之路。

自2023年以來,大模型行業(yè)從不缺新聞,但真正爆火的項目并不多。ChatGPT、Kimi算是其中之一,如今的DeepSeek也同樣如此。在某種程度上,與眾多追隨OpenAI的大模型不同,DeepSeek成為了新一輪AI風(fēng)暴的發(fā)起者。DeepSeek R1被公認(rèn)為目前最先進的大語言模型之一,能夠提供高質(zhì)量的語言處理能力,在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上的性能堪比OpenAI o1模型正式版。

DeepSeek的成功,離不開其技術(shù)創(chuàng)新。DeepSeek摒棄了傳統(tǒng)的監(jiān)督微調(diào)路徑,轉(zhuǎn)而通過強化學(xué)習(xí)來優(yōu)化推理路徑。這一創(chuàng)新性的訓(xùn)練方法,率先在實驗性R1-Zer版本上應(yīng)用,隨后又在DeepSeek-V3-base模型上得到驗證。最終結(jié)果顯示,DeepSeek系列模型在沒有人工標(biāo)注數(shù)據(jù)的情況下,通過不斷嘗試和反饋,展現(xiàn)出了持續(xù)的自我進化能力。DeepSeek還采用了創(chuàng)新的MoE-2048架構(gòu),使得模型參數(shù)的利用率大幅提升,訓(xùn)練效率相較于傳統(tǒng)的Transformer架構(gòu)提高了三倍。

DeepSeek大模型的能力已然有目共睹,更重要的是,它正在用創(chuàng)新性的低成本思路顛覆市場格局。以DeepSeek R1為例,其性能與GPT o1相當(dāng),但預(yù)訓(xùn)練成本僅為557.6萬美元,僅為GPT-4o的十分之一。同時,DeepSeek API服務(wù)的定價也遠低于OpenAI。DeepSeek的爆火,無疑給支持開源路線的人帶來了信心。meta首席人工智能科學(xué)家Yann LeCun就表示,DeepSeek的成功代表了開源人工智能模型的勝利。

DeepSeek的崛起,不僅打破了AI大模型領(lǐng)域“拼算力”的邏輯,還動搖了投資者對高科技晶片的信心。多方的聲音直接沖擊了美國科技股的資本表現(xiàn)。這場由DeepSeek卷起的風(fēng)暴仍在繼續(xù),從市場競爭格局來看,DeepSeek的崛起打破了原有的平衡,對傳統(tǒng)的AI巨頭構(gòu)成了挑戰(zhàn),促使整個行業(yè)重新審視自身的技術(shù)路線和市場策略。

在DeepSeek橫空出世之前,大多數(shù)人的目光還都集中在OpenAI以及一些科技巨頭身上。沒想到,DeepSeek的崛起讓本就不平靜的湖水再度泛起漣漪,也順勢引發(fā)了一系列的蝴蝶效應(yīng)。OpenAI率先感受到了壓力,不僅承認(rèn)了閉源策略的錯誤,還迅速發(fā)布了o3-mini推理模型,并向所有用戶開放了ChatGPT搜索功能。與此同時,OpenAI也在不斷降低API調(diào)用價格,以應(yīng)對DeepSeek帶來的挑戰(zhàn)。

DeepSeek的這只蝴蝶扇動翅膀的力度很大,不僅讓OpenAI感到恐慌和跟隨,還引發(fā)了更廣泛的討論和關(guān)注。然而,技術(shù)封鎖并非保持優(yōu)勢的長期有效手段,開放與合作才更有利于AI行業(yè)的未來發(fā)展。以DeepSeek為代表的中國AI企業(yè)面臨的挑戰(zhàn)還有很多,但這場由DeepSeek掀起的新“ChatGPT”時刻,仍在繼續(xù)書寫著新的故事。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動資訊  |  爭議稿件處理  |  English Version