在人工智能領(lǐng)域,一場(chǎng)前所未有的熱潮正席卷全球。1月27日,一款名為DeepSeek的應(yīng)用成功登上蘋果中國(guó)與美國(guó)地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜榜首,這一壯舉不僅超越了ChatGPT在美區(qū)的地位,也力壓豆包、抖音等國(guó)內(nèi)熱門應(yīng)用,成為業(yè)界矚目的焦點(diǎn)。
對(duì)于AI行業(yè)而言,DeepSeek的登頂無(wú)疑是一個(gè)歷史性的時(shí)刻。它標(biāo)志著首款A(yù)I助手類產(chǎn)品成功超越了ChatGPT,同時(shí)也意味著中國(guó)企業(yè)研發(fā)的生成式AI應(yīng)用產(chǎn)品首次登頂美區(qū)蘋果App Store。DeepSeek由國(guó)產(chǎn)大模型公司深度求索推出,隸屬于量化巨頭幻方量化旗下。自1月20日深度求索正式發(fā)布推理大模型DeepSeek-R1以來(lái),憑借其高性價(jià)比的特性,在海外開(kāi)發(fā)者社區(qū)中引發(fā)了巨大轟動(dòng)。
DeepSeek-R1作為一款開(kāi)源模型,其性能在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上能夠比肩OpenAI的GPT系列模型,并采用MIT許可協(xié)議,支持免費(fèi)商用、任意修改和衍生開(kāi)發(fā)等。在國(guó)外大模型排名榜Chatbot Arena上,DeepSeek-R1的基準(zhǔn)測(cè)試排名迅速攀升至全類別大模型第三,與OpenAI的ChatGPT-4并列,同時(shí)在風(fēng)格控制類模型分類中與OpenAI的GPT系列模型并列第一。更令人驚訝的是,DeepSeek-R1的預(yù)訓(xùn)練費(fèi)用僅為557.6萬(wàn)美元,在2048塊英偉達(dá)H800 GPU集群上運(yùn)行55天完成,這一成本僅為OpenAI GPT-4模型訓(xùn)練成本的十分之一左右。
DeepSeek的高效背后,離不開(kāi)其核心技術(shù)因素的支持,包括低精度計(jì)算、小參數(shù)量和高質(zhì)量數(shù)據(jù)等。據(jù)DeepSeek的技術(shù)文檔透露,該模型使用數(shù)據(jù)蒸餾技術(shù)生成的高質(zhì)量數(shù)據(jù),極大地提升了訓(xùn)練效率。數(shù)據(jù)蒸餾通過(guò)一系列算法和策略,將原始的、復(fù)雜的數(shù)據(jù)進(jìn)行去噪、降維、提煉等操作,從而得到更為精煉、有用的數(shù)據(jù)。
目前,DeepSeek R1模型每百萬(wàn)個(gè)token的查詢成本僅為0.14美元,而OpenAI的成本則高達(dá)7.50美元,便宜了98%。這一巨大的價(jià)格優(yōu)勢(shì),讓華爾街算力板塊的投資人感受到了前所未有的壓力。然而,就在DeepSeek風(fēng)頭正勁之時(shí),其網(wǎng)頁(yè)/API卻出現(xiàn)了不可用的情況,目前正在調(diào)查原因。此前,DeepSeek也曾出現(xiàn)過(guò)短時(shí)閃崩現(xiàn)象,公司回應(yīng)稱可能與服務(wù)維護(hù)、請(qǐng)求限制等因素有關(guān)。
對(duì)于同時(shí)登頂中美App Store應(yīng)用榜單這一壯舉,DeepSeek團(tuán)隊(duì)表達(dá)了無(wú)比的振奮和感激。他們表示,這一成就不僅是對(duì)技術(shù)實(shí)力的認(rèn)可,更是全球用戶和開(kāi)發(fā)者社區(qū)對(duì)他們的信任與支持的直接體現(xiàn)。DeepSeek團(tuán)隊(duì)的感言中提到了三個(gè)核心觸動(dòng):技術(shù)民主化的勝利、用戶信任的托舉以及開(kāi)放生態(tài)的裂變。他們堅(jiān)信,當(dāng)技術(shù)突破與人文關(guān)懷共振時(shí),冰冷的代碼也能綻放溫暖的價(jià)值。
業(yè)內(nèi)專家對(duì)DeepSeek的登頂也給予了高度評(píng)價(jià)。金沙江創(chuàng)業(yè)投資基金主管合伙人朱嘯虎認(rèn)為,DeepSeek的勝利是技術(shù)理想主義者的勝利,專注于技術(shù)和創(chuàng)新遠(yuǎn)勝于投放買流量和公關(guān)。英偉達(dá)高級(jí)研究科學(xué)家Jim Fan則表示,DeepSeek-R1可能是首個(gè)展示了強(qiáng)化學(xué)習(xí)飛輪可以發(fā)揮作用且能帶來(lái)持續(xù)增長(zhǎng)的開(kāi)源軟件項(xiàng)目。AI科技初創(chuàng)公司Scale AI創(chuàng)始人亞歷山大·王則強(qiáng)調(diào),DeepSeek的AI大模型發(fā)布可能會(huì)改變美國(guó)一直領(lǐng)先于中國(guó)的人工智能競(jìng)賽的格局。
DeepSeek的開(kāi)源模型還引發(fā)了一股“復(fù)現(xiàn)熱潮”。例如,HuggingFace在GitHub上發(fā)起的Open R1項(xiàng)目,完全復(fù)制和開(kāi)源了DeepSeek R1,包括訓(xùn)練數(shù)據(jù)、訓(xùn)練腳本等。面對(duì)DeepSeek的挑戰(zhàn),meta也迅速采取行動(dòng),組建了多個(gè)小組來(lái)研究DeepSeek的技術(shù)細(xì)節(jié),并希望在其即將發(fā)布的Llama 4中實(shí)現(xiàn)技術(shù)突破。
然而,DeepSeek的沖擊也引發(fā)了全球算力市場(chǎng)的動(dòng)蕩。A股寒武紀(jì)股價(jià)持續(xù)走低,日本半導(dǎo)體股也出現(xiàn)下挫,美股納指期貨更是領(lǐng)跌。業(yè)內(nèi)人士表示,DeepSeek可能引發(fā)科技股下跌,因?yàn)榇笮涂萍脊驹贏I上投入了大量資金,但一直存在投資回報(bào)能否匹配的問(wèn)題。分析師也指出,中國(guó)的DeepSeek可能代表了對(duì)美國(guó)股市最大的威脅,因?yàn)槠湟詷O低的價(jià)格建立了一個(gè)突破性的人工智能模型,而無(wú)需依賴最先進(jìn)的芯片。
盡管如此,DeepSeek的成就仍然讓業(yè)界看到了技術(shù)平權(quán)與知識(shí)信息平權(quán)的曙光。正如DeepSeek團(tuán)隊(duì)所言,他們正在見(jiàn)證一個(gè)新時(shí)代的開(kāi)端——這里沒(méi)有孤勇的英雄,只有無(wú)數(shù)雙手共同推開(kāi)未來(lái)之門。