在科技界掀起的最新風(fēng)暴中,DeepSeek如同一顆璀璨的新星,瞬間吸引了全球的目光,將一眾國(guó)產(chǎn)大模型的光芒黯然失色。無(wú)論是早已聲名在外的Kimi、后來(lái)居上的豆包,還是用戶基數(shù)龐大的文心一言,乃至全球開(kāi)源榜首的通義千問(wèn),在DeepSeek的震撼登場(chǎng)面前,都顯得稍遜一籌。
這并非意味著其他國(guó)產(chǎn)大模型缺乏實(shí)力,而是DeepSeek的表現(xiàn)太過(guò)耀眼。以往,國(guó)內(nèi)科技巨頭們總在探討與OpenAI的差距,但在DeepSeek這里,話題變成了它是否已超越了OpenAI。DeepSeek所代表的開(kāi)源路線,甚至迫使OpenAI的CEO山姆·奧爾特曼反思,他認(rèn)為OpenAI或許站在了歷史的錯(cuò)誤一邊,需要重新考慮開(kāi)源策略。
DeepSeek的出現(xiàn),不僅震撼了科技行業(yè),也在C端市場(chǎng)引發(fā)了巨大反響。數(shù)據(jù)顯示,自上線以來(lái),僅20天時(shí)間,DeepSeek的日活躍用戶就突破了2000萬(wàn)大關(guān),成為全球增長(zhǎng)最快的AI應(yīng)用。相比之下,ChatGPT達(dá)到1500萬(wàn)日活用了244天,而DeepSeek僅用了18天。20天后,DeepSeek的日活已達(dá)到2215萬(wàn),是ChatGPT日活用戶的41.6%,遠(yuǎn)超豆包的1695萬(wàn)。
這場(chǎng)AI風(fēng)暴的異常猛烈,且與眾不同之處在于,它是由一家中國(guó)創(chuàng)業(yè)公司主導(dǎo)引發(fā)的。這引發(fā)了廣泛討論:為何是DeepSeek脫穎而出?
過(guò)去兩年,國(guó)內(nèi)主流的互聯(lián)網(wǎng)大廠在大模型賽道上投入巨大,推出了多款產(chǎn)品,市場(chǎng)也滿懷期待,希望有朝一日能與硅谷AI一較高下。然而,最終打破僵局的卻是DeepSeek,大廠未能實(shí)現(xiàn)的,它做到了。
DeepSeek的爆火,是多年厚積薄發(fā)的結(jié)果。雖然此次一鳴驚人,但其團(tuán)隊(duì)在AI領(lǐng)域的布局已久,甚至比大廠還早。DeepSeek由知名私募巨頭幻方量化孕育而生,創(chuàng)始人梁文鋒在大學(xué)期間就篤信人工智能將改變世界,這一信念貫穿了他的創(chuàng)業(yè)生涯。
2015年,梁文鋒創(chuàng)辦了幻方,成為國(guó)內(nèi)最早使用人工智能進(jìn)行量化交易的公司。自2016年起,幻方逐步將深度學(xué)習(xí)技術(shù)應(yīng)用于交易,并在2018年將AI確定為公司的主要發(fā)展方向。此后,幻方成立了幻方AI,自稱是一家以大規(guī)模深度學(xué)習(xí)基礎(chǔ)研究與應(yīng)用為核心的人工智能公司。從2019年至2021年,幻方相繼自主研發(fā)了“螢火一號(hào)”與“螢火二號(hào)”AI集群,極大提升了算力支持,并積極招募算法科學(xué)家。
除了技術(shù)儲(chǔ)備,幻方在基礎(chǔ)設(shè)施上的投入也毫不遜色。當(dāng)ChatGPT在2023年橫空出世時(shí),市場(chǎng)驚訝地發(fā)現(xiàn),國(guó)內(nèi)擁有高性能GPU芯片最多的不是人工智能公司,而是梁文鋒旗下的幻方量化。彼時(shí),幻方擁有超過(guò)1萬(wàn)張A100芯片儲(chǔ)備,足見(jiàn)其對(duì)AI的投入之大。
DeepSeek的成功,還得益于以梁文鋒為代表的創(chuàng)業(yè)團(tuán)隊(duì)的銳氣?;ヂ?lián)網(wǎng)大廠的AI戰(zhàn)略往往依附于現(xiàn)有業(yè)務(wù)體系,這固然能快速商業(yè)化,但也限制了技術(shù)演進(jìn)的路徑。而背靠幻方的DeepSeek,既有強(qiáng)大的財(cái)力支持,又有創(chuàng)業(yè)者敢于從零開(kāi)始、不怕試錯(cuò)的勇氣。這使得DeepSeek能夠沿著創(chuàng)新的道路一路前行。
梁文鋒對(duì)于創(chuàng)新的態(tài)度非常堅(jiān)決。他認(rèn)為,中國(guó)公司不能總是習(xí)慣于別人做技術(shù)創(chuàng)新,自己拿過(guò)來(lái)做應(yīng)用變現(xiàn)。在這一波浪潮里,DeepSeek的出發(fā)點(diǎn)不是趁機(jī)賺一筆,而是走到技術(shù)的前沿,推動(dòng)整個(gè)生態(tài)發(fā)展。他指出,中國(guó)AI與美國(guó)之間的差距不僅僅是時(shí)間上的,更是原創(chuàng)與模仿之間的差距。如果不改變這一點(diǎn),中國(guó)將永遠(yuǎn)是追隨者。
DeepSeek實(shí)現(xiàn)創(chuàng)新的方式是拋棄慣性的反套路。在團(tuán)隊(duì)組成上,國(guó)內(nèi)大廠通常傾向于海外挖人,快速拉起團(tuán)隊(duì)。而DeepSeek團(tuán)隊(duì)多由本土Top高校的應(yīng)屆畢業(yè)生組成,選人標(biāo)準(zhǔn)注重?zé)釔?ài)和好奇心。在工作機(jī)制上,DeepSeek鼓勵(lì)自然分工和靈活調(diào)用資源,每個(gè)人隨時(shí)可以調(diào)用訓(xùn)練集群的卡無(wú)需審批。這種反效率的工作方式,恰恰為顛覆性創(chuàng)新的誕生提供了可能。
對(duì)于大廠為何沒(méi)有做出DeepSeek的問(wèn)題,DeepSeek表示,這本質(zhì)上是組織慣性、商業(yè)化壓力與技術(shù)路徑共同作用的結(jié)果。這場(chǎng)由開(kāi)源模型引發(fā)的技術(shù)革命,正在倒逼大廠重新思考創(chuàng)新邏輯。若無(wú)法跳出既有框架,大廠的技術(shù)話語(yǔ)權(quán)或?qū)⑦M(jìn)一步削弱。