在AI領(lǐng)域,一股新興勢力正悄然崛起。DeepSeek,這一名不見經(jīng)傳的公司,近日憑借其最新的大模型DeepSeek-R1,成功打破了國內(nèi)大模型的固有格局,成為業(yè)界關(guān)注的焦點。
1月26日,DeepSeek正式對外發(fā)布了其備受矚目的DeepSeek-R1模型,并慷慨地開源了模型權(quán)重。此舉遵循了MIT License協(xié)議,允許用戶借助R1的蒸餾技術(shù),訓(xùn)練出更多樣化的模型。這一開放的態(tài)度,無疑為AI社區(qū)注入了新的活力。
DeepSeek-R1不僅提供了強大的API服務(wù),還允許用戶通過設(shè)置model='deepseek-reasoner'來調(diào)用其獨特的思維鏈輸出功能。這一功能使得DeepSeek-R1在處理復(fù)雜問題時,能夠展現(xiàn)出更加清晰和連貫的推理過程。
DeepSeek-R1之所以能夠在短時間內(nèi)脫穎而出,離不開其在后訓(xùn)練階段大規(guī)模使用強化學(xué)習(xí)技術(shù)的決策。即便在標注數(shù)據(jù)極為有限的情況下,DeepSeek-R1依然能夠顯著提升模型的推理能力。在數(shù)學(xué)、代碼、自然語言推理等多項任務(wù)上,其性能已經(jīng)與OpenAI的o1正式版不相上下。
DeepSeek在開源DeepSeek-R1-Zero和DeepSeek-R1兩個660B模型的同時,還通過DeepSeek-R1的輸出蒸餾出了6個小模型,并將它們開源給了社區(qū)。其中,32B和70B模型在多項能力上已經(jīng)達到了與OpenAI的o1-mini相媲美的水平。
在定價方面,DeepSeek-R1的API服務(wù)也展現(xiàn)出了極大的誠意。每百萬輸入tokens僅需1元(緩存命中)或4元(緩存未命中),而每百萬輸出tokens也僅需16元。這一價格策略無疑降低了用戶的使用成本,進一步推動了AI技術(shù)的普及。
DeepSeek的崛起不僅震動了國內(nèi)AI界,更引起了美國科技界的廣泛關(guān)注。其性能上的卓越表現(xiàn)以及完全開源的態(tài)度,讓許多美國科技公司感受到了前所未有的壓力。知名投資人馬克·安德森更是對DeepSeek-R1給予了高度評價,稱其為“最令人驚嘆和印象深刻的突破之一”。
AI科技初創(chuàng)公司Scale AI的創(chuàng)始人亞歷山大·王也對DeepSeek的成就表示了贊賞。他認為,過去十年里美國一直在人工智能競賽中領(lǐng)先于中國,但DeepSeek的AI大模型發(fā)布可能會改變這一格局。DeepSeek-R1的性能與美國最好的模型相當,甚至在某些方面還更勝一籌。
亞歷山大·王進一步指出,DeepSeek-R1的訓(xùn)練計算量比GPT-4o和Claude 3.5 Sonnet減少了10倍,這充分展示了中國在AI技術(shù)上的創(chuàng)新能力和效率。他認為,DeepSeek的崛起給美國科技公司敲響了警鐘,提醒他們不能掉以輕心。
DeepSeek的動作也讓meta的生成式AI團隊感到了恐慌。為了應(yīng)對這一挑戰(zhàn),meta CEO扎克伯格宣布將加速研發(fā)Llama 4,并計劃投資650億美元擴建數(shù)據(jù)中心,部署130萬枚GPU。他希望通過這一舉措,確保meta AI在2025年成為全球領(lǐng)先的模型。
DeepSeek的崛起無疑給整個AI領(lǐng)域帶來了新的競爭格局。如果中國公司能夠以更低的成本實現(xiàn)同等或更好的性能,并且這些模型還大都開源,那么美國公司賴以維持的技術(shù)優(yōu)勢和高估值可能會受到嚴峻挑戰(zhàn)。這一變革不僅將推動AI技術(shù)的進一步發(fā)展,也將深刻影響全球科技產(chǎn)業(yè)的格局。