近期,據(jù)Information網(wǎng)站報道,meta公司,即Facebook的母公司,已成立四個專項研究團(tuán)隊,深入探索國產(chǎn)大模型DeepSeek的核心機(jī)制。此舉旨在通過分析DeepSeek的工作原理,來優(yōu)化meta自家的大模型Llama。
值得注意的是,就在不久前,DeepSeek-R1推理大模型正式面世。據(jù)官方披露,DeepSeek-R1在后訓(xùn)練階段大規(guī)模運(yùn)用了強(qiáng)化學(xué)習(xí)技術(shù),即便在標(biāo)注數(shù)據(jù)極為有限的情況下,也顯著提升了模型的推理能力。在數(shù)學(xué)、代碼編寫以及自然語言推理等多項任務(wù)上,DeepSeek-R1的性能已可媲美OpenAI的GPT-1正式版。
更令人矚目的是,Deepseek應(yīng)用在發(fā)布后迅速走紅,不僅在中國地區(qū)的蘋果應(yīng)用商店免費(fèi)下載排行榜上奪得榜首,更是在美國地區(qū)的應(yīng)用商店免費(fèi)下載榜上超越了ChatGPT,展現(xiàn)出強(qiáng)大的市場吸引力和用戶基礎(chǔ)。