近日,AI領(lǐng)域迎來了一則震撼消息,深度求索公司旗下的AI智能助手應(yīng)用DeepSeek,成功在蘋果App Store美區(qū)下載榜上超越了ChatGPT,一舉奪得免費應(yīng)用榜榜首的位置。
據(jù)悉,DeepSeek AI助手之所以能夠獲得如此耀眼的成績,離不開其背后強大的技術(shù)支持。該應(yīng)用采用了總參數(shù)超過600B的DeepSeek-V3大模型,這一模型不僅支持智能對話、AI搜索等常規(guī)功能,更在深度思考、文件上傳等方面展現(xiàn)出了卓越的能力。
深度求索公司在本月早些時候,即1月20日,已經(jīng)正式發(fā)布了DeepSeek-R1模型,并同步開源了模型權(quán)重。據(jù)官方介紹,DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用了強化學(xué)習(xí)技術(shù),即使在標注數(shù)據(jù)極少的情況下,也能顯著提升模型的推理能力。這一模型在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上的表現(xiàn),已經(jīng)可以與OpenAI的GPT-o1正式版相媲美。
不僅如此,根據(jù)第三方基準測試的結(jié)果顯示,DeepSeek-R1在某些方面甚至已經(jīng)超越了包括OpenAI、meta和Anthropic在內(nèi)的一些知名人工智能公司。為了推動技術(shù)的進一步開源和共享,深度求索公司此次將DeepSeek-R1的訓(xùn)練技術(shù)全部公開,并在發(fā)布和開源R1的同時,對協(xié)議授權(quán)進行了相應(yīng)的調(diào)整。
具體來說,DeepSeek公司決定將模型開源License統(tǒng)一使用MIT標準,這一標準化的、寬松的開源協(xié)議將完全開放源代碼,不限制商用,也無需申請。為了進一步促進技術(shù)的傳播和應(yīng)用,DeepSeek還明確允許用戶進行“模型蒸餾”,即用戶可以利用模型輸出,通過模型蒸餾等方式訓(xùn)練其他模型。這一舉措無疑將極大地推動AI技術(shù)的發(fā)展和普及。