近期,業(yè)界流傳出一份據(jù)稱是DeepSeek公司專家會(huì)議紀(jì)要的文件,內(nèi)容涉及該公司的發(fā)布?xì)v程和未來優(yōu)化方向。然而,DeepSeek官方迅速對(duì)此作出回應(yīng),明確否認(rèn)了這份文件的真實(shí)性。
DeepSeek在聲明中強(qiáng)調(diào),公司從未授權(quán)任何員工參與券商投資者交流會(huì),所謂的“DeepSeek專家”并非公司成員,所傳遞的信息亦不屬實(shí)。公司內(nèi)部有著嚴(yán)格的規(guī)章制度,明確禁止員工接受外部訪談或參與各類投資者信息交流會(huì)議。所有相關(guān)信息均以公司公開披露為準(zhǔn)。
值得注意的是,DeepSeek在官方公眾號(hào)“深度求索”上于12月26日發(fā)布了一篇博文,宣布正式上線并同步開源了DeepSeek-V3模型。用戶現(xiàn)在可以通過訪問官網(wǎng)chat.deepseek.com,與這一最新版V3模型進(jìn)行對(duì)話。
DeepSeek-V3模型是一個(gè)擁有6710億參數(shù)的專家混合(MoE)模型,其中激活參數(shù)達(dá)到370億,該模型在14.8萬億token的數(shù)據(jù)上進(jìn)行了預(yù)訓(xùn)練。據(jù)DeepSeek介紹,DeepSeek-V3在多項(xiàng)評(píng)測(cè)中的表現(xiàn)超越了Qwen2.5-72B和Llama-3.1-405B等開源模型,其性能甚至可以與世界頂尖的閉源模型如GPT-4o和Claude-3.5-Sonnet相媲美。
DeepSeek的這一最新進(jìn)展,無疑在人工智能領(lǐng)域引起了廣泛關(guān)注。隨著DeepSeek-V3模型的開源,業(yè)界對(duì)其性能和應(yīng)用前景的期待也進(jìn)一步增加。