近期,一款名為DeepSeek的國(guó)產(chǎn)人工智能大模型在全球范圍內(nèi)迅速走紅,不僅在蘋果中國(guó)的應(yīng)用商店免費(fèi)App下載排行榜上登頂,還成功超越了ChatGPT,在美國(guó)應(yīng)用商店也占據(jù)了榜首位置。
DeepSeek的背后,是一家名為杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司的新興企業(yè),簡(jiǎn)稱“深度求索公司”。這家成立于2023年7月的公司,在短時(shí)間內(nèi)便憑借DeepSeek取得了顯著的成就。深度求索公司的股權(quán)結(jié)構(gòu)中,還出現(xiàn)了量化投資機(jī)構(gòu)幻方量化的身影,為其發(fā)展注入了強(qiáng)大的資金和技術(shù)支持。
據(jù)相關(guān)媒體報(bào)道,深度求索公司的北京子公司目前正積極招募人才,共開放了52個(gè)崗位,涵蓋了深度學(xué)習(xí)研究員、核心系統(tǒng)研發(fā)工程師及資深UI設(shè)計(jì)師等多個(gè)領(lǐng)域。這些崗位均提供14薪的薪資待遇,其中核心系統(tǒng)研發(fā)工程師(校招)的薪資范圍在6萬(wàn)元至9萬(wàn)元之間,而大部分崗位的起薪都在2萬(wàn)元以上。公司還為實(shí)習(xí)生提供了高薪機(jī)會(huì),AGI大模型實(shí)習(xí)生的日薪高達(dá)500元至1000元,數(shù)據(jù)百曉生實(shí)習(xí)生的日薪也達(dá)到了500元至510元。
在技術(shù)研發(fā)方面,深度求索公司同樣取得了令人矚目的成果。今年1月20日,公司正式發(fā)布了DeepSeek-R1推理大模型。這款模型在國(guó)際大模型排名榜Chatbot Arena上的基準(zhǔn)測(cè)試中,成功升至全類別大模型的第三位,與OpenAI的ChatGPT-4o最新版并列。更令人驚嘆的是,DeepSeek-R1的預(yù)訓(xùn)練費(fèi)用僅為557.6萬(wàn)美元,不到OpenAI GPT-4o模型訓(xùn)練成本的十分之一。這一顯著的成本控制優(yōu)勢(shì),無(wú)疑為DeepSeek在未來(lái)的市場(chǎng)競(jìng)爭(zhēng)中奠定了堅(jiān)實(shí)的基礎(chǔ)。