ITBear旗下自媒體矩陣:

95后AI天才少女羅福莉引熱議,小米挖角是否為真?

   時間:2024-12-30 23:10:16 來源:ITBEAR編輯:快訊團隊 發(fā)表評論無障礙通道

近日,AI領(lǐng)域迎來了一股新的熱潮,焦點集中在一家名為Deepseek的企業(yè)及其最新發(fā)布的模型DeepSeek-V3上。12月26日,Deepseek宣布其全新系列模型DeepSeek-V3的首個版本正式上線,并同步開放源代碼。

據(jù)官方介紹,DeepSeek-V3在多項評測中取得了優(yōu)異成績,超越了Qwen2.5-72B和Llama-3.1-405B等其他開源模型,并且在性能上與頂尖閉源模型GPT-4o以及Claude-3.5-Sonnet不相上下。更引人注目的是,官方技術(shù)論文透露,v3模型的總訓(xùn)練成本僅為557.6萬美元,遠低于GPT-4o等模型的約1億美元。

這一消息迅速引發(fā)了廣泛關(guān)注,Deepseek的名字開始在各大媒體平臺上刷屏。緊接著,12月27日,又有媒體報道稱,被稱為95后“天才少女”的羅福莉?qū)⒓尤胄∶坠?,而這位天才少女同樣來自Deepseek。

據(jù)報道,雷軍為了挖角這位天才少女,不惜開出千萬年薪,這一消息同樣引發(fā)了熱議。不過,事實上,早在12月20日就有媒體提到過DeepSeek的羅福莉?qū)⒓尤胄∶椎南?,但?dāng)時并未引起廣泛關(guān)注。

DeepSeek-V3發(fā)布后,收獲了大量好評。一方面,它在多個評測中取得了高分;另一方面,其低廉的訓(xùn)練成本也讓人印象深刻。不少業(yè)界大佬對DeepSeek-V3給予了高度評價,如meta科學(xué)家田淵棟稱其為“黑科技”,Menlo Venture的投資人更是將53頁的技術(shù)論文譽為“黃金”。

然而,DeepSeek-V3也并非完美無缺。有用戶發(fā)現(xiàn),當(dāng)用英文詢問“what model are you”時,DeepSeek-V3錯誤地回答自己是ChatGPT。盡管在中文環(huán)境下或加上問號后能夠正確回答,但這一小插曲還是引發(fā)了一些討論。不過,據(jù)最新測試顯示,該問題已經(jīng)得到修復(fù)。

除了這一小插曲外,DeepSeek-V3在回答一些復(fù)雜問題時也表現(xiàn)出了不錯的實力。例如,在回答關(guān)于兔子和雞的數(shù)量問題時,它先通過設(shè)方程解出非整數(shù)解,然后指出題目可能存在矛盾;在回答9.11和9.9哪個數(shù)字大時,給出了正確答案;在回答蒸包子的時間問題時,也正確理解了可以同時蒸多個包子的概念。

而關(guān)于羅福莉的加入,盡管小米方面尚未正式回應(yīng),但她的背景已經(jīng)引起了廣泛關(guān)注。據(jù)悉,羅福莉本科就讀于北京師范大學(xué)計算機專業(yè),碩士畢業(yè)于北京大學(xué)計算語言學(xué)研究所。在研二時,她就在自然語言處理領(lǐng)域頂級會議ACL上發(fā)表了8篇論文,其中兩篇為一作。畢業(yè)后,她加入阿里達摩院機器智能實驗室,主導(dǎo)開發(fā)了多語言預(yù)訓(xùn)練模型VECO。

羅福莉的保研經(jīng)歷也頗具傳奇色彩。她原本并非計算機專業(yè),而是電子專業(yè)。在一次偶然的機會下,她轉(zhuǎn)到了計算機專業(yè)。盡管第一年對編程毫無認(rèn)知,但她通過不斷努力,最終取得了優(yōu)異的成績。她曾表示,自己并非特別聰明,但愿意付出足夠的努力。

此次羅福莉被冠以“天才少女”的稱號,并與小米和Deepseek緊密聯(lián)系在一起,無疑讓她的名字更加響亮。不過,也有網(wǎng)友指出,所謂的8篇ACL論文中,有6篇她只是部分參與。無論如何,羅福莉的加入無疑為小米和Deepseek注入了新的活力。

舉報 0 收藏 0 打賞 0評論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動資訊  |  爭議稿件處理  |  English Version