近期,大模型領(lǐng)域的初創(chuàng)企業(yè)月之暗面被曝引入了一位重量級(jí)技術(shù)專家——?jiǎng)⒄麇侨A為諾亞方舟實(shí)驗(yàn)室AI基礎(chǔ)理論團(tuán)隊(duì)的核心研究員,并一度受到字節(jié)跳動(dòng)高層的青睞,邀請(qǐng)其加入其大模型團(tuán)隊(duì)。針對(duì)這一消息,月之暗面方面向媒體表示,目前官方不便作出回應(yīng)。
劉征瀛的學(xué)術(shù)背景十分耀眼,他本科階段在北京大學(xué)元培學(xué)院攻讀物理和數(shù)學(xué)雙學(xué)位,后赴巴黎薩克雷大學(xué)深造,獲得博士學(xué)位,專攻自動(dòng)化深度學(xué)習(xí)(AutoML)領(lǐng)域。他的研究方向聚焦于AI for Math以及大語(yǔ)言模型推理能力的深入探索與應(yīng)用。
在2023年年底的一次演講中,劉征瀛以《AI4Math: 挑戰(zhàn)與進(jìn)展》為題,分享了他對(duì)當(dāng)前大語(yǔ)言模型(LLMs)發(fā)展的見(jiàn)解。他指出,盡管LLMs在文本分類、機(jī)器翻譯等傳統(tǒng)自然語(yǔ)言處理任務(wù)上已展現(xiàn)出類人甚至超人的水平,但在符號(hào)推理、數(shù)學(xué)推理等復(fù)雜任務(wù)上,仍有巨大的提升空間。
本月,月之暗面在經(jīng)歷了一場(chǎng)仲裁風(fēng)波后,于11月16日正式發(fā)布了其首款推理能力強(qiáng)化模型k0-math。據(jù)透露,k0-math在多項(xiàng)基準(zhǔn)能力測(cè)試中,數(shù)學(xué)能力已能與全球領(lǐng)先的OpenAI o1系列中的o1-mini和o1-preview兩個(gè)公開(kāi)模型相媲美。月之暗面創(chuàng)始人楊植麟表示,k0-math的研發(fā)思路與o1系列相似,均采用了強(qiáng)化學(xué)習(xí)和思維鏈技術(shù)。
在談及月之暗面的未來(lái)規(guī)劃時(shí),楊植麟強(qiáng)調(diào)了數(shù)學(xué)模型和深度推理的重要性,將其視為公司“登月計(jì)劃”的第二步。同時(shí),他也透露了公司在業(yè)務(wù)上的聚焦策略,即主動(dòng)進(jìn)行業(yè)務(wù)減法,專注于核心領(lǐng)域的發(fā)展。楊植麟表示,月之暗面在所有大模型創(chuàng)業(yè)公司中人數(shù)最少,但算力和人的比例卻是最高的,他認(rèn)為這是公司保持競(jìng)爭(zhēng)力的關(guān)鍵。
對(duì)于與字節(jié)跳動(dòng)豆包等大模型產(chǎn)品的競(jìng)爭(zhēng),楊植麟持開(kāi)放態(tài)度。他表示,月之暗面更關(guān)注如何為用戶提供真正的價(jià)值,而非競(jìng)爭(zhēng)本身。他強(qiáng)調(diào),公司的核心在于傳遞更好的技術(shù)和產(chǎn)品,為用戶創(chuàng)造更大的價(jià)值。未來(lái),月之暗面將繼續(xù)聚焦提升模型的思考推理能力,堅(jiān)持做正確的事情,而不是刻意追求與眾不同。