【ITBEAR】在AI大模型領(lǐng)域,一場關(guān)于預(yù)訓(xùn)練成本的較量正悄然上演。近期,國內(nèi)知名大模型公司零一萬物發(fā)布了其最新的預(yù)訓(xùn)練旗艦?zāi)P汀猋i-Lightning,號稱“閃電”,在國際權(quán)威榜單LMSYS上一舉超越了OpenAI今年5月發(fā)布的GPT-4o和Anthropic的Claude 3.5 Sonnet,排名世界第六,中國第一。
這一成就標(biāo)志著中國大模型在全球競爭中取得了突破性進(jìn)展,零一萬物緊隨OpenAI、Google之后,躋身全球前三大模型企業(yè)行列。
Yi-Lightning不僅在性能上有所提升,其推理速度也實現(xiàn)了質(zhì)的飛躍。相比上半年發(fā)布的Yi-Large,首包時間減少了一半,最高生成速度提升了近四成,堪稱“極速”。同時,該模型的推理成本也大幅降低,每百萬token僅需0.99元,接近行業(yè)最低價。
Yi-Lightning的出色表現(xiàn)得益于零一萬物在多個維度上的扎實儲備,包括芯片人才、推理人才、基礎(chǔ)架構(gòu)人才和算法人才等。這使得零一萬物在面對大模型預(yù)訓(xùn)練的高門檻時,依然能夠堅持“模基共建”的戰(zhàn)略,不斷推動模型性能的優(yōu)化和推理成本的降低。
在LMSYS Chatbot Arena總榜上,Yi-Lightning的成績同樣出眾。它超越了國內(nèi)外多個優(yōu)質(zhì)模型,包括xAI發(fā)布的Grok-2-08-13、智譜發(fā)布的GLM-4-Plus等,在中文分榜上與世界第二名的模型并列。在多輪對話、數(shù)學(xué)能力、代碼能力等多個分榜上,Yi-Lightning也取得了世界前列的優(yōu)異成績。
零一萬物之所以能夠在短時間內(nèi)取得如此顯著的進(jìn)步,與其獨(dú)特的混合專家模型架構(gòu)(MoE)和一系列技術(shù)創(chuàng)新密不可分。例如,Yi-Lightning采用了混合注意力機(jī)制(Hybrid Attention),旨在平衡模型在處理長序列數(shù)據(jù)時的性能和計算資源消耗。同時,動態(tài)Top-P路由機(jī)制的引入也使得Yi-Lightning能夠更加智能地適應(yīng)各種任務(wù)需求,實現(xiàn)“極速推理”。
隨著Yi-Lightning的發(fā)布,零一萬物在AI大模型領(lǐng)域的應(yīng)用探索也進(jìn)一步擴(kuò)展。其最新推出的AI 2.0數(shù)字人產(chǎn)品已接入Yi-Lightning,在零售和電商等場景中展現(xiàn)出強(qiáng)大的實時互動能力和話術(shù)生成能力。某酒旅企業(yè)在接入該數(shù)字人直播后,GMV較此前上升了170%。
Yi-Lightning的推出不僅彰顯了中國在大模型領(lǐng)域的強(qiáng)大技術(shù)實力,也為中國大模型公司的發(fā)展提供了新的思路。即堅持“模型+AI Infra+應(yīng)用”三位一體的全棧式布局,以國際領(lǐng)先的基座模型為基礎(chǔ),積極探索企業(yè)級解決方案,推動整個大模型行業(yè)形成健康的生態(tài)。
目前,Yi-Lightning已上線Yi大模型開放平臺(https://platform.lingyiwanwu.com/),每百萬token僅需0.99元,支持開發(fā)者與企業(yè)客戶輕松實現(xiàn)SOTA大模型自由。這一舉措無疑將進(jìn)一步推動大模型技術(shù)的普及和應(yīng)用。
零一萬物的成功也引發(fā)了對中國大模型行業(yè)未來發(fā)展的深入思考。在算力受限的情況下,中國基座模型的研發(fā)能力如何追趕國外頂尖大模型?零一萬物的實踐表明,通過技術(shù)創(chuàng)新和全棧式布局,中國大模型公司有望在全球競爭中脫穎而出,打造新質(zhì)生產(chǎn)力。
展望未來,隨著大模型技術(shù)的不斷發(fā)展和普及,其應(yīng)用場景也將更加廣泛。零一萬物將繼續(xù)堅持“模基共建”的戰(zhàn)略,不斷探索大模型在各個領(lǐng)域的應(yīng)用潛力,為推動人工智能技術(shù)的發(fā)展和應(yīng)用貢獻(xiàn)自己的力量。