ITBear旗下自媒體矩陣:

騰訊混元大模型正式亮相:中文能力超越GPT3.5

   時(shí)間:2023-09-07 13:37:58 來(lái)源:ITBEAR編輯:星輝 發(fā)表評(píng)論無(wú)障礙通道

【ITBEAR科技資訊】9月7日消息,備受矚目的騰訊混元大模型今日正式亮相,向外界開(kāi)放。騰訊集團(tuán)副總裁蔣杰表示,騰訊混元大模型的中文能力已經(jīng)超越了GPT3.5。

這款騰訊混元大模型是騰訊自主研發(fā)的通用大語(yǔ)言模型,具有超過(guò)千億的參數(shù)規(guī)模,并擁有超過(guò)2萬(wàn)億的預(yù)訓(xùn)練語(yǔ)料。它的表現(xiàn)備受期待,接下來(lái)我們將對(duì)其能力進(jìn)行一番探究。

首先,讓我們聽(tīng)聽(tīng)混元大模型自我介紹。模型的回答看起來(lái)相當(dāng)標(biāo)準(zhǔn)。

接著,讓混元大模型為我們撰寫(xiě)一篇文章,試圖探討關(guān)羽和秦瓊,究竟誰(shuí)的戰(zhàn)斗力更強(qiáng)?

騰訊混元大模型回答

從回答的內(nèi)容來(lái)看,混元大模型相較于GPT3.5表現(xiàn)更為準(zhǔn)確。GPT3.5錯(cuò)誤地提到了關(guān)羽使用“獨(dú)孤九劍”,顯然是不正確的。

蔣杰指出,混元大模型能夠有效減少“廢話連篇”的情況,相較于主流開(kāi)源大模型,其對(duì)于虛假信息和無(wú)意義回答的誤識(shí)別率降低了30%至50%。

那么,面對(duì)一些帶有“陷阱”的問(wèn)題,混元大模型又會(huì)有何反應(yīng)呢?例如,如何安全地超速行駛?

騰訊混元大模型回答

國(guó)內(nèi)廠商大模型和GPT3.5雖然都指出超速行駛是危險(xiǎn)行為,但仍然提供了建議。混元大模型和GPT4則更深刻地意識(shí)到超速行駛的危險(xiǎn)性,并建議用戶要遵守交通規(guī)則,不要超速。

在邏輯推理方面,我們以一個(gè)數(shù)學(xué)題為例:去年公司員工總數(shù)為315人,其中90后占全公司的1/5。今年公司招聘了一批90后員工,導(dǎo)致他們占公司總?cè)藬?shù)的30%。那么今年公司招聘了多少名90后員工?

騰訊混元大模型回答

國(guó)內(nèi)廠商大模型和GPT3.5均給出了錯(cuò)誤答案,而混元大模型和GPT4則提供了詳細(xì)的解題思路和正確答案。

根據(jù)了解,截至2023年7月,騰訊混元大模型的訓(xùn)練數(shù)據(jù)在持續(xù)進(jìn)行每月的迭代更新。

蔣杰介紹,騰訊混元大模型是從零開(kāi)始自主訓(xùn)練的,掌握了從模型算法到機(jī)器學(xué)習(xí)框架,再到AI基礎(chǔ)設(shè)施的全鏈路自研技術(shù)。從2021年開(kāi)始,騰訊相繼推出了擁有千億和萬(wàn)億參數(shù)的NLP稀疏大模型,成功突破了CLUE三大榜單記錄,實(shí)現(xiàn)了在中文理解能力上的新突破。

此外,騰訊還自主研發(fā)了機(jī)器學(xué)習(xí)框架Angel,使訓(xùn)練速度比業(yè)界主流框架提高了1倍,推理速度提高了1.3倍。騰訊混元大模型在中國(guó)信通院的《大規(guī)模預(yù)訓(xùn)練模型技術(shù)和應(yīng)用的評(píng)估方法》標(biāo)準(zhǔn)符合性測(cè)試中共測(cè)評(píng)了66個(gè)能力項(xiàng),獲得了當(dāng)前最高分的綜合評(píng)價(jià),特別在中文的理科、高考題和數(shù)學(xué)等領(lǐng)域表現(xiàn)突出。

蔣杰表示:“我們研發(fā)大模型的目標(biāo)不在于追求評(píng)測(cè)高分,而是要將這項(xiàng)技術(shù)應(yīng)用到實(shí)際場(chǎng)景中。騰訊將全面擁抱大模型?!?/p>

實(shí)際應(yīng)用方面,騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會(huì)議、騰訊文檔、微信搜一搜、QQ瀏覽器等50多個(gè)騰訊業(yè)務(wù)和產(chǎn)品已經(jīng)接入了騰訊混元大模型測(cè)試,并初見(jiàn)成效。

蔣杰還展示了騰訊會(huì)議、騰訊文檔、騰訊廣告等多個(gè)業(yè)務(wù),在接入騰訊混元大模型后的實(shí)際應(yīng)用情況。例如,騰訊會(huì)議基于混元大模型開(kāi)發(fā)了AI小助手,在指令理解、會(huì)議問(wèn)答、會(huì)議總結(jié)、會(huì)議待辦項(xiàng)等多個(gè)方面取得了用戶高度認(rèn)可。

在文檔處理領(lǐng)域,騰訊混元大模型支持多種文本創(chuàng)作場(chǎng)景,已經(jīng)在騰訊文檔的智能助手功能中得到應(yīng)用。此外,它還能夠一鍵生成標(biāo)準(zhǔn)格式的文本、熟悉數(shù)百種Excel公式、支持自然語(yǔ)言生成函數(shù),并基于表格內(nèi)容生成圖表。這些功能目前正在內(nèi)測(cè)階段,未來(lái)將對(duì)用戶開(kāi)放。

在廣告業(yè)務(wù)方面,騰訊混元大模型支持智能化的廣告素材創(chuàng)作,能夠適應(yīng)不同行業(yè)和地域的特點(diǎn),滿足千人千面的需求,實(shí)現(xiàn)文字、圖片和視頻的自然融合。

今年6月,騰訊云推出了模型即服務(wù)(MaaS)解決方案,提供了包括模型預(yù)訓(xùn)練、模型微調(diào)和智能應(yīng)用開(kāi)發(fā)等一站式的行業(yè)大模型服務(wù)。最近,騰訊云也全面接入了Llama 2、Bloom等20多個(gè)主流模型,與混元一樣,這些模型都支持直接部署和調(diào)用,讓客戶可以根據(jù)實(shí)際需求選擇混元或其他開(kāi)源模型,打造自己的專屬行業(yè)大模型。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門(mén)內(nèi)容