【ITBEAR科技資訊】10月30日消息,百川智能今日宣布推出了全新的Baichuan2-192K大模型,開創(chuàng)了全球最長的上下文窗口記錄。這一創(chuàng)新模型具有令人矚目的上下文處理能力,其上下文窗口長度達(dá)到了驚人的192K,能夠處理高達(dá)35萬個漢字的文本,為用戶提供了前所未有的語義信息豐富性。
據(jù)ITBEAR科技資訊了解,百川智能表示,Baichuan2-192K在支持長上下文窗口方面表現(xiàn)卓越,比目前最優(yōu)秀的大模型Claude2(100K上下文窗口,實測約8萬字)提高了4.4倍,并且比GPT-4(支持32K上下文窗口,實測約2.5萬字)提高了14倍,這將使用戶在自然語言處理領(lǐng)域獲益匪淺。
上下文窗口長度是大型模型的核心技術(shù)之一,通過擴(kuò)大上下文窗口,模型可以更好地理解文本背后的語境,提高上下文相關(guān)性和語義信息的豐富性,減少歧義,從而更準(zhǔn)確、流暢地生成內(nèi)容,提高了模型的整體性能。
Baichuan2-192K在多個評測集上表現(xiàn)出色,包括Dureader、NarrativeQA、LSHT、TriviaQA等10項中英文長文本問答和摘要任務(wù),其中有7項已經(jīng)達(dá)到了最佳表現(xiàn)。
百川智能宣布,Baichuan2-192K將以API調(diào)用和私有化部署的方式提供給企業(yè)用戶。目前,他們已啟動了Baichuan2-192K的API內(nèi)測,并將首先向法律、媒體、金融等行業(yè)的核心合作伙伴開放,以推動自然語言處理技術(shù)的應(yīng)用和發(fā)展。這一創(chuàng)新將為各行各業(yè)的企業(yè)用戶提供更強(qiáng)大的文本處理工具,幫助他們提高工作效率和數(shù)據(jù)分析的準(zhǔn)確性。