科大訊飛在線上隆重推出了訊飛星火4.0 Turbo的全新升級(jí)版,標(biāo)志著其在人工智能領(lǐng)域邁出了重要一步。此次升級(jí)不僅顯著增強(qiáng)了數(shù)學(xué)運(yùn)算、行業(yè)知識(shí)理解、圖文識(shí)別以及長(zhǎng)文本處理等多方面的能力,還首次引入了混域知識(shí)搜索技術(shù),直擊行業(yè)痛點(diǎn),為企業(yè)帶來了前所未有的智能體驗(yàn)。
科大訊飛通過與多個(gè)行業(yè)領(lǐng)軍企業(yè)的深度合作,使得訊飛星火4.0 Turbo在金融、油氣、能源、電力、鋼鐵及航空等關(guān)鍵領(lǐng)域的應(yīng)用效能實(shí)現(xiàn)了顯著提升,綜合能力提升幅度均超過10%,充分展示了其在推動(dòng)產(chǎn)業(yè)智能化轉(zhuǎn)型方面的巨大潛力。
在當(dāng)前大模型市場(chǎng)趨于平緩,眾多公司減緩底座模型迭代速度的背景下,科大訊飛堅(jiān)守初心,持續(xù)加大投入,訊飛星火4.0 Turbo的七大核心能力實(shí)現(xiàn)了全面提升。這一成果不僅彰顯了科大訊飛在AI領(lǐng)域的深厚積累與強(qiáng)大實(shí)力,更是對(duì)市場(chǎng)需求和行業(yè)痛點(diǎn)精準(zhǔn)把握的體現(xiàn)。
訊飛星火4.0 Turbo的升級(jí),充分融合了行業(yè)龍頭企業(yè)的實(shí)際需求以及超過2億C端用戶的真實(shí)反饋,使得大模型能夠處理更長(zhǎng)的文本、理解更復(fù)雜的圖文信息,并大幅減少了幻覺問題。這一改進(jìn)使得大模型在行業(yè)理解能力上邁上了新的臺(tái)階。
在數(shù)學(xué)能力方面,訊飛星火4.0 Turbo的進(jìn)步尤為顯著,提升幅度達(dá)到了10.5%。這一進(jìn)步不僅提升了模型在數(shù)學(xué)教育和金融分析等領(lǐng)域的應(yīng)用能力,更為科研工作的深入提供了強(qiáng)有力的支持。圖文識(shí)別能力的提升也是此次升級(jí)的一大亮點(diǎn),通用文檔版面分析和文字識(shí)別的準(zhǔn)確率提高了40%,對(duì)于復(fù)雜表格結(jié)構(gòu)和潦草手寫文字的識(shí)別準(zhǔn)確率更是提升了60%。
發(fā)布會(huì)現(xiàn)場(chǎng),科大訊飛的研究員通過生動(dòng)的案例展示了訊飛星火4.0 Turbo的強(qiáng)大功能。在醫(yī)療領(lǐng)域,模型能夠準(zhǔn)確識(shí)別體檢報(bào)告中的復(fù)雜表格和手寫文字;在法律領(lǐng)域,法院文書、印章手寫合同等復(fù)雜文檔也能被迅速解析。無(wú)論是學(xué)術(shù)論文中的長(zhǎng)表格,還是企業(yè)合同中的復(fù)雜版式,訊飛星火4.0 Turbo都能輕松應(yīng)對(duì),展現(xiàn)出卓越的識(shí)別與處理能力。
訊飛星火4.0 Turbo的圖文識(shí)別能力不僅在國(guó)內(nèi)領(lǐng)先,還超越了國(guó)際最優(yōu)競(jìng)品。模型還針對(duì)性地提升了文檔要素檢測(cè)能力,知識(shí)切分和構(gòu)建的粒度更加精細(xì)、準(zhǔn)確,有效防止了大模型幻覺問題的發(fā)生。同時(shí),面向大規(guī)模掃描文檔解析的極速版本也同步發(fā)布,文檔理解速度提升了10倍以上,使得處理500頁(yè)項(xiàng)目文件的全過程僅需2分鐘即可完成。
在長(zhǎng)文本處理方面,訊飛星火4.0 Turbo也實(shí)現(xiàn)了重大突破。模型采用了全新的長(zhǎng)文本框架,并首發(fā)了句子級(jí)溯源功能。這一新框架優(yōu)化了超長(zhǎng)注意力機(jī)制,并利用大規(guī)模網(wǎng)頁(yè)和書籍?dāng)?shù)據(jù)進(jìn)行知識(shí)關(guān)聯(lián)式合成,使得知識(shí)回復(fù)的錯(cuò)誤率降低了40%,句子級(jí)知識(shí)溯源準(zhǔn)確率達(dá)90%,甚至超越了GPT-4的表現(xiàn)。這一改進(jìn)大幅緩解了問答搜索服務(wù)中因大模型幻覺而需要反復(fù)溯源確認(rèn)的問題。
科大訊飛在發(fā)布會(huì)上還展示了訊飛星火2024年的成績(jī)單。數(shù)據(jù)顯示,科大訊飛在去年的大模型招投標(biāo)中表現(xiàn)出色,中標(biāo)數(shù)量和中標(biāo)金額均位居第一,成為名副其實(shí)的“標(biāo)王”。在應(yīng)用類項(xiàng)目中,數(shù)字人與客服、知識(shí)問答與知識(shí)平臺(tái)、智能編程等應(yīng)用場(chǎng)景表現(xiàn)尤為突出。特別是在中標(biāo)金額方面,科大訊飛以絕對(duì)優(yōu)勢(shì)領(lǐng)先,超過了第二名到第六名的中標(biāo)金額之和,充分展示了其在市場(chǎng)中的強(qiáng)大競(jìng)爭(zhēng)力和品牌影響力。
這份成績(jī)單的背后,是科大訊飛在多個(gè)行業(yè)的廣泛布局和深耕細(xì)作。公司在通信、金融、能源、教育、政務(wù)和醫(yī)療等領(lǐng)域均取得了顯著成果,主要客戶均為央國(guó)企等重量級(jí)單位。通過與客戶共同打磨近百個(gè)智能體應(yīng)用,科大訊飛積累了豐富的行業(yè)經(jīng)驗(yàn)和數(shù)據(jù)資源。
基于圖文、長(zhǎng)文本能力的提升和行業(yè)應(yīng)用能力的積累,科大訊飛在此次發(fā)布會(huì)上還首發(fā)了混域知識(shí)搜索技術(shù)。該技術(shù)能夠?qū)崿F(xiàn)對(duì)個(gè)人知識(shí)、企業(yè)知識(shí)、業(yè)務(wù)系統(tǒng)數(shù)據(jù)、精品行業(yè)數(shù)據(jù)以及互聯(lián)網(wǎng)信息的綜合搜索。用戶只需一次提問,即可獲得綜合搜索后的結(jié)果,大幅提升了信息搜索效率。
通過“技術(shù)+應(yīng)用”的不斷正向循環(huán),訊飛星火學(xué)習(xí)到了豐富的行業(yè)高價(jià)值知識(shí)。研發(fā)團(tuán)隊(duì)通過收集大量高質(zhì)量的行業(yè)數(shù)據(jù),自制高質(zhì)量數(shù)據(jù)集,不斷打磨出更加精準(zhǔn)、高效的行業(yè)大模型?;诖?,訊飛星火4.0 Turbo在金融、油氣、能源、電力、鋼鐵、航司等多個(gè)關(guān)鍵領(lǐng)域均取得了顯著成果,成為了“最懂行業(yè)的大模型”。