隨著人工智能技術(shù)的迅猛發(fā)展,每一次技術(shù)變革都預(yù)示著行業(yè)的躍遷式進(jìn)步。面對(duì)以AI為核心的新一輪技術(shù)浪潮,企業(yè)如何在技術(shù)支撐上做好準(zhǔn)備,迎接通用人工智能時(shí)代的到來,成為了亟待解決的問題。
近日,在2024火山引擎FORCE原動(dòng)力大會(huì)冬季技術(shù)主論壇上,一系列創(chuàng)新產(chǎn)品及升級(jí)方案亮相,旨在解決企業(yè)在落地大模型過程中遇到的實(shí)際難題。字節(jié)跳動(dòng)基礎(chǔ)架構(gòu)負(fù)責(zé)人趙鵬偉在會(huì)上表示,為了迎接通用人工智能時(shí)代,企業(yè)需要在性價(jià)比、創(chuàng)新及安全等多個(gè)維度進(jìn)行布局?;鹕揭鏋榇颂峁┝薃I云原生式的全鏈路產(chǎn)品服務(wù)能力,涵蓋豆包大模型、大模型服務(wù)、AI基礎(chǔ)設(shè)施、數(shù)據(jù)和安全等多個(gè)方向的新成果,致力于與企業(yè)和開發(fā)者共同推進(jìn)AI的創(chuàng)新變革。
趙鵬偉進(jìn)一步指出,過去十年中,云原生架構(gòu)以其彈性、存算分離及服務(wù)化等能力,為企業(yè)構(gòu)建大規(guī)模業(yè)務(wù)系統(tǒng)提供了有力支持。然而,隨著AI時(shí)代的到來,計(jì)算模式逐漸轉(zhuǎn)向以GPU為核心,傳統(tǒng)架構(gòu)難以充分發(fā)揮GPU的高算力及高帶寬優(yōu)勢。同時(shí),GPU在訓(xùn)練和推理場景中對(duì)高速互聯(lián)、在線存儲(chǔ)及隱私安全提出了更高要求。因此,火山引擎提出,下一個(gè)十年的計(jì)算范式應(yīng)進(jìn)入AI云原生的新時(shí)代,以GPU為核心重新優(yōu)化計(jì)算、存儲(chǔ)與網(wǎng)絡(luò)架構(gòu),實(shí)現(xiàn)GPU直接訪問存儲(chǔ)和數(shù)據(jù)庫,顯著降低IO延遲,并提供更高規(guī)模的高速互聯(lián)及端到端的安全保護(hù)。
在計(jì)算層面,火山引擎推出了新一代GPU實(shí)例,通過vRDMA網(wǎng)絡(luò)支持大規(guī)模并行計(jì)算和P/D分離推理架構(gòu),顯著提升了訓(xùn)練和推理效率,降低了成本。在存儲(chǔ)方面,新推出的EIC彈性極速緩存能夠?qū)崿F(xiàn)GPU直連,使大模型推理時(shí)延降低至原來的五十分之一,成本降低20%。在安全層面,火山引擎將推出PCC私密云服務(wù),構(gòu)建大模型的可信應(yīng)用體系,實(shí)現(xiàn)用戶數(shù)據(jù)在云上推理的端到端加密,且性能優(yōu)越,推理時(shí)延與明文模式相比差異在5%以內(nèi)。
作為一站式大模型服務(wù)平臺(tái),火山方舟通過Cache、離線推理模式等產(chǎn)品升級(jí),以及全新發(fā)布的Prompt優(yōu)解,加速了大模型能力的落地。Prompt優(yōu)解通過“自動(dòng)+互動(dòng)”的方式協(xié)助用戶編寫提示詞,使用戶在互動(dòng)中表達(dá)需求,快速上手。利用機(jī)器實(shí)現(xiàn)類似人類的反思、類比及錯(cuò)誤總結(jié)能力,全自動(dòng)優(yōu)化prompt,助力企業(yè)以低成本高效率獲得高質(zhì)量prompt。目前,Prompt優(yōu)解已通過火山方舟全面開放公測。
火山引擎始終堅(jiān)持提供更低成本、更高質(zhì)量的服務(wù)。為踐行“人人用得起,才是好模型”的理念,火山引擎發(fā)布了離線批量推理方案和上下文緩存,幫助用戶實(shí)現(xiàn)更為精細(xì)化和低成本的運(yùn)營。全新發(fā)布的扣子1.5和HiAgent1.5,助力企業(yè)打造AI原生應(yīng)用,跨越從通用大模型到企業(yè)AI應(yīng)用落地的三道鴻溝。
豆包大模型也發(fā)布了多個(gè)新版本,包括豆包·視覺理解模型、豆包·文生圖模型2.1和豆包·音樂模型,這些模型可以通過扣子以插件的方式體驗(yàn),有助于更多多模態(tài)AI應(yīng)用的誕生。在數(shù)據(jù)智能方面,火山引擎發(fā)布了數(shù)據(jù)飛輪2.0,通過AI創(chuàng)新重新定義企業(yè)數(shù)據(jù)智能,全面注入大模型,帶來前所未有的決策洞察。通過一體化數(shù)智研發(fā)與一站式數(shù)據(jù)智能運(yùn)營,簡化工作流程,快速處理結(jié)構(gòu)與非結(jié)構(gòu)數(shù)據(jù)資產(chǎn),激發(fā)企業(yè)更多潛在數(shù)據(jù)資產(chǎn),實(shí)現(xiàn)更大動(dòng)力。
數(shù)據(jù)飛輪2.0圍繞企業(yè)數(shù)據(jù)建設(shè)與數(shù)據(jù)應(yīng)用的各個(gè)環(huán)節(jié),全系產(chǎn)品迎來了全面實(shí)現(xiàn)AI創(chuàng)新的新階段。同時(shí),火山引擎發(fā)布了兩大核心方案:一是Data Fabric驅(qū)動(dòng)下的ChatBI智能體,使數(shù)據(jù)消費(fèi)更加簡單直接,通過構(gòu)建完整的智能數(shù)據(jù)服務(wù)體系,打破數(shù)據(jù)“專業(yè)”壁壘,幫助企業(yè)內(nèi)每個(gè)業(yè)務(wù)定制專屬智能體,降低數(shù)據(jù)使用門檻,提升大模型能力下的數(shù)據(jù)反饋效率和準(zhǔn)確率;二是多模態(tài)數(shù)據(jù)湖,拓寬數(shù)據(jù)資產(chǎn)的邊界,實(shí)現(xiàn)海量結(jié)構(gòu)化、半結(jié)構(gòu)化及非結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)一精細(xì)化管理,全方位兼容各類數(shù)據(jù)格式,為LLM預(yù)訓(xùn)練、持續(xù)訓(xùn)練和微調(diào)提供全程支持。
在云安全方面,火山引擎圍繞“讓智能更安全、讓安全更智能”的理念,為AI基礎(chǔ)設(shè)施提供透明可信的安全保障。同時(shí),通過安全智能體,將字節(jié)跳動(dòng)積累的安全經(jīng)驗(yàn)服務(wù)于每個(gè)企業(yè),為AI應(yīng)用提供堅(jiān)實(shí)的安全后盾。
隨著大模型應(yīng)用進(jìn)入快速發(fā)展階段,企業(yè)對(duì)模型能力、價(jià)格及落地難度提出了更高要求。火山引擎本次發(fā)布的多款全新產(chǎn)品及升級(jí)方案,進(jìn)一步降低了模型訓(xùn)練及推理應(yīng)用的難度,以高性價(jià)比和強(qiáng)安全保障,為企業(yè)落地AI能力奠定了堅(jiān)實(shí)基礎(chǔ)。