隨著每一次工業(yè)革命的浪潮,人類社會經(jīng)歷了前所未有的躍遷式發(fā)展。如今,以人工智能(AI)為核心的新一輪技術(shù)變革正洶涌而來,企業(yè)如何在這樣的背景下獲取必要的技術(shù)支撐,為通用人工智能時代的到來做好充足準(zhǔn)備,成為了業(yè)界關(guān)注的焦點(diǎn)。
近日,在2024火山引擎FORCE原動力大會·冬技術(shù)主論壇上,一系列創(chuàng)新產(chǎn)品及升級方案被隆重推出,旨在幫助企業(yè)解決落地大模型所面臨的實(shí)際難題。字節(jié)跳動基礎(chǔ)架構(gòu)負(fù)責(zé)人趙鵬偉在會上發(fā)表了重要講話。
“為了迎接通用人工智能時代的到來,企業(yè)必須在性價比、創(chuàng)新能力和安全保障等方面做好充分準(zhǔn)備?!壁w鵬偉指出,“火山引擎通過提供AI云原生式的全鏈路產(chǎn)品服務(wù)能力,包括豆包大模型、大模型服務(wù)、AI基礎(chǔ)設(shè)施、數(shù)據(jù)和安全方向的新成果,致力于與眾多企業(yè)和開發(fā)者共同推進(jìn)未來的AI創(chuàng)新變革。”
火山引擎提出了AI云原生的新概念,認(rèn)為未來的計(jì)算范式應(yīng)以GPU為核心,重新優(yōu)化計(jì)算、存儲與網(wǎng)絡(luò)架構(gòu)。AI云原生將允許GPU直接訪問存儲和數(shù)據(jù)庫,顯著降低IO延遲,并提供更高規(guī)模的高速互聯(lián)和端到端的安全保護(hù)。為此,火山引擎將打造以AI負(fù)載為中心的基礎(chǔ)架構(gòu)新范式,推出新一代計(jì)算、網(wǎng)絡(luò)、存儲和安全產(chǎn)品。
在計(jì)算層面,火山引擎推出了新一代GPU實(shí)例,通過vRDMA網(wǎng)絡(luò)支持大規(guī)模并行計(jì)算和P/D分離推理架構(gòu),顯著提升訓(xùn)練和推理效率,降低成本。在存儲方面,新發(fā)布的EIC彈性極速緩存能夠?qū)崿F(xiàn)GPU直連,使大模型推理時延降低至原來的五十分之一,成本降低20%。在安全層面,火山引擎推出了PCC私密云服務(wù),構(gòu)建大模型的可信應(yīng)用體系,實(shí)現(xiàn)用戶數(shù)據(jù)在云上推理的端到端加密,且性能優(yōu)越,推理時延與明文模式相比差異在5%以內(nèi)。
火山方舟作為一站式大模型服務(wù)平臺,通過Cache、離線推理模式等產(chǎn)品與升級,以及全新發(fā)布的Prompt優(yōu)解,加速了大模型能力的落地。Prompt優(yōu)解通過“自動+互動”的方式協(xié)助用戶編寫提示詞,用機(jī)器實(shí)現(xiàn)類似人類的反思、類比、錯誤總結(jié)能力,全自動優(yōu)化prompt,助力企業(yè)低成本高效率獲得高質(zhì)量prompt。目前,Prompt優(yōu)解已通過火山方舟開放全量公測。
火山引擎始終將成本和價格作為重要考量因素,發(fā)布了離線批量推理方案和上下文緩存,進(jìn)一步踐行“人人用得起,才是好模型”的理念,幫助用戶實(shí)現(xiàn)更為精細(xì)化和低成本的運(yùn)營。
全新發(fā)布的扣子1.5和HiAgent1.5,助力企業(yè)打造AI原生應(yīng)用。從通用大模型到企業(yè)AI應(yīng)用落地,需要跨越三道鴻溝,而扣子1.5和HiAgent1.5的推出,將幫助企業(yè)更好地實(shí)現(xiàn)這一轉(zhuǎn)變。豆包大模型最新發(fā)布的視覺理解模型、文生圖模型2.1和音樂模型,都可以通過扣子以插件的方式體驗(yàn),有助于更多多模態(tài)AI應(yīng)用的誕生。
為了幫助企業(yè)用好數(shù)據(jù),驅(qū)動業(yè)務(wù)價值的提升,火山引擎發(fā)布了數(shù)據(jù)飛輪2.0,通過AI創(chuàng)新重新定義企業(yè)數(shù)據(jù)智能。數(shù)據(jù)飛輪2.0全面注入大模型,帶來前所未有的決策洞察,通過一體化數(shù)智研發(fā)與一站式數(shù)據(jù)智能運(yùn)營,簡化工作流程。在多元異構(gòu)計(jì)算引擎的加速下,快速處理結(jié)構(gòu)與非結(jié)構(gòu)數(shù)據(jù)資產(chǎn),激發(fā)企業(yè)更多潛在數(shù)據(jù)資產(chǎn),實(shí)現(xiàn)更大的動力。
火山引擎云安全圍繞“讓智能更安全、讓安全更智能”的理念,為AI基礎(chǔ)設(shè)施提供透明可信的安全保障,并通過安全智能體,將字節(jié)跳動沉淀的安全經(jīng)驗(yàn)服務(wù)于每個企業(yè)。大模型應(yīng)用進(jìn)入快速發(fā)展階段,企業(yè)對模型能力、價格以及落地難度都提出了更高要求?;鹕揭姹敬伟l(fā)布的多款全新產(chǎn)品與升級,進(jìn)一步降低了模型訓(xùn)練、推理應(yīng)用的難度,以更高性價比和更強(qiáng)安全保障,為企業(yè)落地AI能力奠定了堅(jiān)實(shí)基礎(chǔ)。