ITBear旗下自媒體矩陣:

英偉達(dá)DeepSeek-R1模型登陸NIM微服務(wù)平臺(tái),加速AI部署

   時(shí)間:2025-01-31 09:19:28 來(lái)源:ITBEAR編輯:快訊團(tuán)隊(duì) 發(fā)表評(píng)論無(wú)障礙通道

英偉達(dá)今日正式揭曉,其DeepSeek-R1模型已在build.nvidia.com平臺(tái)上以NVIDIA NIM微服務(wù)的預(yù)覽形式亮相。這一創(chuàng)新服務(wù)在NVIDIA HGX H200系統(tǒng)上實(shí)現(xiàn)了驚人的性能,每秒可處理高達(dá)3,872個(gè)tokens,標(biāo)志著AI處理能力的又一次飛躍。

據(jù)悉,開(kāi)發(fā)人員現(xiàn)在即可通過(guò)該平臺(tái)測(cè)試和體驗(yàn)全新的應(yīng)用程序編程接口(API)。這一API預(yù)計(jì)很快將以可下載的NIM微服務(wù)形式推出,成為NVIDIA AI Enterprise軟件平臺(tái)的重要組成部分。通過(guò)這一平臺(tái),英偉達(dá)正不斷推動(dòng)AI技術(shù)的邊界,為企業(yè)和個(gè)人開(kāi)發(fā)者提供更多可能性。

DeepSeek-R1 NIM微服務(wù)不僅簡(jiǎn)化了部署流程,還通過(guò)支持行業(yè)標(biāo)準(zhǔn)API,進(jìn)一步降低了技術(shù)門(mén)檻。企業(yè)可以在自己的加速計(jì)算基礎(chǔ)設(shè)施上運(yùn)行NIM微服務(wù),從而確保數(shù)據(jù)的安全性和隱私性。結(jié)合NVIDIA AI Foundry和NVIDIA NeMo軟件,企業(yè)還能為特定的AI代理定制專(zhuān)屬的DeepSeek-R1 NIM微服務(wù),實(shí)現(xiàn)更加個(gè)性化和高效化的AI應(yīng)用。

回顧過(guò)去,英偉達(dá)在2024年3月推出了NIM(Nvidia Inference Microservices)云原生微服務(wù),旨在幫助各種規(guī)模的企業(yè)更便捷地部署AI服務(wù)。NIM微服務(wù)經(jīng)過(guò)精心優(yōu)化,旨在縮短產(chǎn)品上市時(shí)間,并簡(jiǎn)化生成式AI模型在云、數(shù)據(jù)中心和GPU加速工作站等任何地點(diǎn)的部署過(guò)程。通過(guò)采用行業(yè)標(biāo)準(zhǔn)API,NIM微服務(wù)成功地將AI模型開(kāi)發(fā)和生產(chǎn)包裝的復(fù)雜性抽象化,從而吸引了更多開(kāi)發(fā)者加入這一領(lǐng)域。

英偉達(dá)的這一系列舉措不僅展示了其在AI技術(shù)領(lǐng)域的深厚積累,也彰顯了其致力于推動(dòng)AI技術(shù)普及和發(fā)展的決心。隨著DeepSeek-R1 NIM微服務(wù)的推出,我們有理由相信,未來(lái)將有更多創(chuàng)新性的AI應(yīng)用涌現(xiàn),為人們的生活和工作帶來(lái)更多便利和可能性。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類(lèi)資訊
全站最新
熱門(mén)內(nèi)容
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開(kāi)放轉(zhuǎn)載  |  滾動(dòng)資訊  |  爭(zhēng)議稿件處理  |  English Version