滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 業(yè)界動(dòng)態(tài) > 正文內(nèi)容

英偉達(dá)新推Llama-3.1-Nemotron-51B AI模型，有何亮點(diǎn)？

時(shí)間：2024-09-25 15:21:56 來(lái)源：ITBEAR編輯：快訊團(tuán)隊(duì) 發(fā)表評(píng)論無(wú)障礙通道

【ITBEAR】9月25日消息，英偉達(dá)近日宣布，他們成功推出了Llama-3.1-Nemotron-51B AI模型，這一模型是基于meta公司的Llama-3.1-70B進(jìn)行優(yōu)化的。通過(guò)創(chuàng)新的神經(jīng)架構(gòu)搜索（NAS）方法，英偉達(dá)建立了一個(gè)既高度準(zhǔn)確又高效的模型。

Llama-3.1-Nemotron-51B AI模型擁有510億參數(shù)，相較于meta公司計(jì)劃在2024年7月發(fā)布的Llama-3.1-70B模型，該模型在性能和效率上取得了顯著的提升。通過(guò)NAS技術(shù)的微調(diào)，該模型在高工作負(fù)荷下只需一片H100 GPU即可運(yùn)行，大大降低了內(nèi)存消耗、計(jì)算復(fù)雜性以及與運(yùn)行此類(lèi)大型模型相關(guān)的成本。

據(jù)ITBEAR了解，英偉達(dá)在保持模型精度的前提下，顯著降低了內(nèi)存占用、內(nèi)存帶寬和FLOPs，證明了創(chuàng)建更小、更快變體的可能性。與meta的Llama-3.1-70B模型相比，Llama-3.1-Nemotron-51B在推理速度上提高了2.2倍，同時(shí)保持了幾乎相同的精度。

在開(kāi)發(fā)大型語(yǔ)言模型（LLM）的過(guò)程中，平衡精度與計(jì)算效率一直是一個(gè)重大挑戰(zhàn)。許多大規(guī)模模型雖然能提供最先進(jìn)的結(jié)果，但卻需要耗費(fèi)大量的硬件和能源資源，限制了它們的適用性。而英偉達(dá)的新模型則在這兩個(gè)相互競(jìng)爭(zhēng)的因素之間取得了微妙的平衡。

Llama-3.1-Nemotron-51B實(shí)現(xiàn)了精度與效率的出色權(quán)衡，減少了內(nèi)存帶寬，降低了每秒浮點(diǎn)運(yùn)算次數(shù)（FLOP），并減少了總體內(nèi)存占用，同時(shí)不影響模型執(zhí)行推理、總結(jié)和語(yǔ)言生成等復(fù)雜任務(wù)的能力。該模型的一個(gè)突出特點(diǎn)是能夠在單個(gè)GPU上管理更大的工作負(fù)載，允許開(kāi)發(fā)人員在更具成本效益的環(huán)境中部署高性能LLMs。

Llama-3.1-Nemotron-51B模型的成功主要?dú)w功于其新穎的結(jié)構(gòu)優(yōu)化方法。傳統(tǒng)上，LLMs是使用相同的塊構(gòu)建的，這些塊在整個(gè)模型中重復(fù)出現(xiàn)，雖然簡(jiǎn)化了構(gòu)建過(guò)程，但也帶來(lái)了效率低下的問(wèn)題。英偉達(dá)通過(guò)采用NAS技術(shù)來(lái)優(yōu)化推理模型，解決了這些問(wèn)題。他們采用了分塊蒸餾過(guò)程，即訓(xùn)練更小、更高效的學(xué)生模型，以模仿更大的教師模型的功能。

此外，Llama-3.1-Nemotron-51B還采用了Puzzle算法，該算法對(duì)模型中的每個(gè)潛在區(qū)塊進(jìn)行評(píng)分，并確定哪些配置能在速度和精度之間取得最佳平衡。通過(guò)使用知識(shí)蒸餾技術(shù)，Nvidia縮小了參考模型（Llama-3.1-70B）與Nemotron-51B之間的精度差距，同時(shí)顯著降低了訓(xùn)練成本。

總的來(lái)說(shuō)，Llama-3.1-Nemotron-51B AI模型在精度、效率和成本效益方面均取得了顯著突破，為AI領(lǐng)域的進(jìn)一步發(fā)展提供了新的可能性。

關(guān)鍵詞：#英偉達(dá)# #Llama-3.1-Nemotron-51B# #AI模型# #神經(jīng)架構(gòu)搜索# #效率提升#

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0

更多>同類(lèi)資訊

華為坤靈eKitStor Xtreme 200E固態(tài)硬盤(pán)開(kāi)售，1TB僅售499元性能如何？

01-08

CES 2025希捷新品：Rugged SSD Pro5硬盤(pán)，高性能又環(huán)保！

01-08

國(guó)產(chǎn)超導(dǎo)磁體助力“人造太陽(yáng)” 項(xiàng)目取得新突破！

01-08

燕磯長(zhǎng)江大橋主纜架設(shè)啟動(dòng)，亞洲貨運(yùn)樞紐機(jī)場(chǎng)配套工程加速推進(jìn)！

01-08

訊景顯卡質(zhì)保大升級(jí)：鳳凰涅槃系列享3年+個(gè)人直接送保

01-08

升騰W410 2一體機(jī)首發(fā)：搭載兆芯KX-7000處理器，性能大幅提升

01-08

微軟計(jì)劃裁員并強(qiáng)化績(jī)效審查，發(fā)言人：關(guān)注高績(jī)效人才發(fā)展

01-08

2024年我國(guó)發(fā)明專(zhuān)利有效量激增，創(chuàng)新實(shí)力再上新臺(tái)階！

01-08

新浪捐300萬(wàn)助西藏地震災(zāi)區(qū)，微博公益平臺(tái)助力救災(zāi)籌款

三言科技1月8日消息，1月7日9時(shí)5分，西藏日喀則市定日縣發(fā)生6.8級(jí)地震。當(dāng)日，新浪集團(tuán)宣布向地震災(zāi)區(qū)捐贈(zèng)300萬(wàn)元，用于支援地震災(zāi)區(qū)的救助和災(zāi)后重建。與此同時(shí)，微博公益平臺(tái)啟動(dòng)社會(huì)化應(yīng)急救災(zāi)協(xié)作網(wǎng)絡(luò)，…

01-08

翟欣欣敲詐勒索案新進(jìn)展：蘇享茂家屬提起刑訴，1月21日將開(kāi)庭

三言科技1月8日消息，翟欣欣涉嫌敲詐勒索一案又有了新的進(jìn)展。據(jù)紅星新聞報(bào)道，1月7日，從相關(guān)知情人士處了解到，蘇享茂的家屬已提起刑事附帶民事訴訟，并已接到案件將于1月21日開(kāi)庭的通知。 2024年3月7日，…

01-08

微軟或?qū)?dòng)裁員計(jì)劃，重點(diǎn)審查績(jī)效不佳員工？

據(jù)Business Insider，知情人士透露，微軟正在計(jì)劃近期裁員，作為裁員計(jì)劃的一部分，公司將對(duì)表現(xiàn)不佳的員工進(jìn)行更嚴(yán)厲的審查。微軟發(fā)言人證實(shí)了裁員計(jì)劃，但拒絕透露具體的裁員人數(shù)。微軟發(fā)言人稱(chēng)，微軟關(guān)注…

01-08

新國(guó)標(biāo)電動(dòng)車(chē)?yán)m(xù)航不夠？大容量電池選擇有講究！

01-08

百度捐百萬(wàn)及物資助西藏日喀則地震災(zāi)區(qū)，全力抗震救災(zāi)

三言科技1月8日消息，1月7日，西藏自治區(qū)日喀則市定日縣發(fā)生6.8級(jí)地震。當(dāng)晚，百度基金會(huì)宣布緊急捐款100萬(wàn)元，并通過(guò)百度愛(ài)采購(gòu)平臺(tái)為災(zāi)區(qū)提供救援物資與過(guò)冬物資，以盡綿薄之力。百度表示，將持續(xù)關(guān)注救援情…

01-08

鴻蒙智行2024智駕報(bào)告：年度智駕總里程超12億公里，智能駕駛受熱捧！

01-08

雷鳥(niǎo)V3發(fā)布，X3 Pro AR智能眼鏡2025年Q2來(lái)襲，亮點(diǎn)搶先看！

01-08

點(diǎn)擊查看更多 +

全站最新

西藏日喀則6.8級(jí)地震，蔚來(lái)捐百萬(wàn)助力災(zāi)區(qū)重建

雷蛇電競(jìng)椅新突破！加熱通風(fēng)+RGB燈效，打造極致游戲體驗(yàn)

純血AI ，元戎啟行殺進(jìn)智駕前三

特斯拉遠(yuǎn)程召喚功能惹禍？260萬(wàn)輛車(chē)在美接受安全調(diào)查

燕磯長(zhǎng)江大橋主纜架設(shè)啟動(dòng)，亞洲貨運(yùn)樞紐機(jī)場(chǎng)配套工程加速推進(jìn)！

訊景顯卡質(zhì)保大升級(jí)：鳳凰涅槃系列享3年+個(gè)人直接送保

熱門(mén)內(nèi)容

本欄最新

翟欣欣敲詐勒索案新進(jìn)展：蘇享茂家屬提起刑訴，1月21日將開(kāi)庭

新國(guó)標(biāo)電動(dòng)車(chē)?yán)m(xù)航不夠？大容量電池選擇有講究！

鴻蒙智行2024智駕報(bào)告：年度智駕總里程超12億公里，智能駕駛受熱捧！

雷鳥(niǎo)V3發(fā)布，X3 Pro AR智能眼鏡2025年Q2來(lái)襲，亮點(diǎn)搶先看！

A股集體回暖，芯片與算力板塊領(lǐng)漲市場(chǎng)！

小米緊急馳援西藏定日縣，百萬(wàn)捐款溫暖災(zāi)區(qū)寒冬

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類(lèi)資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶(hù)提供內(nèi)容聽(tīng)讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) · 齊魯軟件園魯ICP備11015305號(hào)-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

英偉達(dá)新推Llama-3.1-Nemotron-51B AI模型，有何亮點(diǎn)？

英偉達(dá)新推Llama-3.1-Nemotron-51B AI模型，有何亮點(diǎn)？