滾動資訊

當(dāng)前位置：首頁 > 資訊 > 人工智能 > 正文內(nèi)容

蘋果英偉達(dá)合作開源ReDrafter，LLM推理速度飆升2.7倍！

時(shí)間：2024-12-19 08:07:17 來源：ITBEAR編輯：快訊團(tuán)隊(duì) 發(fā)表評論無障礙通道

蘋果公司近期宣布與英偉達(dá)攜手合作，共同推出了一項(xiàng)名為Recurrent Drafter（簡稱ReDrafter）的創(chuàng)新技術(shù)，這項(xiàng)技術(shù)旨在顯著提升人工智能大語言模型（LLM）的推理速度。這一消息是在12月18日通過蘋果公司的官方博文發(fā)布的。

據(jù)悉，ReDrafter技術(shù)已經(jīng)成功融入英偉達(dá)的TensorRT-LLM推理加速框架中。這一整合使得在英偉達(dá)GPU上運(yùn)行的LLM模型，每秒生成的tokens數(shù)量最高可提升2.7倍。這一顯著的性能提升，不僅有效減少了用戶在使用過程中的延遲感受，還大幅度降低了計(jì)算成本。

蘋果公司的機(jī)器學(xué)習(xí)專家強(qiáng)調(diào)，隨著LLM在生產(chǎn)應(yīng)用程序中的廣泛應(yīng)用，提高推理效率已經(jīng)成為降低計(jì)算成本和減少用戶延遲的關(guān)鍵因素。ReDrafter技術(shù)的推出，正是對這一需求的積極響應(yīng)。

ReDrafter的核心在于其獨(dú)特的RNN草稿模型，該模型結(jié)合了波束搜索（beam search）和動態(tài)樹注意力（dynamic tree attention）技術(shù)。這一創(chuàng)新設(shè)計(jì)使得開源模型在每一步生成過程中最多可以產(chǎn)生3.5個tokens，從而超越了以往推測性解碼技術(shù)的性能表現(xiàn)。

為了將ReDrafter技術(shù)應(yīng)用于實(shí)際生產(chǎn)環(huán)境，蘋果公司與英偉達(dá)展開了深度合作。雙方共同努力，將ReDrafter成功集成到英偉達(dá)的TensorRT-LLM框架中。這一合作不僅展現(xiàn)了蘋果與英偉達(dá)在技術(shù)創(chuàng)新方面的深厚實(shí)力，也體現(xiàn)了雙方在推動AI技術(shù)發(fā)展方面的共同愿景。

為了支持ReDrafter技術(shù)的集成，英偉達(dá)對其TensorRT-LLM框架進(jìn)行了多項(xiàng)優(yōu)化。這包括添加新的運(yùn)算符以及公開現(xiàn)有運(yùn)算符，以增強(qiáng)框架對復(fù)雜模型和解碼方法的適應(yīng)能力。這些優(yōu)化措施為ReDrafter技術(shù)的順利應(yīng)用提供了有力保障。

基準(zhǔn)測試結(jié)果顯示，在使用集成了ReDrafter的TensorRT-LLM框架的英偉達(dá)GPU上，數(shù)百億參數(shù)規(guī)模的生產(chǎn)模型的解碼速度得到了顯著提升，最高可達(dá)2.7倍。這一成果不僅顯著降低了用戶體驗(yàn)延遲，還減少了GPU的使用數(shù)量和功耗，從而進(jìn)一步降低了運(yùn)營成本。

這一合作成果的發(fā)布，標(biāo)志著蘋果與英偉達(dá)在AI技術(shù)領(lǐng)域的合作邁出了重要一步。未來，雙方將繼續(xù)攜手共進(jìn)，共同推動AI技術(shù)的創(chuàng)新與發(fā)展，為更多用戶提供更加高效、智能的服務(wù)。

舉報(bào) 0 收藏 0 打賞 0評論 0

更多>同類資訊

AI轉(zhuǎn)型驅(qū)動！美國數(shù)據(jù)中心電力需求未來三年或暴漲三倍

12-21

谷歌Gemini AI全面鋪開，搜索引擎及移動平臺將迎AI模式？

12-21

蘋果AI服務(wù)入華再添新伙伴？Zhipu AI或攜手騰訊字節(jié)布局iPhone

The Wall Street Journal reported in June that Apple is looking forlocal partners to offer AI services …

12-21

南大科研團(tuán)隊(duì)發(fā)布：地球生命15億年多樣性演化圖譜首現(xiàn)《科學(xué)》

12-21

并購重組新風(fēng)口下，哪些上市公司將迎“麻雀變鳳凰”的蛻變？

并購重組一向是A股最為喜聞樂見的題材，本輪牛市以來，同花順“并購重組”題材大漲近60%，遠(yuǎn)超過滬深指數(shù)漲幅，成為表現(xiàn)最好的概念題材之一，誕生了諸多超級大牛股。事實(shí)上，今年很多備受關(guān)注的并購重組在資本市場表…

12-21

OpenAI新推o3及o3 mini，逼近AGI引發(fā)業(yè)界關(guān)注

12-21

OpenAI o3模型登場，能否成為通用人工智能新里程碑？

12-21

自動駕駛落榜，圖森未來能否借AI游戲與金庸IP東山再起？

12-21

小米重金攬才，DeepSeek大模型專家羅福莉或?qū)⒓用诵∶譇I實(shí)驗(yàn)室

12-21

普渡機(jī)器人PUDU D9：雙足行走、靈活操作，深圳智造展現(xiàn)清潔新技能！

二是在操作方面，PUDU D9擁有兩條7自由度機(jī)械臂，負(fù)載超過20kg，搭載11自由度五指靈巧手PUDU DH11，可靈活完成各類精細(xì)操作任務(wù)，滿足多類場景需求。在產(chǎn)品布局完成之后，普渡或?qū)⒃诰呱碇悄艿穆涞亍?/div>

12-21

超算AI聯(lián)手！科學(xué)家描繪地球20億至5億年前生命多樣性演化壯麗圖景

12-21

值得買科技AI戰(zhàn)略引領(lǐng)消費(fèi)新風(fēng)尚，榮獲華為云先鋒實(shí)踐案例

12-20

科技新風(fēng)向！這些創(chuàng)新熱詞你掌握了嗎？

12-20

輕量化AI眼鏡，999元閃極“拍拍鏡”能否開啟智能穿戴新篇章？

12-20

谷歌CEO：將削減10%高管職位

12-20

點(diǎn)擊查看更多 +

全站最新

中國折疊屏手機(jī)市場增速放緩，華為領(lǐng)跑地位依舊穩(wěn)固

AI轉(zhuǎn)型驅(qū)動！美國數(shù)據(jù)中心電力需求未來三年或暴漲三倍

極越汽車公關(guān)負(fù)責(zé)人徐繼業(yè)離職，自豪于閃崩危機(jī)中的處理與溝通

雷蛇聯(lián)手《魷魚游戲》推主題外設(shè)，追劇黨的新寵兒來襲！

谷歌Android XR眼鏡將支持“查找設(shè)備”，再也不怕丟失了！

木衛(wèi)二：小小身軀藏大海，能否孕育生命之謎待解？

熱門內(nèi)容

本欄最新

南大科研團(tuán)隊(duì)發(fā)布：地球生命15億年多樣性演化圖譜首現(xiàn)《科學(xué)》

并購重組新風(fēng)口下，哪些上市公司將迎“麻雀變鳳凰”的蛻變？

OpenAI o3模型登場，能否成為通用人工智能新里程碑？

自動駕駛落榜，圖森未來能否借AI游戲與金庸IP東山再起？

小米重金攬才，DeepSeek大模型專家羅福莉或?qū)⒓用诵∶譇I實(shí)驗(yàn)室

普渡機(jī)器人PUDU D9：雙足行走、靈活操作，深圳智造展現(xiàn)清潔新技能！

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時(shí)刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

蘋果英偉達(dá)合作開源ReDrafter，LLM推理速度飆升2.7倍！

蘋果英偉達(dá)合作開源ReDrafter，LLM推理速度飆升2.7倍！