ITBear科技資訊
手機版
二維碼
內容搜索
無障礙通道
語言：中文 EN

ITBear旗下自媒體矩陣：

滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

StreamingLLM框架亮相：突破文本長度限制

時間：2023-10-06 17:59:05 來源：ITBEAR編輯：茹茹 發(fā)表評論無障礙通道

【ITBEAR科技資訊】10月06日消息，麻省理工學院與meta AI的研究人員最近宣布他們成功開發(fā)了一項名為StreamingLLM的創(chuàng)新框架，該框架被認為能夠解決大型語言模型面臨的內存和泛化問題，使其能夠輕松處理無限長度的文本內容。

這一研究的關鍵焦點在于克服實現高效流式語言模型(Efficient Streaming Language Models，ESLM)時所面臨的障礙，尤其是在長時間多輪對話等場景下可能出現的問題。

據ITBEAR科技資訊了解，研究人員指出，構建流式語言模型主要面臨兩大挑戰(zhàn)。解碼階段獲取標記(token)的鍵(Key)和值(Value)狀態(tài)會耗費大量內存。其次，現有的大型語言模型很難泛化到處理超出其訓練序列長度的長文本。

過去的研究嘗試解決這些挑戰(zhàn)，例如擴展注意力窗口以處理長文本或建立一個固定大小的活動窗口，只關注最近的標記狀態(tài)以維護內存使用和解碼速度。然而，這些策略在處理超出緩存大小的序列時表現不佳。

StreamingLLM采用了一種名為"注意力下沉"的策略，通過觀察到自回歸語言模型中，某些標記會獲得大量的注意力，即使它們在語義上并不重要，這些標記也會吸引模型的關注。這種策略確保了無論輸入序列的長度如何，模型的注意力計算都能保持穩(wěn)定。

StreamingLLM的重要貢獻在于提供了一種簡單而高效的解決方案，使語言模型能夠處理無限長度的文本，而無需進行微調。這將有助于解決當前流式應用中語言模型面臨的問題。雖然流式語言模型在未來將變得更加重要，但由于內存效率和長序列處理性能等方面的限制，相關模型的發(fā)展仍面臨挑戰(zhàn)。

據研究團隊驗證，StreamingLLM能夠使Llama 2、MPT、Falcon和Pythia等模型可靠地處理長達400萬個標記的文本，從而為流式語言模型的部署提供了更多可能性。這一創(chuàng)新有望推動自然語言處理領域的發(fā)展，并為各種應用場景帶來更強大的語言模型支持。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

高通與英特爾密談收購！芯片巨頭聯姻在即，股價飆升引發(fā)市場狂熱

快科技9月21日消息，據國外媒體報道稱，高通接洽英特爾討論整體收購事宜。更早之前，英特爾曾宣布，作為重組計劃的一部分，公司將裁員15%以上的員工，即超過1.5萬個工作崗位，并從第四季度開始暫停派息，目的是在…

09-22

沙特聯手華為，ICT與AI人才培養(yǎng)迎來新篇章！

雙方旨在通過深度合作，共同培訓和發(fā)展信息與通信技術（ICT）及人工智能（AI）領域的專業(yè)人才，以期引領未來技術創(chuàng)新潮流。這一合作標志著雙方在人才培養(yǎng)和國家能力建設方面邁出了重要一步。根據備忘錄內容，SD…

09-22

數據飛輪領跑新時代：揭秘企業(yè)增長新動力，你準備好了嗎？

總結：數據倉庫 (DW) 是一種數字化存儲系統(tǒng)，用于連接和協調來自不同數據源的大量數據，其目的是為數據的智能化、報告和分析提供數據支持，支持企業(yè)將數據轉化為洞察，制定由數據驅動的明智決策，數據倉庫會集中存儲…

09-22

永州數字人再破界，段潔馨“懿真”新形象引爆潮流風暴！

近日，該市冷水灘區(qū)政協委員、永州市女書法家協會主席及永州市女書書法家協會副主席段潔馨的數字形象——“懿真”，在永州市驚艷亮相，為當地的文化旅游增添了新的亮點，同時也標志著人文數智領域的一次重要探索。這一創(chuàng)新舉…

09-22

馬斯克又出大動作，全球矚目！這次他將如何顛覆科技界？

在這份10頁的信件中，沃倫詢問德諾姆，特斯拉董事會是否調查了首席執(zhí)行官埃隆·馬斯克存在利用公司資源來支持他旗下其他企業(yè)的行為，包括太空探索技術公司（SpaceX）和人工智能初創(chuàng)企業(yè)xAI。? 馬斯克在特斯…

09-22

馬斯克又出大招？全球矚目，這一次將如何顛覆世界！

在這份10頁的信件中，沃倫詢問德諾姆，特斯拉董事會是否調查了首席執(zhí)行官埃隆·馬斯克存在利用公司資源來支持他旗下其他企業(yè)的行為，包括太空探索技術公司（SpaceX）和人工智能初創(chuàng)企業(yè)xAI。 2022年年底，…

09-22

華為VS阿里：人工智能賽道，誰將更勝一籌？

2、阿里巴巴：聚焦人工智能在2024年5月份的《集團主席和首席執(zhí)行官致股東的信》中，阿里巴巴明確闡明了自己的戰(zhàn)略路徑，第一個戰(zhàn)略是“用戶為先”，第二個戰(zhàn)略方向是聚焦人工智能，“我們將AI作為改變和加速業(yè)務增…

09-22

廣告變現持續(xù)火爆，無政策紅利照樣領跑市場，究竟是何魅力？

隨著互聯網的普及和移動互聯網的興起，用戶對信息的需求日益增長，這為廣告提供了廣闊的展示平臺。商業(yè)模式的創(chuàng)新也是推動廣告變現行業(yè)發(fā)展的關鍵。盡管廣告變現行業(yè)并未享受到政策紅利，但其火爆的市場現象，實則是市場…

09-22

省大數據局聯手華為云，人工智能產業(yè)將迎來怎樣的新變革？

9月20日，在上海召開的華為全聯接大會上，貴州省大數據發(fā)展管理局與華為云計算技術有限公司簽訂《貴州人工智能昇騰云適配框架合作協議》，雙方以昇騰云算力服務為牽引，吸引全國人工智能企業(yè)的產品進行昇騰云適配，助力人…

09-21

阿里云全面進軍AI大基建，AGI快捷通道將顛覆未來？

阿里云在大會上宣布，將圍繞 AI時代的新需求，全面升級從服務器到計算、存儲、網絡、數據處理、模型訓練和推理平臺的技術架構體系，讓數據中心成為一臺超級計算機，為每個 AI和應用提供高性能、高效的算力服務。 …

09-21

百度2025校招大放送：3000+AI崗位等你來挑戰(zhàn)，你準備好了嗎？

從招聘官網看，百度校招的AI崗位遍布AI四層技術架構：算力層面，提供了AI異構計算、云計算虛擬化、高性能計算等相關崗位；框架層，AI推理框架、AI訓練框架均有名額；模型層，有大模型算法工程師、AI數據訓練師…

09-21

百度校招大爆發(fā)！3000+AI技術崗位Offer來襲，你準備好了嗎？

從招聘官網看，百度校招的AI崗位遍布AI四層技術架構：算力層面，提供了AI異構計算、云計算虛擬化、高性能計算等相關崗位；框架層，AI推理框架、AI訓練框架均有名額；模型層，有大模型算法工程師、AI數據訓練師…

09-21

數理化遇強敵？阿里投2億推AI老師，一對一輔導或將顛覆傳統(tǒng)！

對于面向學生群體的AI智能終端如何避免出現不當回答的提問，楊仁斌向南都記者表示，精準學的“超擬人一對一AI老師”結合了通義千問大模型，底層模型在原來訓練時已經對大量敏感詞做了預防，也做了專門的對齊訓練，這…

09-21

2萬元豪華對決：華為VS蘋果，誰在背后默默下單？

選擇與蘋果正面“硬剛”的華為，也在當天正式發(fā)售了其三折疊屏手機華為MateXT，售價19999元起，預約頁面顯示，超過685萬人預約，但相較于蘋果預售，華為Mate XT預約并不需要預付資金，且需要等待官…

09-21

華為新風暴來襲！深圳全球具身智能產業(yè)創(chuàng)新中心，引領未來科技浪潮？

華為（深圳）全球具身智能產業(yè)創(chuàng)新中心將致力于瞄準國際前沿技術，以產業(yè)示范應用場景為牽引，開展技術攻關和聯合創(chuàng)新。通過科技攻關和技術突破，擴大行業(yè)影響力；同時打造并開放一批示范應用場景，促進技術落地與商業(yè)化；…

09-21

點擊查看更多 +

全站最新

新爆料！Quest 3S頭顯或售300美元，虛擬現實界將迎來價格革命？

新爆料！Quest 3S頭顯或售300美元，虛擬現實界將迎來價格革命？

賽力斯豪擲115億，華為引望股權成交易熱點，科技圈又將掀起何種風浪？

賽力斯豪擲115億，華為引望股權成交易熱點，科技圈又將掀起何種風浪？

短劇新王炸！《朕就說個英語，咋都跪了》登頂熱度榜，6109萬都在追！

短劇新王炸！《朕就說個英語，咋都跪了》登頂熱度榜，6109萬都在追！

大疆Air3S無人機來襲，一英寸主攝驚艷亮相，三種配置任你選！

大疆Air3S無人機來襲，一英寸主攝驚艷亮相，三種配置任你選！

蘋果AI難撼動16系列增長潮，市場需求未被點燃？

蘋果AI難撼動16系列增長潮，市場需求未被點燃？

育碧大作《波斯王子：失落的王冠》新DLC僅售25元，你心動了嗎？

育碧大作《波斯王子：失落的王冠》新DLC僅售25元，你心動了嗎？

熱門內容

本欄最新

沙特聯手華為，ICT與AI人才培養(yǎng)迎來新篇章！

沙特聯手華為，ICT與AI人才培養(yǎng)迎來新篇章！

數據飛輪領跑新時代：揭秘企業(yè)增長新動力，你準備好了嗎？

數據飛輪領跑新時代：揭秘企業(yè)增長新動力，你準備好了嗎？

永州數字人再破界，段潔馨“懿真”新形象引爆潮流風暴！

永州數字人再破界，段潔馨“懿真”新形象引爆潮流風暴！

馬斯克又出大動作，全球矚目！這次他將如何顛覆科技界？

馬斯克又出大動作，全球矚目！這次他將如何顛覆科技界？

馬斯克又出大招？全球矚目，這一次將如何顛覆世界！

馬斯克又出大招？全球矚目，這一次將如何顛覆世界！

華為VS阿里：人工智能賽道，誰將更勝一籌？

華為VS阿里：人工智能賽道，誰將更勝一籌？

網站首頁 | 關于我們 | 聯系方式 | 版權聲明 | 網站留言 | RSS訂閱 | 違規(guī)舉報 | 開放轉載 | 滾動資訊 | English Version

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

<b id="ylttl"><li id="ylttl"></li></b>