滾動資訊

微軟和英偉達推出迄今為止訓練最大最強的語言模型 MT-NLG

時間：2021-10-12 10:35:15 來源：IT之家編輯：星輝 發(fā)表評論無障礙通道

10 月 12 日消息語言模型(Language Model)簡單來說就是一串詞序列的概率分布，主要作用是為一個長度為 m 的文本確定一個概率分布 P，表示這段文本存在的可能性。

大家之前可能或多或少聽說過 GPT-3，OpenAI 最新的語言模型，堪稱地表最強語言模型，也被認為是革命性的人工智能模型。除此之外還有 BERT、Switch Transformer 等重量級產品，而且業(yè)內其他企業(yè)也在努力推出自家的模型。

微軟和英偉達今天宣布了由 DeepSpeed 和 Megatron 驅動的 Megatron-Turing 自然語言生成模型(MT-NLG)，這是迄今為止訓練的最大和最強大的解碼語言模型。

作為 Turing NLG 17B 和 Megatron-LM 的繼任者，這個模型包括 5300 億個參數，而且 MT-NLG 的參數數量是同類現(xiàn)有最大模型 GPT-3 的 3 倍，并在一系列廣泛的自然語言任務中展示了無與倫比的準確性，例如：

完成預測

閱讀理解

常識推理

自然語言推理

詞義消歧

105 層、基于轉換器的 MT-NLG 在零、單和少樣本設置中改進了先前最先進的模型，并為兩個模型規(guī)模的大規(guī)模語言模型設定了新標準和質量。

據悉，模型訓練是在基于 NVIDIA DGX SuperPOD 的 Selene 超級計算機上以混合精度完成的，該超級計算機由 560 個 DGX A100 服務器提供支持，這些服務器以完整的胖樹(FatTree)配置與 HDR InfiniBand 聯(lián)網。每個 DGX A100 有 8 個 NVIDIA A100 80GB Tensor Core GPU，通過 NVLink 和 NVSwitch 相互完全連接。微軟 Azure NDv4 云超級計算機使用了類似的參考架構。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

蕪湖造心臟，驅動國家級無人直升機救援平臺展雄風！

12-19

神策智能運營新升級，如何助力企業(yè)實現(xiàn)高效精準營銷？

12-19

順豐控股11月收入穩(wěn)健增長6.73%，供應鏈及國際業(yè)務增速亮眼

三言科技12月19日消息，今日，順豐控股公告，2024年11月公司速運物流業(yè)務及供應鏈和國際業(yè)務合計收入為251.96億元，較2023年同期236.08億元增長6.73%。其中，速運物流業(yè)務收入為188.02…

12-19

榮耀股東變動引關注，官方稱系股權架構調整

三言科技12月19日消息，近日，多則網傳榮耀新一輪股改已完成。據媒體報道，榮耀的股東名單已經發(fā)生變更，有國資背景的股東顯示退出。信息顯示，9月剛剛加入的新股東杭州微同股權投資合伙企業(yè)（有限合伙），于11月退出…

12-19

順豐航空引領！國內全貨機首次SAF商業(yè)飛行成功落地

12-19

中央經濟工作會議力推哪些新興經濟模式？

12-19

水滴公司Q3財報亮點：營收穩(wěn)步增長，運營利潤達2650萬

12-19

技嘉冰雕X870I主板全白亮相，AORUS PRO ICE圖賞來襲！

12-19

寵物糧市場亂象頻發(fā)，鏟屎官如何為寵物選對糧？

據“趣解商業(yè)”了解，“源鮮”曾是網易嚴選、喵梵思等國產中高端品牌多次合作的代工廠，在不少養(yǎng)寵人心中有較高信任度；“源鮮”的塌房，再次挑動了許多養(yǎng)寵人的神經。 Erica還提到，寵糧本質上屬于快消行業(yè)，并不是靠…

12-19

柔韌機器人：具身智能的新賽道與革命性突破？

相比于現(xiàn)階段普遍使用的基于電機關節(jié)、金屬材料、復雜傳感器和精密加工工藝的“剛性”機器人技術，萬勛科技通過使用軟性材料與氣/液驅動，以軟材料仿生肌肉和神經元智能復刻人類肌肉柔韌特性，具備輕巧靈活、安全互動、易…

12-19

北京中關村科學城國際醫(yī)谷開工，打造醫(yī)療健康產業(yè)集聚新高地

作為項目建設推進方，北京海新域城市更新集團相關負責人介紹，中關村科學城國際醫(yī)谷項目將在產業(yè)鏈上游吸引頂尖研發(fā)機構和企業(yè)，匯聚創(chuàng)新源頭力量；在中游通過公共技術服務平臺降低研發(fā)門檻，助力創(chuàng)新的想法實施；在下游建…

12-19

《獵人克萊文》IGN僅評3分，高成本制作卻換來低質口碑？

12-19

中興通訊股價異動，公司稱生產經營正常，無未公開重大信息影響股價

12-19

順豐控股11月速運物流營收微增，供應鏈及國際業(yè)務增長超兩成

12-19

澳門風情畫軸展開，智界新S7穿梭其中成焦點

12-19

點擊查看更多 +

全站最新

TCL萬象分區(qū)技術：Mini LED電視畫質躍升的新篇章

挪威電動車熱銷，特斯拉陶琳：寒冷地區(qū)電動車可完全替代燃油車

寶馬Skytop M8 Targa限量版來襲，概念車終成真！

蕪湖造心臟，驅動國家級無人直升機救援平臺展雄風！

《黑神話：悟空》獲贊，海信E8共繪中國文化出海新篇章

值得買科技榮獲卓越發(fā)展大獎，創(chuàng)新驅動消費產業(yè)高質量發(fā)展

熱門內容

本欄最新

蕪湖造心臟，驅動國家級無人直升機救援平臺展雄風！

神策智能運營新升級，如何助力企業(yè)實現(xiàn)高效精準營銷？

順豐航空引領！國內全貨機首次SAF商業(yè)飛行成功落地

中央經濟工作會議力推哪些新興經濟模式？

水滴公司Q3財報亮點：營收穩(wěn)步增長，運營利潤達2650萬

技嘉冰雕X870I主板全白亮相，AORUS PRO ICE圖賞來襲！

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區(qū) · 齊魯軟件園魯ICP備11015305號-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.