ITBear旗下自媒體矩陣：

滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 人工智能 > 正文內(nèi)容

GPT-4：突破巨大參數(shù)規(guī)模的下一步之旅

時(shí)間：2023-07-13 12:26:17 來(lái)源：ITBEAR編輯：茹茹 發(fā)表評(píng)論無(wú)障礙通道

【ITBEAR科技資訊】07月13日消息，外媒Semianalysis最近對(duì)OpenAI于今年3月發(fā)布的GPT-4大模型進(jìn)行了深度揭秘。據(jù)他們透露，GPT-4在架構(gòu)和參數(shù)方面有著顯著的提升，以及采用了混合專(zhuān)家模型(Mixture of Experts)的構(gòu)建方式。

據(jù)悉，GPT-4采用了混合專(zhuān)家模型，這種模型利用數(shù)據(jù)進(jìn)行訓(xùn)練，將多個(gè)模型分別訓(xùn)練后，將它們的輸出整合為一個(gè)單獨(dú)的任務(wù)。為了保持合理的成本，OpenAI選擇了這種方式進(jìn)行構(gòu)建。GPT-4總共有120層，包含了1.8萬(wàn)億個(gè)參數(shù)，相比之下，GPT-3只有約1750億個(gè)參數(shù)，可見(jiàn)其在規(guī)模上的巨大提升。

GPT-4使用了16個(gè)混合專(zhuān)家模型，每個(gè)模型擁有1110億個(gè)參數(shù)，并且每次前向傳遞路由都會(huì)經(jīng)過(guò)兩個(gè)專(zhuān)家模型。此外，它還擁有550億個(gè)共享注意力參數(shù)。為了進(jìn)行訓(xùn)練，OpenAI使用了一個(gè)包含13萬(wàn)億個(gè)tokens的數(shù)據(jù)集，這些tokens并非唯一，而是根據(jù)迭代次數(shù)計(jì)算出更多的tokens。

據(jù)ITBEAR科技資訊了解，GPT-4在預(yù)訓(xùn)練階段的上下文長(zhǎng)度為8k，32k版本則是對(duì)8k版本的微調(diào)結(jié)果。然而，GPT-4的訓(xùn)練成本非常高昂。根據(jù)外媒報(bào)道，即使使用了8倍H100物理機(jī)，也無(wú)法以每秒33.33個(gè)token的速度提供所需的密集參數(shù)模型。據(jù)估算，一次GPT-4的訓(xùn)練成本高達(dá)6300萬(wàn)美元(約4.51億元人民幣)。

為了降低訓(xùn)練成本，OpenAI選擇在云端使用A100 GPU進(jìn)行模型訓(xùn)練，最終將訓(xùn)練成本降低至大約2150萬(wàn)美元(約1.54億元人民幣)，盡管需要更長(zhǎng)的時(shí)間來(lái)完成訓(xùn)練過(guò)程。這一舉措在一定程度上減輕了訓(xùn)練成本的壓力。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0

更多>同類(lèi)資訊

高通與英特爾密談收購(gòu)！芯片巨頭聯(lián)姻在即，股價(jià)飆升引發(fā)市場(chǎng)狂熱

快科技9月21日消息，據(jù)國(guó)外媒體報(bào)道稱(chēng)，高通接洽英特爾討論整體收購(gòu)事宜。更早之前，英特爾曾宣布，作為重組計(jì)劃的一部分，公司將裁員15%以上的員工，即超過(guò)1.5萬(wàn)個(gè)工作崗位，并從第四季度開(kāi)始暫停派息，目的是在…

09-22

沙特聯(lián)手華為，ICT與AI人才培養(yǎng)迎來(lái)新篇章！

雙方旨在通過(guò)深度合作，共同培訓(xùn)和發(fā)展信息與通信技術(shù)（ICT）及人工智能（AI）領(lǐng)域的專(zhuān)業(yè)人才，以期引領(lǐng)未來(lái)技術(shù)創(chuàng)新潮流。這一合作標(biāo)志著雙方在人才培養(yǎng)和國(guó)家能力建設(shè)方面邁出了重要一步。根據(jù)備忘錄內(nèi)容，SD…

09-22

數(shù)據(jù)飛輪領(lǐng)跑新時(shí)代：揭秘企業(yè)增長(zhǎng)新動(dòng)力，你準(zhǔn)備好了嗎？

總結(jié)：數(shù)據(jù)倉(cāng)庫(kù) (DW) 是一種數(shù)字化存儲(chǔ)系統(tǒng)，用于連接和協(xié)調(diào)來(lái)自不同數(shù)據(jù)源的大量數(shù)據(jù)，其目的是為數(shù)據(jù)的智能化、報(bào)告和分析提供數(shù)據(jù)支持，支持企業(yè)將數(shù)據(jù)轉(zhuǎn)化為洞察，制定由數(shù)據(jù)驅(qū)動(dòng)的明智決策，數(shù)據(jù)倉(cāng)庫(kù)會(huì)集中存儲(chǔ)…

09-22

永州數(shù)字人再破界，段潔馨“懿真”新形象引爆潮流風(fēng)暴！

近日，該市冷水灘區(qū)政協(xié)委員、永州市女書(shū)法家協(xié)會(huì)主席及永州市女書(shū)書(shū)法家協(xié)會(huì)副主席段潔馨的數(shù)字形象——“懿真”，在永州市驚艷亮相，為當(dāng)?shù)氐奈幕糜卧鎏砹诵碌牧咙c(diǎn)，同時(shí)也標(biāo)志著人文數(shù)智領(lǐng)域的一次重要探索。這一創(chuàng)新舉…

09-22

馬斯克又出大動(dòng)作，全球矚目！這次他將如何顛覆科技界？

在這份10頁(yè)的信件中，沃倫詢(xún)問(wèn)德諾姆，特斯拉董事會(huì)是否調(diào)查了首席執(zhí)行官埃隆·馬斯克存在利用公司資源來(lái)支持他旗下其他企業(yè)的行為，包括太空探索技術(shù)公司（SpaceX）和人工智能初創(chuàng)企業(yè)xAI。? 馬斯克在特斯…

09-22

馬斯克又出大招？全球矚目，這一次將如何顛覆世界！

09-22

華為VS阿里：人工智能賽道，誰(shuí)將更勝一籌？

2、阿里巴巴：聚焦人工智能在2024年5月份的《集團(tuán)主席和首席執(zhí)行官致股東的信》中，阿里巴巴明確闡明了自己的戰(zhàn)略路徑，第一個(gè)戰(zhàn)略是“用戶(hù)為先”，第二個(gè)戰(zhàn)略方向是聚焦人工智能，“我們將AI作為改變和加速業(yè)務(wù)增…

09-22

廣告變現(xiàn)持續(xù)火爆，無(wú)政策紅利照樣領(lǐng)跑市場(chǎng)，究竟是何魅力？

隨著互聯(lián)網(wǎng)的普及和移動(dòng)互聯(lián)網(wǎng)的興起，用戶(hù)對(duì)信息的需求日益增長(zhǎng)，這為廣告提供了廣闊的展示平臺(tái)。商業(yè)模式的創(chuàng)新也是推動(dòng)廣告變現(xiàn)行業(yè)發(fā)展的關(guān)鍵。盡管廣告變現(xiàn)行業(yè)并未享受到政策紅利，但其火爆的市場(chǎng)現(xiàn)象，實(shí)則是市場(chǎng)…

09-22

省大數(shù)據(jù)局聯(lián)手華為云，人工智能產(chǎn)業(yè)將迎來(lái)怎樣的新變革？

9月20日，在上海召開(kāi)的華為全聯(lián)接大會(huì)上，貴州省大數(shù)據(jù)發(fā)展管理局與華為云計(jì)算技術(shù)有限公司簽訂《貴州人工智能昇騰云適配框架合作協(xié)議》，雙方以昇騰云算力服務(wù)為牽引，吸引全國(guó)人工智能企業(yè)的產(chǎn)品進(jìn)行昇騰云適配，助力人…

09-21

阿里云全面進(jìn)軍AI大基建，AGI快捷通道將顛覆未來(lái)？

阿里云在大會(huì)上宣布，將圍繞 AI時(shí)代的新需求，全面升級(jí)從服務(wù)器到計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、數(shù)據(jù)處理、模型訓(xùn)練和推理平臺(tái)的技術(shù)架構(gòu)體系，讓數(shù)據(jù)中心成為一臺(tái)超級(jí)計(jì)算機(jī)，為每個(gè) AI和應(yīng)用提供高性能、高效的算力服務(wù)。 …

09-21

百度2025校招大放送：3000+AI崗位等你來(lái)挑戰(zhàn)，你準(zhǔn)備好了嗎？

從招聘官網(wǎng)看，百度校招的AI崗位遍布AI四層技術(shù)架構(gòu)：算力層面，提供了AI異構(gòu)計(jì)算、云計(jì)算虛擬化、高性能計(jì)算等相關(guān)崗位；框架層，AI推理框架、AI訓(xùn)練框架均有名額；模型層，有大模型算法工程師、AI數(shù)據(jù)訓(xùn)練師…

09-21

百度校招大爆發(fā)！3000+AI技術(shù)崗位Offer來(lái)襲，你準(zhǔn)備好了嗎？

09-21

數(shù)理化遇強(qiáng)敵？阿里投2億推AI老師，一對(duì)一輔導(dǎo)或?qū)㈩嵏矀鹘y(tǒng)！

對(duì)于面向?qū)W生群體的AI智能終端如何避免出現(xiàn)不當(dāng)回答的提問(wèn)，楊仁斌向南都記者表示，精準(zhǔn)學(xué)的“超擬人一對(duì)一AI老師”結(jié)合了通義千問(wèn)大模型，底層模型在原來(lái)訓(xùn)練時(shí)已經(jīng)對(duì)大量敏感詞做了預(yù)防，也做了專(zhuān)門(mén)的對(duì)齊訓(xùn)練，這…

09-21

2萬(wàn)元豪華對(duì)決：華為VS蘋(píng)果，誰(shuí)在背后默默下單？

選擇與蘋(píng)果正面“硬剛”的華為，也在當(dāng)天正式發(fā)售了其三折疊屏手機(jī)華為MateXT，售價(jià)19999元起，預(yù)約頁(yè)面顯示，超過(guò)685萬(wàn)人預(yù)約，但相較于蘋(píng)果預(yù)售，華為Mate XT預(yù)約并不需要預(yù)付資金，且需要等待官…

09-21

華為新風(fēng)暴來(lái)襲！深圳全球具身智能產(chǎn)業(yè)創(chuàng)新中心，引領(lǐng)未來(lái)科技浪潮？

華為（深圳）全球具身智能產(chǎn)業(yè)創(chuàng)新中心將致力于瞄準(zhǔn)國(guó)際前沿技術(shù)，以產(chǎn)業(yè)示范應(yīng)用場(chǎng)景為牽引，開(kāi)展技術(shù)攻關(guān)和聯(lián)合創(chuàng)新。通過(guò)科技攻關(guān)和技術(shù)突破，擴(kuò)大行業(yè)影響力；同時(shí)打造并開(kāi)放一批示范應(yīng)用場(chǎng)景，促進(jìn)技術(shù)落地與商業(yè)化；…

09-21

點(diǎn)擊查看更多 +

全站最新

新爆料！Quest 3S頭顯或售300美元，虛擬現(xiàn)實(shí)界將迎來(lái)價(jià)格革命？

賽力斯豪擲115億，華為引望股權(quán)成交易熱點(diǎn)，科技圈又將掀起何種風(fēng)浪？

短劇新王炸！《朕就說(shuō)個(gè)英語(yǔ)，咋都跪了》登頂熱度榜，6109萬(wàn)都在追！

大疆Air3S無(wú)人機(jī)來(lái)襲，一英寸主攝驚艷亮相，三種配置任你選！

蘋(píng)果AI難撼動(dòng)16系列增長(zhǎng)潮，市場(chǎng)需求未被點(diǎn)燃？

育碧大作《波斯王子：失落的王冠》新DLC僅售25元，你心動(dòng)了嗎？

熱門(mén)內(nèi)容

本欄最新

沙特聯(lián)手華為，ICT與AI人才培養(yǎng)迎來(lái)新篇章！

數(shù)據(jù)飛輪領(lǐng)跑新時(shí)代：揭秘企業(yè)增長(zhǎng)新動(dòng)力，你準(zhǔn)備好了嗎？

永州數(shù)字人再破界，段潔馨“懿真”新形象引爆潮流風(fēng)暴！

馬斯克又出大動(dòng)作，全球矚目！這次他將如何顛覆科技界？

馬斯克又出大招？全球矚目，這一次將如何顛覆世界！

華為VS阿里：人工智能賽道，誰(shuí)將更勝一籌？

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類(lèi)資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶(hù)提供內(nèi)容聽(tīng)讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) · 齊魯軟件園魯ICP備11015305號(hào)-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.