久久成人免费精品二区,国产内射一级一片内射高清视频

9月9日，掘力計劃第23期線上分享活動以“AIGC的應(yīng)用和創(chuàng)新”為主題召開。本次活動的分享主題為《metaGPT：讓每個人擁有專屬智能體》，由深度賦智 NLP & AIGC 方向算法負責(zé)人洪思睿主講。

洪思睿曾任智能控制上市企業(yè) NLP 團隊負責(zé)人，負責(zé)千萬級行業(yè)知識圖譜及多項自然語言處理技術(shù)的應(yīng)用落地。在深度賦智，她負責(zé)法律、物流、美妝、電商等多個領(lǐng)域的知識問答、搜索系統(tǒng)及多模態(tài)應(yīng)用等行業(yè)落地工作。他還開源了多智能體框架metaGPT，并在 NeurIPS AutoDL 頂級競賽中獲得世界冠軍，相關(guān)工作及論文發(fā)表于頂級學(xué)術(shù)期刊《IEEE TPAMI》。

直播回放地址：https://juejin.cn/live/jpowermeetup23

大語言模型發(fā)展歷程

洪思睿首先回顧了大語言模型技術(shù)的發(fā)展歷程，從早期的 CBOW 自監(jiān)督學(xué)習(xí)方法，到 BERT 的雙向編碼器以及 GPT-3 的巨大規(guī)模預(yù)訓(xùn)練，再到最近的 GPT-4，大語言模型取得了巨大的技術(shù)突破。

早期技術(shù)：SSL、Transformer 和 BERT

自2013年起，自然語言理解領(lǐng)域出現(xiàn)了一些新的技術(shù)趨勢。早在2013年，CBOW 模型就使用了自監(jiān)督學(xué)習(xí)的方法，將詞嵌入到稠密的向量空間中，奠定了后來語言模型技術(shù)的基礎(chǔ)。2017年，Transformer 模型則通過引入注意力機制，改善了 CNN 在長序列建模方面的困難。隨后在2018年，BERT 的出現(xiàn)則證明了規(guī)?；A(yù)訓(xùn)練對自然語言理解的巨大提升，只需要在特定下游任務(wù)進行微調(diào)就可以取得非常強的效果。具體來說，BERT使用了多層 Transformer 編碼器進行預(yù)訓(xùn)練，通過 masked language model 和 next sentence prediction 等任務(wù)獲得了語義理解能力，然后在下游任務(wù)中進行微調(diào)從而適應(yīng)特定領(lǐng)域。

GPT-3的預(yù)訓(xùn)練范式

相比 BERT 采用預(yù)訓(xùn)練與微調(diào)相結(jié)合的方法，OpenAI 的 GPT 系列模型更加強調(diào)巨大規(guī)模的單向預(yù)訓(xùn)練。以 GPT-3 為例，它擁有高達 1750 億參數(shù)，但沒有進行微調(diào)就直接進行預(yù)訓(xùn)練并應(yīng)用。GPT-3 證明了更大規(guī)模的模型即使不經(jīng)微調(diào)也可以取得較強的泛化性能。隨著模型規(guī)模的擴大，GPT-3 展現(xiàn)出了更強的 Few-Shot 學(xué)習(xí)能力。

Instruction Tuning

在 GPT-3 之后，研究者提出了指令微調(diào)(Instruction Tuning)的訓(xùn)練方法，使用自然語言指令引導(dǎo)模型學(xué)習(xí)，可以進一步提升大規(guī)模預(yù)訓(xùn)練語言的數(shù)據(jù)利用能力，增強泛化能力。例如，基于該方法調(diào)優(yōu)后的模型，即使在未見過的數(shù)據(jù)集上也可以取得更高的準(zhǔn)確率。這為模型帶來了更好的遷移學(xué)習(xí)能力。

InstructGPT

Instruction Tuning 的idea也被 OpenAI 借鑒到了 InstructGPT 模型中。該模型不僅使用了指令微調(diào)，還利用了基于人類反饋的強化學(xué)習(xí)進行來降低模型輸出的毒性。實驗證明，使用人類反饋進行調(diào)優(yōu)后，模型的輸出質(zhì)量可以大幅提升，信息量更大，偏向性和有毒性內(nèi)容更少，更符合人類期待。

GPT-4時代的到來

今年3月，OpenAI 發(fā)布了 GPT-4 模型，其規(guī)模達到了 GPT-3 的 10 倍以上，參數(shù)量高達 18000 億。為實現(xiàn)這樣大規(guī)模模型的高效推理，OpenAI 采用了混合專家(Mixture of Experts)技術(shù)。具體來說，GPT-4 包含了 16 個規(guī)模約為 1110 億參數(shù)的專家模型，每次推理會調(diào)用 2 個專家，并在專家之間共享部分權(quán)重。在訓(xùn)練數(shù)據(jù)方面，GPT-4 使用了約 130 萬億個詞元進行預(yù)訓(xùn)練，是目前最大規(guī)模的語言模型。為實現(xiàn)高效訓(xùn)練，OpenAI 采用了多達 8k 的上下文序列長度，以及可變序列批處理和流水線等技術(shù)。

GPT-4 的到來預(yù)示著語言模型技術(shù)已經(jīng)進入一個新的階段，各大企業(yè)和機構(gòu)也紛紛推出了自己的預(yù)訓(xùn)練語言模型。在模型評測領(lǐng)域，MMLU 基準(zhǔn)測試已經(jīng)成為衡量不同語言模型能力的標(biāo)準(zhǔn)測試集。各模型在 MMLU 基準(zhǔn)測試中的排名也成為大家關(guān)注的焦點。

metaGPT：構(gòu)建多智能體框架

在模型技術(shù)日益成熟的背景下，模型的落地應(yīng)用也成為一個重要方向。洪思睿介紹了他們多智能體框架 metaGPT。該框架可以通過簡單的自然語言描述完成完整的軟件開發(fā)過程中的文檔輸出和代碼生成工作。

metaGPT 通過定義不同的角色，如產(chǎn)品經(jīng)理、架構(gòu)師、工程師等，讓每個角色負責(zé)軟件開發(fā)過程中的不同階段，實現(xiàn)流水線式的協(xié)同工作。具體來說，產(chǎn)品經(jīng)理會根據(jù)需求輸出產(chǎn)品文檔，架構(gòu)師負責(zé)設(shè)計架構(gòu)圖，最后工程師根據(jù)上游輸出進行代碼實現(xiàn)。

實驗證明，metaGPT 生成的代碼質(zhì)量明顯優(yōu)于其他基于智能體框架的代碼生成效果。因為上游角色的輸出為下游工程師提供了完整的上下文信息，將原始的需求/任務(wù)進行了更細化和結(jié)構(gòu)化的拆解，減少了歧義，提升了最終代碼的可靠性。在多個數(shù)據(jù)集上的評測也證明了 metaGPT 生成代碼的優(yōu)異性能。

智能體技術(shù)的應(yīng)用前景

洪思睿認為，基于大語言模型訓(xùn)練的智能體將會成為未來社會的重要組成部分。未來的人機交互范式也會從嵌入式模式，發(fā)展到輔助模式，再到代理模式，最終達到人機深度協(xié)作的社會化模式。在這個模式下，人類和智能體既可以自主提出需求，也可以相互提供資源來完成任務(wù)。

此外，未來互聯(lián)網(wǎng)的門戶也將從 App 變成智能體。用戶只需要向單個或多個智能體提出需求，由智能體負責(zé)完成整個工作流程，包括調(diào)用不同的軟件程序、設(shè)定參數(shù)等。這將極大提升人機協(xié)同的效率，更進一步帶來生活和工作方式的變革。

總結(jié)

本次分享活動洪思睿詳細介紹了大語言模型技術(shù)的發(fā)展歷程，以及最新的GPT-4等前沿技術(shù)。她從他們開源的工作metaGPT展開，展示了如何構(gòu)建多智能體協(xié)作框架，并展望了智能體技術(shù)在簡化人機交互等方面的應(yīng)用前景。這次活動內(nèi)容豐富，對于理解當(dāng)前AI技術(shù)發(fā)展具有重要參考價值。

掘力計劃

掘力計劃由稀土掘金技術(shù)社區(qū)發(fā)起，致力于打造一個高品質(zhì)的技術(shù)分享和交流的系列品牌。聚集國內(nèi)外頂尖的技術(shù)專家、開發(fā)者和實踐者，通過線下沙龍、閉門會、公開課等多種形式分享最前沿的技術(shù)動態(tài)。(作者：孔恒偉)

掘力計劃第23期 - MetaGPT：讓每個人擁有專屬智能體