在科技日益進步的今天,人工智能(AI)的應(yīng)用領(lǐng)域不斷拓展,其中一項引人注目的創(chuàng)新是利用大語言模型(LLMs)來驅(qū)動社會模擬游戲中的智能體。然而,這一領(lǐng)域的探索也面臨著一個意想不到的挑戰(zhàn):這些由LLMs驅(qū)動的NPC(非玩家角色)變得過于啰嗦,缺乏自然互動的真實感。
想象一下,如果教一位外國朋友打麻將時,你選擇事無巨細地指導(dǎo)每一步,而不是讓他們自主探索,那么他們可能會失去學(xué)習(xí)和發(fā)現(xiàn)的樂趣。同樣地,研究者在設(shè)計大語言模型社會模擬時,也陷入了類似的誤區(qū)。例如,在模擬霍布斯的“人人相爭”理論時,研究者為智能體編寫了詳細的“劇本”,如“打不過就投降”或“搶劫比種地更有效就繼續(xù)搶劫”。這種預(yù)設(shè)的行為模式雖然確保了實驗的“穩(wěn)妥”,但卻剝奪了智能體之間真實互動和創(chuàng)新的可能性。
這種過度指導(dǎo)的問題不僅在于它可能掩蓋了真實的社會現(xiàn)象,更在于它可能導(dǎo)致研究者“發(fā)現(xiàn)”的社會規(guī)律其實只是他們預(yù)設(shè)的劇本。正如魔術(shù)表演中,觀眾驚嘆于魔術(shù)師從帽子里掏出的兔子,卻未曾想這只兔子本就藏在帽子里。因此,在使用大語言模型研究社會現(xiàn)象時,“少即是多”的原則顯得尤為重要。過于詳細的指導(dǎo)語可能會遮蔽更有價值的發(fā)現(xiàn),因為現(xiàn)實社會中的精彩故事往往源自于自由互動和不可預(yù)測性。
盡管如此,研究者們依然看到了LLMs在社會模擬中的巨大潛力。2024年,一項在arXiv上發(fā)表的研究利用LLMs模擬了人類社會的演化過程,并成功復(fù)現(xiàn)了霍布斯的利維坦理論。在這個模擬世界中,智能體通過耕種、搶奪、交易或捐贈等行為爭奪有限的資源,最終形成了一個由絕對主權(quán)者統(tǒng)治的社會秩序。這一實驗不僅驗證了霍布斯的理論,還展示了LLMs在模擬復(fù)雜社會現(xiàn)象方面的潛力。
另一個例子則更加雄心勃勃,羅格斯大學(xué)和密歇根大學(xué)的研究團隊開發(fā)了一款名為WarAgent的多智能體系統(tǒng),通過模擬歷史上的重大戰(zhàn)爭來探索戰(zhàn)爭是否可以避免。在這個系統(tǒng)中,每個國家智能體都擁有獨特的屬性,并可以根據(jù)實際情況采取多種行動。實驗結(jié)果顯示,該系統(tǒng)能夠準確模擬歷史上的戰(zhàn)略決策過程,并揭示了戰(zhàn)爭爆發(fā)的內(nèi)在機制。
為了更好地利用LLMs進行社會模擬,研究者們提出了一種新的分類方法和模塊化框架——生成式智能體模型(GABM)。GABM通過LLM進行推理和決策,而不是依賴預(yù)設(shè)的規(guī)則。這種方法不僅提高了模擬的真實性,還為研究復(fù)雜社會現(xiàn)象提供了有力工具。例如,在模擬辦公室著裝規(guī)范的演化時,GABM可以追蹤每個員工的著裝選擇并記錄整體趨勢,同時根據(jù)員工的性格特征和組織文化等因素生成著裝決策。
然而,GABM也面臨著一些挑戰(zhàn)。其中之一就是如何平衡參數(shù)化提示和文本描述提示的使用。參數(shù)化提示允許研究者對智能體屬性和行為進行精確調(diào)整,但可能限制智能體行為的多樣性;而文本描述提示則使智能體表現(xiàn)出更復(fù)雜和逼真的行為模式,但可能增加結(jié)果的不可預(yù)測性。因此,研究者需要根據(jù)具體的模擬目標和研究需求合理組合這兩種方法。
LLMs在理解和處理純數(shù)值參數(shù)方面也存在一定的局限性。由于LLMs主要在自然語言文本上進行訓(xùn)練,對純數(shù)值的敏感度相對較低。因此,在使用LLMs進行社會模擬時,研究者需要精心設(shè)計提示詞以確保智能體能夠正確理解并響應(yīng)數(shù)值參數(shù)的變化。
最后,值得注意的是,基于LLMs的社會模擬雖然具有巨大的潛力,但也存在一些方法論上的爭議。過于直白的指導(dǎo)語可能會削弱研究的生態(tài)效度,導(dǎo)致觀察到的行為模式更多是研究者的預(yù)設(shè)而非智能體之間真實的動態(tài)交互結(jié)果。因此,研究者在設(shè)計GABM時應(yīng)更加謹慎地選擇指導(dǎo)語以確保模擬的真實性。
圖2. LLMs模擬的世界戰(zhàn)爭
雖然LLMs在社會模擬中展現(xiàn)出了巨大的潛力但也面臨著諸多挑戰(zhàn)。研究者需要不斷探索新的方法和工具以克服這些挑戰(zhàn)并推動該領(lǐng)域的發(fā)展。同時,他們也需要保持謹慎和客觀以確保模擬結(jié)果的真實性和可靠性。
圖4. 生成性基于智能體模型(GABM)的概念圖
圖:流行病患者的生成性智能體模型