隨著人工智能技術(shù)的飛速發(fā)展,大語言模型(LLMs)在多個(gè)領(lǐng)域展現(xiàn)出巨大的潛力,社會模擬便是其中之一。近日,一項(xiàng)研究揭示了利用LLMs進(jìn)行社會模擬的新挑戰(zhàn)和機(jī)遇,引發(fā)學(xué)術(shù)界的廣泛關(guān)注。
在這項(xiàng)研究中,研究者們嘗試將LLMs作為驅(qū)動智能體的核心,以模擬復(fù)雜的人類社會行為。然而,他們發(fā)現(xiàn)了一個(gè)有趣的現(xiàn)象:這些由LLMs驅(qū)動的智能體,在模擬過程中變得異常啰嗦,缺乏自主性和創(chuàng)新性。這不禁讓人聯(lián)想到教外國朋友打麻將的場景:是事無巨細(xì)地指導(dǎo)每一步,還是只介紹基本規(guī)則讓他們自主探索?顯然,過于詳細(xì)的指導(dǎo)會扼殺學(xué)習(xí)和發(fā)現(xiàn)的樂趣。
以霍布斯的“人人相爭”理論為例,研究者們?yōu)槊總€(gè)智能體編寫了詳細(xì)的“劇本”,包括“打不過就投降”、“搶劫比種地更有效就繼續(xù)搶劫”等規(guī)則。這種設(shè)計(jì)雖然讓模擬過程看似嚴(yán)謹(jǐn),但卻缺乏真實(shí)的互動和創(chuàng)新,更像是一出事先寫好的戲。
研究者們擔(dān)憂,這種過度指導(dǎo)可能導(dǎo)致所謂的“發(fā)現(xiàn)”其實(shí)只是研究者預(yù)設(shè)的劇情。正如魔術(shù)表演中,人們驚嘆于魔術(shù)師從帽子里掏出的兔子,卻不知這只兔子本就藏在帽子里。因此,在使用LLMs研究社會現(xiàn)象時(shí),“少即是多”的原則顯得尤為重要。過于詳細(xì)的指導(dǎo)反而會遮蔽真正有價(jià)值的發(fā)現(xiàn)。
為了探索LLMs在社會模擬中的潛力,研究者們進(jìn)行了多項(xiàng)實(shí)驗(yàn)。其中一項(xiàng)研究利用LLMs復(fù)現(xiàn)了利維坦理論,構(gòu)建了一個(gè)包含9個(gè)智能體的模擬世界。每個(gè)智能體被賦予了攻擊性、貪婪度和力量值等特征,通過耕種、搶奪、交易或捐贈等行為方式在資源有限的環(huán)境中生存。實(shí)驗(yàn)結(jié)果顯示,這個(gè)人工社會的演化軌跡與霍布斯的理論預(yù)測高度吻合,智能體在資源爭奪中逐漸形成了讓渡關(guān)系,最終出現(xiàn)了一個(gè)絕對主權(quán)者,即“利維坦”。
另一項(xiàng)研究則更具野心,研究者們開發(fā)了一款名為WarAgent的多智能體系統(tǒng),通過模擬歷史上的重大戰(zhàn)爭來探索戰(zhàn)爭是否可以避免。他們選擇了第一次世界大戰(zhàn)、第二次世界大戰(zhàn)和中國戰(zhàn)國時(shí)期作為研究對象,每個(gè)國家智能體擁有特定的屬性如領(lǐng)導(dǎo)力、軍事實(shí)力等,并可以采取多種行動如軍事動員、外交溝通等。實(shí)驗(yàn)結(jié)果顯示,該系統(tǒng)成功重現(xiàn)了歷史上的戰(zhàn)略決策過程,并揭示了戰(zhàn)爭爆發(fā)的內(nèi)在機(jī)制。
基于這些開創(chuàng)性嘗試,研究者們提出了一種新的分類方法和模塊化框架——生成式智能體模型(GABM)。該模型將LLMs與機(jī)械模型相結(jié)合,通過LLMs進(jìn)行推理和決策,而機(jī)械模型則負(fù)責(zé)模擬智能體之間的互動機(jī)制。這種方法無需事先定義詳細(xì)的決策規(guī)則,而是利用LLM中包含的大量訓(xùn)練數(shù)據(jù)來模擬人類行為,從而更真實(shí)地反映人類決策的復(fù)雜性。
然而,研究者們也意識到,在使用LLMs進(jìn)行社會模擬時(shí),過于詳細(xì)的指導(dǎo)語可能會損害模擬的生態(tài)有效性。他們指出,高度指導(dǎo)性的指導(dǎo)語可能導(dǎo)致觀察到的行為模式更多是研究者的預(yù)設(shè),而非智能體之間真實(shí)的動態(tài)交互結(jié)果。因此,在設(shè)計(jì)GABM時(shí),應(yīng)盡量減少直接的行為指引,轉(zhuǎn)而關(guān)注如何構(gòu)建一個(gè)允許真實(shí)涌現(xiàn)現(xiàn)象產(chǎn)生的生態(tài)。
這項(xiàng)研究不僅揭示了LLMs在社會模擬中的潛力和挑戰(zhàn),也為未來的研究提供了重要啟示。隨著技術(shù)的不斷進(jìn)步,我們有理由相信,LLMs將在更多領(lǐng)域展現(xiàn)出其獨(dú)特的價(jià)值。