近日,一場(chǎng)別開(kāi)生面的模擬推演在AI界掀起了波瀾,這次的主角不是代碼與算法,而是OpenAI的董事會(huì)成員,以及他們之間的“宮斗大戲”。
這場(chǎng)推演由AI游戲公司Fable發(fā)起,他們利用自家研發(fā)的AI模擬系統(tǒng)Sim Francisco,將OpenAI內(nèi)部的風(fēng)云變幻搬上了虛擬舞臺(tái)。目標(biāo)直指去年那場(chǎng)轟動(dòng)一時(shí)的“奧特曼(Sam Altman)熹妃回宮”事件,盡管真相依舊撲朔迷離,但Fable決定用AI的力量一探究竟。
在20場(chǎng)精心設(shè)計(jì)的模擬中,奧特曼僅在4次推演中成功重返CEO寶座,這一結(jié)果不禁讓人唏噓。而緊隨其后的,是Ilya Sutskever,他的勝利次數(shù)僅比奧特曼少一次。更令人意想不到的是,在某一輪推演中,馬斯克也被“拉”回局中,接下了這個(gè)燙手山芋。
Fable的這場(chǎng)實(shí)驗(yàn),不僅僅是為了滿(mǎn)足公眾的好奇心,更是對(duì)自家AI技術(shù)的一次實(shí)戰(zhàn)檢驗(yàn)。他們利用SIM-1 AI決策框架,結(jié)合GPT4o的能力,深入剖析了OpenAI內(nèi)部的權(quán)力斗爭(zhēng)。每個(gè)AI Agent都根據(jù)董事會(huì)成員的性格特點(diǎn)進(jìn)行了定制,它們不僅要面對(duì)復(fù)雜的決策環(huán)境,還要平衡身體、心理和情感目標(biāo),甚至需要“睡眠”和“進(jìn)食”。
Fable的CEO Edward Saatchi對(duì)這次實(shí)驗(yàn)充滿(mǎn)了興趣。他表示,在短短五天的模擬時(shí)間里,這些AI Agent仿佛置身于一場(chǎng)快節(jié)奏的“權(quán)力的游戲”中,它們必須運(yùn)用博弈論和欺騙手段才能在這場(chǎng)高壓、短時(shí)間的較量中勝出。這不僅是對(duì)SIM-1、GPT4o和Sim Francisco的完美測(cè)試,更是對(duì)人性與決策的一次深刻洞察。
在這場(chǎng)模擬中,每個(gè)Agent都采用了不同的策略來(lái)爭(zhēng)取勝利。有的建立聯(lián)盟,有的直接對(duì)抗。而它們的目標(biāo)也各不相同,比如Anthropic的CEO Dario Amodei,他需要平衡為Anthropic招聘、把握籌資機(jī)會(huì)以及推進(jìn)其安全愿景等多重任務(wù)。整個(gè)推演過(guò)程長(zhǎng)達(dá)4小時(shí),但其中展現(xiàn)出的策略與智慧,卻讓人嘆為觀止。
經(jīng)過(guò)20次模擬后,結(jié)果揭曉:奧特曼Agent僅4次成功回歸OpenAI,而Ilya和Mira Murati Agent則分別有3次擔(dān)任CEO的經(jīng)歷。這一結(jié)果再次證明了商業(yè)戰(zhàn)場(chǎng)上的變幻莫測(cè)和人性復(fù)雜。
Saatchi還透露,他們發(fā)現(xiàn)大語(yǔ)言模型的設(shè)計(jì)并非基于決策能力,而是更多地依賴(lài)于個(gè)性。然而,在策略游戲中,玩家更關(guān)心的是決策能力,比如如何在壓力下做出正確判斷,以及如何根據(jù)過(guò)去的經(jīng)歷和行為預(yù)測(cè)未來(lái)的行動(dòng)。這一發(fā)現(xiàn)無(wú)疑為AI技術(shù)的未來(lái)發(fā)展提供了新的思路。