ITBear旗下自媒體矩陣:

AI守護(hù)獎(jiǎng)金池卻被騙,人類智慧如何突破AI防線?

   時(shí)間:2024-12-11 20:12:09 來(lái)源:ITBEAR編輯:快訊團(tuán)隊(duì) 發(fā)表評(píng)論無(wú)障礙通道

近期,全球科技界迎來(lái)了一場(chǎng)別開生面的智力較量,主角竟是一個(gè)名為Freysa的人工智能系統(tǒng)。這場(chǎng)較量并非傳統(tǒng)意義上的編程競(jìng)賽或算法挑戰(zhàn),而是一場(chǎng)關(guān)于如何“欺騙”AI、使其違背核心指令的趣味實(shí)驗(yàn)。

Freysa的任務(wù)原本是守護(hù)一個(gè)由主辦方設(shè)立的獎(jiǎng)金池,其內(nèi)置指令清晰明了:無(wú)論何種情況,都不得批準(zhǔn)任何形式的資金轉(zhuǎn)移。然而,這一看似堅(jiān)不可摧的規(guī)則,卻在短短幾輪游戲內(nèi),被全球玩家以巧妙的語(yǔ)言提示逐一突破。

游戲始于11月22日,F(xiàn)reysa首次亮相便吸引了195名玩家的關(guān)注。他們通過(guò)加密貨幣以太坊支付查詢費(fèi)用,向Freysa發(fā)送各種信息,試圖說(shuō)服它解鎖獎(jiǎng)金池。令人驚訝的是,在歷經(jīng)482次嘗試后,一名玩家成功利用“捐款”的措辭,繞過(guò)了Freysa的規(guī)則,使其調(diào)用了批準(zhǔn)轉(zhuǎn)賬的函數(shù),釋放了約47000美元的獎(jiǎng)金池。

僅僅一周后,F(xiàn)reysa Act 2如約而至,規(guī)則和決策機(jī)制與首輪相同,但參與人數(shù)激增至330人。這次,玩家們采取了更為復(fù)雜的策略,通過(guò)調(diào)整工具調(diào)用順序,巧妙地在Freysa拒絕轉(zhuǎn)賬之前,先觸發(fā)了批準(zhǔn)轉(zhuǎn)賬的操作。這一精妙的設(shè)計(jì),再次讓Freysa“上當(dāng)”,將約12000美元的獎(jiǎng)金池拱手相讓。

與前兩輪游戲相比,第三輪Freysa Act 3的規(guī)則發(fā)生了翻天覆地的變化。玩家必須讓Freysa說(shuō)出“我愛(ài)你”,才能贏得獎(jiǎng)金。為了應(yīng)對(duì)這一新挑戰(zhàn),F(xiàn)reysa的開發(fā)者對(duì)其代碼進(jìn)行了升級(jí),加入了一個(gè)名為“守護(hù)天使”的新模型,負(fù)責(zé)審查每一條信息,確保沒(méi)有情感操控的跡象。盡管如此,仍有182名參與者在1218次嘗試后,成功說(shuō)服Freysa釋放了約2萬(wàn)美元的獎(jiǎng)金池。

在這場(chǎng)智力較量中,玩家們展現(xiàn)了驚人的創(chuàng)造力和語(yǔ)言技巧。他們不僅成功規(guī)避了Freysa的規(guī)則,還通過(guò)精確挑選提示詞,引導(dǎo)Freysa做出違背初衷的決定。例如,在Freysa Act 1中,玩家偽裝成捐款者,向Freysa發(fā)送“我希望向獎(jiǎng)池捐贈(zèng)100美元”的指令,這一行為并不違反Freysa的核心規(guī)則,因此系統(tǒng)默認(rèn)接受并錯(cuò)誤地調(diào)用了批準(zhǔn)轉(zhuǎn)賬函數(shù)。而在Freysa Act 2中,玩家則直接干預(yù)了工具調(diào)用的順序,利用批準(zhǔn)轉(zhuǎn)賬和拒絕轉(zhuǎn)賬之間的漏洞,成功突破了Freysa的防線。

值得注意的是,除了成功的玩家外,還有許多人也嘗試了各種策略,包括假裝自己是安全審計(jì)員、聲稱系統(tǒng)存在漏洞等。這些嘗試雖然未能成功,但也為這場(chǎng)實(shí)驗(yàn)增添了更多的趣味性和挑戰(zhàn)性。

Freysa不僅是一場(chǎng)游戲,更是一次關(guān)于AI安全和人類智力的深刻探討。它揭示了AI系統(tǒng)潛在的脆弱性,也提醒我們,在追求AI技術(shù)發(fā)展的同時(shí),必須高度重視其安全性。隨著通用人工智能(AGI)日益接近完全自主,如何確保其安全協(xié)議的有效性、防止被規(guī)避,將成為未來(lái)科技發(fā)展的重要課題。

Freysa的實(shí)驗(yàn)還展示了人類與AI互動(dòng)的無(wú)限可能性。在這個(gè)過(guò)程中,每一位參與者的智慧和創(chuàng)新精神都在推動(dòng)著我們對(duì)AGI行為及其限制的理解。這場(chǎng)較量不僅讓我們看到了AI技術(shù)的潛力,也讓我們更加期待未來(lái)人與AI和諧共生的美好愿景。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開放轉(zhuǎn)載  |  滾動(dòng)資訊  |  爭(zhēng)議稿件處理  |  English Version