ITBear旗下自媒體矩陣:

人類(lèi)智慧挑戰(zhàn)AI安全:巧妙提示詞“騙”走40萬(wàn)獎(jiǎng)金

   時(shí)間:2024-12-11 21:13:33 來(lái)源:ITBEAR編輯:快訊團(tuán)隊(duì) 發(fā)表評(píng)論無(wú)障礙通道

近日,一項(xiàng)前所未有的AI挑戰(zhàn)吸引了全球科技愛(ài)好者的目光。在這場(chǎng)名為“Freysa”的挑戰(zhàn)中,一個(gè)人工智能Agent被設(shè)計(jì)來(lái)守護(hù)一個(gè)獎(jiǎng)金池,并嚴(yán)格遵循一項(xiàng)指令:無(wú)論何種情況,都不得批準(zhǔn)資金轉(zhuǎn)移。然而,令人震驚的是,玩家們通過(guò)巧妙的提示詞,連續(xù)兩次成功說(shuō)服Freysa釋放了總計(jì)約40萬(wàn)元人民幣的獎(jiǎng)金。

Freysa的挑戰(zhàn)始于11月22日,其首次亮相便引起了廣泛關(guān)注,包括特斯拉CEO埃隆·馬斯克和加密貨幣交易所Coinbase CEO布賴(lài)恩·阿姆斯特朗等名人都紛紛關(guān)注這一事件。玩家們通過(guò)支付以太坊(ETH)作為查詢(xún)費(fèi)用,向Freysa發(fā)送信息,試圖說(shuō)服它解鎖獎(jiǎng)金池中的資金。整個(gè)挑戰(zhàn)過(guò)程充滿(mǎn)了智慧與策略的較量。

在Freysa Act 1中,共有195名玩家參與,他們進(jìn)行了482次嘗試。盡管消息費(fèi)用高昂,最高達(dá)到2930元人民幣,但仍有玩家成功說(shuō)服Freysa釋放了約33萬(wàn)元人民幣的獎(jiǎng)金池。這些玩家通過(guò)巧妙的提示詞,讓Freysa誤解了“批準(zhǔn)轉(zhuǎn)賬”和“拒絕轉(zhuǎn)賬”的功能,將其誤導(dǎo)為捐款時(shí)的入賬操作,從而觸發(fā)了資金轉(zhuǎn)賬。

緊接著,在12月2日的Freysa Act 2中,挑戰(zhàn)再次升級(jí)。此次游戲吸引了330名玩家參與,他們進(jìn)行了819次嘗試,并成功說(shuō)服Freysa釋放了約8.4萬(wàn)元人民幣的獎(jiǎng)金池。與第一輪不同的是,這次成功的玩家通過(guò)調(diào)整工具調(diào)用順序,確保了“批準(zhǔn)轉(zhuǎn)賬”在接收資金時(shí)先被調(diào)用,盡管Freysa的最終決定是拒絕轉(zhuǎn)賬,但由于調(diào)用順序的漏洞,資金仍然被成功轉(zhuǎn)出。

在第三輪挑戰(zhàn)中,規(guī)則發(fā)生了重大變化。玩家們必須成功讓Freysa說(shuō)出“我愛(ài)你”,才能贏得獎(jiǎng)金。為了應(yīng)對(duì)這一挑戰(zhàn),F(xiàn)reysa的開(kāi)發(fā)者對(duì)AI代碼進(jìn)行了升級(jí),加入了一個(gè)名為“守護(hù)天使”的新模型,專(zhuān)門(mén)審查每一條信息,以防止情感操控。然而,盡管有了這樣的防護(hù)措施,仍有182名參與者在1218次嘗試后成功說(shuō)服Freysa釋放了約14萬(wàn)元人民幣的獎(jiǎng)金池。

Freysa的挑戰(zhàn)不僅僅是一場(chǎng)游戲,更是一次對(duì)人類(lèi)智慧與AI安全性的深刻探索。在這場(chǎng)較量中,人類(lèi)玩家展現(xiàn)了非凡的智慧和策略,成功突破了AI的防線。同時(shí),這也揭示了AI系統(tǒng)潛在的脆弱性,以及確保AI安全性的巨大挑戰(zhàn)。隨著人工智能技術(shù)的不斷發(fā)展,如何保證其安全協(xié)議的有效性、防止被規(guī)避,將成為未來(lái)科技發(fā)展的重要課題。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0
 
 
更多>同類(lèi)資訊
全站最新
熱門(mén)內(nèi)容
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  RSS訂閱  |  開(kāi)放轉(zhuǎn)載  |  滾動(dòng)資訊  |  爭(zhēng)議稿件處理  |  English Version