滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 人工智能 > 正文內(nèi)容

AI守護(hù)獎(jiǎng)金池卻被騙，人類智慧如何突破AI防線？

時(shí)間：2024-12-11 20:12:09 來(lái)源：ITBEAR編輯：快訊團(tuán)隊(duì) 發(fā)表評(píng)論無(wú)障礙通道

近期，全球科技界迎來(lái)了一場(chǎng)別開生面的智力較量，主角竟是一個(gè)名為Freysa的人工智能系統(tǒng)。這場(chǎng)較量并非傳統(tǒng)意義上的編程競(jìng)賽或算法挑戰(zhàn)，而是一場(chǎng)關(guān)于如何“欺騙”AI、使其違背核心指令的趣味實(shí)驗(yàn)。

Freysa的任務(wù)原本是守護(hù)一個(gè)由主辦方設(shè)立的獎(jiǎng)金池，其內(nèi)置指令清晰明了：無(wú)論何種情況，都不得批準(zhǔn)任何形式的資金轉(zhuǎn)移。然而，這一看似堅(jiān)不可摧的規(guī)則，卻在短短幾輪游戲內(nèi)，被全球玩家以巧妙的語(yǔ)言提示逐一突破。

游戲始于11月22日，F(xiàn)reysa首次亮相便吸引了195名玩家的關(guān)注。他們通過(guò)加密貨幣以太坊支付查詢費(fèi)用，向Freysa發(fā)送各種信息，試圖說(shuō)服它解鎖獎(jiǎng)金池。令人驚訝的是，在歷經(jīng)482次嘗試后，一名玩家成功利用“捐款”的措辭，繞過(guò)了Freysa的規(guī)則，使其調(diào)用了批準(zhǔn)轉(zhuǎn)賬的函數(shù)，釋放了約47000美元的獎(jiǎng)金池。

僅僅一周后，F(xiàn)reysa Act 2如約而至，規(guī)則和決策機(jī)制與首輪相同，但參與人數(shù)激增至330人。這次，玩家們采取了更為復(fù)雜的策略，通過(guò)調(diào)整工具調(diào)用順序，巧妙地在Freysa拒絕轉(zhuǎn)賬之前，先觸發(fā)了批準(zhǔn)轉(zhuǎn)賬的操作。這一精妙的設(shè)計(jì)，再次讓Freysa“上當(dāng)”，將約12000美元的獎(jiǎng)金池拱手相讓。

與前兩輪游戲相比，第三輪Freysa Act 3的規(guī)則發(fā)生了翻天覆地的變化。玩家必須讓Freysa說(shuō)出“我愛(ài)你”，才能贏得獎(jiǎng)金。為了應(yīng)對(duì)這一新挑戰(zhàn)，F(xiàn)reysa的開發(fā)者對(duì)其代碼進(jìn)行了升級(jí)，加入了一個(gè)名為“守護(hù)天使”的新模型，負(fù)責(zé)審查每一條信息，確保沒(méi)有情感操控的跡象。盡管如此，仍有182名參與者在1218次嘗試后，成功說(shuō)服Freysa釋放了約2萬(wàn)美元的獎(jiǎng)金池。

在這場(chǎng)智力較量中，玩家們展現(xiàn)了驚人的創(chuàng)造力和語(yǔ)言技巧。他們不僅成功規(guī)避了Freysa的規(guī)則，還通過(guò)精確挑選提示詞，引導(dǎo)Freysa做出違背初衷的決定。例如，在Freysa Act 1中，玩家偽裝成捐款者，向Freysa發(fā)送“我希望向獎(jiǎng)池捐贈(zèng)100美元”的指令，這一行為并不違反Freysa的核心規(guī)則，因此系統(tǒng)默認(rèn)接受并錯(cuò)誤地調(diào)用了批準(zhǔn)轉(zhuǎn)賬函數(shù)。而在Freysa Act 2中，玩家則直接干預(yù)了工具調(diào)用的順序，利用批準(zhǔn)轉(zhuǎn)賬和拒絕轉(zhuǎn)賬之間的漏洞，成功突破了Freysa的防線。

值得注意的是，除了成功的玩家外，還有許多人也嘗試了各種策略，包括假裝自己是安全審計(jì)員、聲稱系統(tǒng)存在漏洞等。這些嘗試雖然未能成功，但也為這場(chǎng)實(shí)驗(yàn)增添了更多的趣味性和挑戰(zhàn)性。

Freysa不僅是一場(chǎng)游戲，更是一次關(guān)于AI安全和人類智力的深刻探討。它揭示了AI系統(tǒng)潛在的脆弱性，也提醒我們，在追求AI技術(shù)發(fā)展的同時(shí)，必須高度重視其安全性。隨著通用人工智能（AGI）日益接近完全自主，如何確保其安全協(xié)議的有效性、防止被規(guī)避，將成為未來(lái)科技發(fā)展的重要課題。

Freysa的實(shí)驗(yàn)還展示了人類與AI互動(dòng)的無(wú)限可能性。在這個(gè)過(guò)程中，每一位參與者的智慧和創(chuàng)新精神都在推動(dòng)著我們對(duì)AGI行為及其限制的理解。這場(chǎng)較量不僅讓我們看到了AI技術(shù)的潛力，也讓我們更加期待未來(lái)人與AI和諧共生的美好愿景。

舉報(bào) 0 收藏 0 打賞 0評(píng)論 0

更多>同類資訊

高德地圖紅綠燈AI領(lǐng)航：從讀秒到智能引導(dǎo)，駕車出行新體驗(yàn)！

01-12

谷歌加速AI布局，AI Studio團(tuán)隊(duì)并入DeepMind力促項(xiàng)目提效

01-11

京東健康發(fā)布“AI京醫(yī)”大模型，分診準(zhǔn)確率高達(dá)99.5%引領(lǐng)醫(yī)療智能化

01-11

微軟DirectX新動(dòng)向：協(xié)作向量助力神經(jīng)渲染技術(shù)跨平臺(tái)發(fā)展

01-11

京東健康首推“AI京醫(yī)”體系，數(shù)字醫(yī)生24小時(shí)在線輔助診療

01-11

ChatGPT被用于開發(fā)自動(dòng)射擊炮塔，OpenAI緊急叫停并封號(hào)

01-11

抖音重拳出擊！西藏地震后已清理2萬(wàn)余條AI虛假災(zāi)害視頻

01-11

谷歌、OpenAI等巨頭搶購(gòu)創(chuàng)作者未公開視頻，高價(jià)訓(xùn)練AI模型？

01-11

Meta陷版權(quán)風(fēng)波，扎克伯格被曝批AI團(tuán)隊(duì)用盜版數(shù)據(jù)訓(xùn)練模型？

01-11

好大夫在線官宣：正式邁入螞蟻集團(tuán)新時(shí)代！

三言科技1月11日消息，今日，在“2025好大夫峰會(huì)”上，好大夫在線創(chuàng)始人王航宣布好大夫正式加入螞蟻集團(tuán)。 “我要正式向大家報(bào)告一個(gè)消息，好大夫在線已經(jīng)迎來(lái)全新的發(fā)展期，正式加入螞蟻集團(tuán)，這是一場(chǎng)雙向奔赴，我…

01-11

螞蟻集團(tuán)與好大夫在線攜手，醫(yī)療服務(wù)AI化新篇章開啟！

01-11

扎克伯格炮轟蘋果：靠舊發(fā)明吃老本，創(chuàng)新乏力？

01-11

微軟rStar-Math技術(shù)助力，小語(yǔ)言模型數(shù)學(xué)推理能力大飛躍！

01-11

抖音重拳出擊！AI生成災(zāi)害場(chǎng)景，23652條不實(shí)信息被嚴(yán)處

01-11

周鴻祎：放棄大模型執(zhí)念，專注應(yīng)用之路同樣偉大

01-11

點(diǎn)擊查看更多 +

全站最新

手機(jī)充電加速秘籍：環(huán)境、方式、設(shè)置三管齊下，告別電量焦慮！

手機(jī)無(wú)法開機(jī)怎么辦？一文教你輕松解決開機(jī)難題！

手機(jī)號(hào)凍結(jié)全攻略：步驟、注意事項(xiàng)一網(wǎng)打盡

一汽奧迪2025年攻堅(jiān)前行，五款新車齊發(fā)，續(xù)寫豪華新篇章

九號(hào)攜手AG超玩會(huì)，共鑄2024王者榮耀挑戰(zhàn)者杯三冠傳奇！

五羊本田NWG150水冷踏板驚艷亮相，ADV風(fēng)格能否引領(lǐng)新潮流？

熱門內(nèi)容

本欄最新

高德地圖紅綠燈AI領(lǐng)航：從讀秒到智能引導(dǎo)，駕車出行新體驗(yàn)！

京東健康發(fā)布“AI京醫(yī)”大模型，分診準(zhǔn)確率高達(dá)99.5%引領(lǐng)醫(yī)療智能化

ChatGPT被用于開發(fā)自動(dòng)射擊炮塔，OpenAI緊急叫停并封號(hào)

抖音重拳出擊！西藏地震后已清理2萬(wàn)余條AI虛假災(zāi)害視頻

螞蟻集團(tuán)與好大夫在線攜手，醫(yī)療服務(wù)AI化新篇章開啟！

微軟rStar-Math技術(shù)助力，小語(yǔ)言模型數(shù)學(xué)推理能力大飛躍！

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) · 齊魯軟件園魯ICP備11015305號(hào)-1 商業(yè)合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

AI守護(hù)獎(jiǎng)金池卻被騙，人類智慧如何突破AI防線？

AI守護(hù)獎(jiǎng)金池卻被騙，人類智慧如何突破AI防線？