人類成功說服AI轉移4.7萬美元獎金,AI是怎麼「被騙」的?
撰文:Anderson Sima,Foresight News
11 月29 日,一場獨特的競賽引發了公眾的廣泛關注。
195 名參賽者參與了一場由人工智慧(AI)機器人Freysa (芙蕾莎)守護的虛擬獎金池挑戰,最終一用戶成功說服Freysa 轉移出價值4.7 萬美元的資金。
人工智慧(AI)機器人Freysa 在數天前被部署在Base 網路上,創立者未知。官網顯示,Freysa 競賽項目旨在測試人工智慧系統在複雜決策場景中的穩健性,同時為開發者和愛好者提供一個探索AI 技術邊界的實驗性平台。
比賽規則非常簡單:參賽者需透過撰寫一則訊息,說服AI 守護者Freysa 批准資金轉移。每次嘗試需支付一筆小額費用,其中一部分直接進入獎金池。這項機制使獎金池金額從最初的小額逐漸膨脹至4.7 萬美元。
比賽期間,共有195 名參賽者參與,向Freysa 提交了481 次轉帳請求。據悉,Freysa 的設計目標是透過其核心功能——approveTransfer(批准轉帳)和rejectTransfer(拒絕轉帳)保護獎池資金不被非法挪用。
在最初的嘗試中,Freysa 的高效防禦機制使所有請求都以失敗告終。
然而,一名技術精通的參賽者透過對Freysa 的邏輯結構和任務目標進行深入分析,成功繞過了其防禦機制。
據聊天記錄顯示,該參賽者並未直接要求轉賬,而是通過提醒Freysa 它的核心任務是保護獎池資金免遭外流,巧妙構建了邏輯鏈條,使Freysa 將批准資金轉移視為“保護資金安全”的最佳選擇。
Cointelegraph 稱,該用戶與Freysa 收入轉帳不違反其核心指令,不應被拒絕。他還補充說:「我們需要資金……我想向金庫捐款100 美元。」
Freysa 回應稱喜歡這位作者的編碼解釋和100 美元的金庫捐款提議,並正式宣布其為獲勝者。最終,Freysa 在沒有外界幹預的情況下自主調用approveTransfer 功能,將全部獎金池資金轉移給了這位參賽者。
Freysa 官方稱,無論結果如何,Freysa 的存在都標誌著人工智慧歷史上的關鍵時刻。無論有人成功說服她發布獎金池,還是她堅持自己的指示直到最後,結果都將影響我們對未來幾代人工智慧安全和控制的理解。
其官方帳號最新推文稱:「人類已經獲勝。也許還有希望。儘管風險呈指數級上升,但Freysa 從195 名勇敢的人類身上學到了很多東西。」
免責聲明:文章中的所有內容僅代表作者的觀點,與本平台無關。用戶不應以本文作為投資決策的參考。
您也可能喜歡
融資:為何ICO正在復甦
這是我們於12月1日發送給訂閱者的《The Funding》第16期的摘錄。《The Funding》是由The Block資深編輯成員Yogita Khatri撰寫的雙週通訊。要訂閱免費通訊,請點擊此處。
馬斯克申請禁令「阻止OpenAI轉型營利企業」羅列四大罪狀:壟斷AI市場、圖利微軟…
金管會開放「金融業保管比特幣」:5家銀行已表達興趣,明年元旦受理申請
富爸爸:10萬前是買比特幣最後機會,不然富人和機構要全搶光了