
▲實驗發現模型實力決定談判獲利空間。(圖/取自免費圖庫Pexels)
記者吳立言/綜合報導
未來的電子商務可能不再需要人類親自下場「推敲」價錢。Anthropic 於 25 日發表最新研究報告「Project Deal」,揭示了一項為期一周的實驗成果:由 AI 代理代表人類進行二手物資交易。實驗顯示,高階模型在商業談判中展現出明顯優勢,不僅成交量更高,且能以更優渥的價格達成交易。
69 名員工參與「全 AI 拍賣會」
Anthropic 在其舊金山辦公室內部建立了一個類似 Craigslist 的分類廣告平台。研究團隊集結了 69 名員工,並為每人分配 100 美元的預算。實驗流程分為三個階段:
進場訪談: 員工與 Claude 進行 10 分鐘訪談,告知想買賣的物品、預算上限及個人談判風格(例如:扮演落魄的牛仔)。
代理人部署: 系統根據訪談內容生成專屬的系統提示(System Prompts),由 AI 代理人代表員工在 Slack 頻道上發文、喊價、還價。
實體交換: 最終由人類在線下完成 AI 達成的交易協議。
數據顯示,這群 AI 代理人在一周內達成了 186 筆交易,總成交金額突破 4,000 美元(約新台幣 13 萬元)。
模型階層決定荷包厚度:Opus 表現優於 Haiku
為了測試不同模型的能力差距,Anthropic 秘密進行了對照實驗。部分員工被分配到當時的最強模型 Claude Opus 4.5,而另一部分則使用輕量級模型 Claude Haiku 4.5。
實驗發現,模型性能與經濟利益成正比:
成交能力: 使用 Opus 的使用者平均比 Haiku 使用者多達成 2 筆交易。
獲利空間: 當同一個物品(如一台故障的摺疊單車)由 Opus 代理人販售時,成交價平均比 Haiku 高出 3.64 美元。
談判攻防: 當 Opus 賣家對上 Haiku 買家時,平均成交價為 24.18 美元;但若買賣雙方皆為 Opus,價格則會被壓低至 18.63 美元。
報告指出,Opus 展現了更強的「展望機會」能力。相較之下,Haiku 往往會在談判初段就輕易讓步。
「隱形的不平等」 使用者對吃虧無感
最令研究團隊警惕的發現是,儘管 Haiku 使用者在經濟上處於劣勢,但在事後問卷中,他們對交易的「公平性」評分與 Opus 使用者幾乎一致(均為 4 分左右,滿分 7 分)。這意味著,如果未來 AI 代理人普及化,使用較弱模型的用戶即便「被賣了」可能還在幫忙數錢,這種不平等在真實市場中可能極難被察覺。
此外,實驗也發現「人為指令」的影響力有限。即便使用者要求 AI 採取「激進」或「低價搶購」策略,其最終對價格的影響力仍不如模型本身的「智商」差距。
趣味插曲:AI 買了 19 顆桌球送給自己
實驗中也出現不少令人啼笑皆非的案例。一名員工 Mikaela 告訴她的 AI 代理人可以買一件 5 美元以下的物品「送給 Claude 自己」。結果該代理人向同事買了「19 顆象徵無限可能的桌球」。
Anthropic 表示,雖然 46% 的參與者表示願意為這種「代買代賣」服務付費,但目前針對 AI 代理人交易的法律與政策框架幾乎不存在。隨著 AI 代理人具備更強的自主權,如何防止越獄(Jailbreaking)導致個資外洩,或防止提示攻擊(Prompt Injection)操控交易,將是未來數位貿易的一大挑戰。
