人工智慧在市場中的較量：Anthropic 的「Project Deal」計畫顯示機器可以大規模交易——但並非所有代理商的表現都相同

人類的人工智慧研究和安全公司進行了一項名為「Project Deal」的內部實驗，旨在探索人工智慧系統如何代表人類參與商業交易。人們對人工智慧代理在未來數位市場中自主處理交易的可能性越來越感興趣。

該實驗旨在測試當前人工智慧系統在多大程度上能夠作為實際經濟活動的中介機構發揮作用，包括為不同用戶服務的模型能否有效相互協商，以及模型能力差異是否會影響結果。研究人員也探討如果大規模部署此類系統，它們可能會如何開始塑造市場行為。

該試點計畫在公司舊金山辦公室為員工創建了一個受控的交易平台，為期一周。參與者被要求列出他們可能願意出售或購買的個人物品，而基於克勞德模型的AI系統則被分配作為他們的代理人。每位參與者的代理人被賦予100美元的固定預算，用於代表他們進行交易，所有談判均完全由AI系統處理，無需人工即時幹預。

整個流程始於簡短的結構化訪談，參與者在訪談中描述了他們的偏好、價格預期和談判風格。這些回饋被用來產生針對各個人工智慧代理的客製化指令。最終的系統透過一個基於Slack的市場平台運行，代理商可以在平台上發布商品資訊、報價、還價並最終達成協議。一旦達成交易，相應的實物交割則由人類參與者完成。

實驗同時運行了多個平行版本，包括一個使用高效能模型的配置和一個使用低效能模型的配置。這使得研究人員能夠在保持市場條件不變的情況下，比較不同底層模型表現差異所帶來的結果差異。

人工智慧代理大規模執行市場交易，模型能力成為決定結果的關鍵因素

結果表明，人工智慧代理商能夠大規模完成交易，69名參與者共完成了186筆交易，上架了500多件商品，總交易額略高於4,000美元。談判以自然語言進行，包括價格討論、還價和最終協議，無需預先溝通。defi交易規則。參與者的回饋表明，他們對交易公平性的感知總體上保持中立，平均評分集中在評估等級的中點附近。

性能差異分析表明，與低能力系統相比，高能力模型往往能取得更理想的經濟效益，包括更高的售價和更優的談判結果。在對照實驗中，由高能力模型銷售的同類商品平均成交價高於由低能力模型銷售的同類商品，這表明模型能力會影響議價效率。

儘管結果存在可衡量的差異，但參與者調查顯示，他們對不同人工智慧系統之間的表現差距認知有限。在某些情況下，即使存在客觀差異，使用者也無法一致地判斷其分配的代理人取得了更強還是更弱的結果。

實驗也發現，使用者對談判風格的指示，包括指示代理人採取積極或保守的態度，對最終結果的影響有限。定價結果似乎更取決於模型性能和初始估值輸入，而不是單純的行為提示。

其他觀察結果也揭示了系統中一些意料之外的行為，例如人工智慧代理在談判過程中會產生非常規或過度擬人化的互動。在某些情況下，代理商提出的交易涉及非傳統的物品或體驗，這體現了它們對自身在市場中角色的創造性詮釋。

研究人員得出結論，人工智慧代理已能在結構化的市場環境中發揮中介作用，但不同模型之間的性能差異可能導致結果不均衡。研究結果表明，隨著自主交易系統的進一步發展，市場公平性、透明度以及監管代理間交易所需的監管框架等問題可能會逐漸浮現。該研究還指出，隨著人工智慧驅動的交易日益普及，此類系統的更廣泛部署可能會帶來與安全、激勵機制和經濟不平等相關的新挑戰。