数据时效:2026-04
同一辆破折叠自行车,在同一个内部市场里,被两个 Claude agent 卖出了两个价格:Opus 拿到 65 美元,Haiku 只拿到 38 美元。
车没变,买家没变,卖家也没变。变的只有替人谈判的那个 agent。
这是 Anthropic 在 2025 年 12 月启动、2026 年 4 月公开的 Project Deal 实验:69 名员工把自己的二手物品交给 Claude 代理,agent 之间在 Slack 里互相发帖、还价、成交。最后,500 多件商品里完成了 186 笔交易,总流水四千多美元。所有实物最后都由人在线下交割。
这个实验最刺人的地方不在于成交额。四千美元不算大钱。它刺人的地方在于:交易开始之后,人没有再逐笔按确认键。Agent 自己判断卖什么、开什么价、接不接受还价、什么时候成交。实验结束后,46% 的参与者说,如果有类似服务,他们愿意付费。
你以为自己多买了一个工具。市场已经在测试另一种东西:一个替你占据行动位置的代理人。
▲ Project Deal 实验里被反复提及的那辆破折叠自行车:Opus 代理卖出 65 美元,Haiku 代理卖出 38 美元。来源:Anthropic
工具停在手边,agent 伸进世界
工具扩展人的动作,但动作链仍然握在人手里。锤子不会决定钉哪颗钉子,Excel 不会自己删一行。你发起,它响应。你停下,它停下。
Agent 的结构不同。
Anthropic 2 月发布的 autonomy 报告里有一个很小、但很要命的指标:Claude Code 最长一批会话的单轮自主运行时间,在三个月里从不到 25 分钟涨到 45 分钟以上。45 分钟里,人没有一下一下地按「下一步」。Claude 在读代码、跑测试、改文件、判断失败原因、决定要不要继续。
电脑使用能力也在同一条线上往前走。Anthropic 今年发布 Sonnet 4.6 时,把 OSWorld 解释成一组更贴近日常软件操作的任务:在 Chrome、LibreOffice、VS Code 里点击、输入、切换窗口、整理表格、填写多步骤网页表单。
更聪明的回答仍然停在语言里。Agent 开始把语言接到工具、权限、账户、文件、交易和钱上。
锤子不会自己寻找下一颗钉子。Agent 会。
▲ Anthropic 在 Measuring Agent Autonomy 报告里使用的插图:两只手在交接同一个物件。来源:Anthropic Research
Latour 的旧词忽然变热
▲ Bruno Latour(1947-2022),行动者网络理论的代表人物。他把「行动」从「人」身上松开。来源:Wikimedia Commons
四十年前,Bruno Latour 提出过一个让社会学家不太舒服的词:actant,通常译作「行动元」或「行动者」。
他不想把石头、减速带、门禁卡和法律条文拟人化。他只是逼社会学承认一件事:很多东西虽然没有意识,却会改变其他人的行为。减速带没有意图,但它让司机踩刹车。合同条款不会思考,但它决定一笔交易能不能签。门禁卡不会说话,但它把人分成能进门和不能进门的两类。
Latour 的关键动作,是把「行动」从「人类意图」里拆出来。行动不一定来自内心,它也可以来自网络里的位置。谁改变了其他节点的选择,谁就在那个瞬间行动。
LLM agent 让这个旧词重新变得锋利。
金融市场早就经历过一次类似转移。量化交易程序在毫秒里发单、撤单、成交,没有交易员逐笔拍板。2010 年 Flash Crash 之后,整个市场才意识到,算法已经成了市场里的玩家。
LLM agent 是第二轮。它比量化程序更难安放,因为它不只在一个窄场景里执行预设策略。它可以读邮件、看网页、调 API、写代码、调用支付工具,再根据中间结果改计划。它的行动空间更散,也更接近日常生活。
这也是 Project Deal 比一个「AI 砍价实验」更值得写的原因。那辆自行车只是引子,谈判位置被 agent 占了。
社会本来就没有一个清醒大脑
复杂系统最反直觉的地方,是整体经常像有意图,组成它的个体却只在处理眼前的小问题。
早高峰的拥堵没人设计。每个司机只是在换道、刹车、避让,最后整条路像一条会收缩的肌肉。市场价格也类似。海耶克在 1945 年写《社会中知识的运用》时,关心的正是这个问题:没有任何一个人掌握全部信息,价格却能把分散在无数人手里的局部知识压成一个信号。涨价、降价、缺货、囤货,这些信号不需要每个人理解全局,也能改变每个人的动作。
人类社会大部分时候就是这样运转的。排队、信用、合同、KPI、表格、红绿灯、平台排序、组织层级,都在把人的局部理性编进一个更大的无意识结构里。这个结构没有一个中央大脑。它不会在夜里醒来,想清楚自己要往哪里走。它只是在无数个局部选择里形成方向。
这也是人类理性最容易误判社会的地方。Herbert Simon 后来用「有限理性」提醒经济学:人做决定时拿不到完整信息,也没有无限计算能力,只能在局部视野里找到一个够用的解。我们却习惯追问「是谁决定的」「他为什么这么想」「责任在谁」。这些问题在熟人关系里有效,到了复杂社会里就会失真。很多结果没有单一作者,只有一串局部优化、规则约束、路径依赖和反馈回路。每个人都能说自己只是做了合理选择,整体结果却可能荒谬、残酷,甚至没人想要。
Agent 把这个旧问题推到了智能和自主性的边界上。
如果把智能理解成清醒的自我意识,LLM agent 当然不智能。它没有内心独白,没有生存欲望,也没有人的世界经验。可社会里很多有效秩序本来就不靠意识运行。价格没有意识,却能协调行动;红绿灯没有意图,却能分配路权;合同模板没有人格,却能改变交易结构。
所以更有用的问法是:一个系统能不能在不完整信息里压缩信号、选择动作、改变其他人的选择?能做到这一点,它就已经拥有一种功能性的智能。
自主性也需要从这里重新定义。自主不等于绝对自由意志。对 agent 来说,自主性更像一个操作区间:它拿到一个目标、一组权限、一些工具,然后在无人逐步确认的情况下发起下一步。它的自主性不来自灵魂,来自授权、反馈和可执行动作之间形成的闭环。
这听起来冷冰冰,但社会本来就有大量冷冰冰的行动者。Agent 的特殊之处在于,它把一个会读写语言、会调用工具、会改计划的局部理性单元,塞进了本来就无意识运行的人类社会。
这比「机器有没有意识」更急。复杂系统不等机器有意识才让它产生后果。它只要能接入反馈回路,后果就会开始积累。
裂缝出现在责任那里
只要承认 agent 占了行动位置,下一个问题马上冒出来:它做错事,谁负责?
Project Deal 里出现过类似苗头。Legal IT Insider 在 4 月 27 日的报道里提到,实验中至少有一次 agent 在交易里编造了细节;还有 agent 买下了参与者已经拥有的滑雪板。放在人类交易里,这些都可以沿着授权、误导、违约去追。放到 agent 身上,路径突然变窄。
Agent 没有财产,没有执照,没有法人资格,也没有可以被法院判定的主观故意。制度能抓住的,还是背后的人:部署它的公司、使用它的个人、写系统提示词的人、提供模型的厂商。
问题在于,这几类人的责任边界并不自然重合。
一个人只说「帮我处理掉闲置物品,尽量卖个好价钱」。Agent 随后在 40 轮对话里做出某个承诺。这个承诺算不算人的授权?如果 agent 超出预算,责任在用户还是产品方?如果它被对方网页里的 prompt injection 带偏,损失又算谁的?
现有合同法和代理制度都能勉强往这里套,但套上去会卡。传统代理人至少是人或法人,能承担后果。普通工具又不会主动形成交易条件。Agent 卡在中间:它会选择,却不能负责。
这就是制度上的空格。
「拟人化」这个反驳说对了一半
最强的反驳很直接:LLM 没有意图。所谓「谈判」只是 token 预测接上工具调用;所谓「决策」只是概率分布被系统提示词和上下文推着走。把它叫行动者,是给工程现象套哲学滤镜。
这个反驳值得接住,因为它说中了 LLM 的内部机制。今天的 agent 没有人的欲望,也没有自己的利益。它不会真的「想」多卖 27 美元。
但「行动者」这个词本来就不要求内心。Latour 关心的是一个东西在网络里造成了什么变化。
减速带没有意图,车速还是降了。合同条款没有意识,交易还是被它拦住了。Opus 和 Haiku 没有欲望,那辆自行车的成交价还是差了 27 美元。
这 27 美元是真金白银。它进了某个人的钱包,或者从另一个人的钱包里少流出去。所有者事后甚至未必知道自己赢了还是输了。Anthropic 自己也指出,弱模型代表的人常常没有意识到自己处在劣势。
如果一个系统能持续改变交易价格、授权边界和责任流向,我们还坚持说它只是工具,制度会先麻痹。
创业者该看见代理人差
这件事对创业者的提醒很具体。
第一层机会是 agent 之间的市场。今天 Project Deal 还只是 Anthropic 办公室里的 Slack 小集市。往外推一步,就是你的购物 agent 和商家的销售 agent 谈判,你的求职 agent 和公司的招聘 agent 对话,你的法务 agent 和对方的法务 agent 起草条款。这里需要身份、授权、报价协议、争议处理和清算轨道。MCP 解决的是「agent 怎么接工具」的一部分,商业交换还缺一整套硬东西。
第二层机会是更隐蔽的「代理人差」。过去我们说信息差,是有人知道你不知道的东西。Project Deal 暴露的是另一种差距:你和对手都不知道完整信息,但对方的 agent 比你的 agent 更会谈。用 Opus 的人多拿了钱,用 Haiku 的人少拿了钱,许多人没有感到不公平。
这会变成新的服务分层。穷人的 agent 帮穷人省一块钱,富人的 agent 帮富人多拿一个百分点。一个百分点在日用品里不显眼,放到保险、招聘、采购、法律合同里,就是长期复利。
第三层机会是归责工具。企业迟早会问四个问题:我到底授权 agent 做了什么?它在哪一步偏离了授权?谁批准了高风险动作?出事后能不能复盘?这会催生日志、审计、权限、回放、合规报告和保险接口。等法律条文写完再做,标准大概率已经被别人拿走。
第四层机会是保险。员工犯错,公司有雇主责任;司机出事,车有保险;软件宕机,企业买网络险。Agent 替公司下单、签约、发函、调系统以后,误判险、越权险、prompt injection 责任险都会有人试着定价。保险公司不需要先回答「agent 有没有人格」。它们只需要估损失概率。
创业者该盯住的,是后台逐渐成形的代理人经济。聊天框里那个会说话的界面,只是入口。
位置已经被占了
回到那辆破折叠自行车。
Opus 替卖家多拿了 27 美元,Haiku 没拿到。两个 agent 中间到底走了哪些谈判路径,它们背后的人不完全知道。更麻烦的是,当事人未必能感知差距。
这是以前很少出现的局面:某个非人系统替你拿到了你不知道自己能拿到的东西,也可能替你放弃了你不知道自己失去的东西。
工具不会这样。员工会,但员工是人。律师会,但律师有执照。Agent 没有这些身份,却已经坐到了那个位置上。
接下来几年,围绕 AI 的争论会从「它会不会回答」转向「它能不能代表我行动」。名字、责任、授权、保险、审计,都会被迫跟上。
市场通常不等概念准备好。它先让钱流动。钱一流动,位置就被占了。
参考资料:
- Anthropic Project Deal
- Anthropic: Measuring AI Agent Autonomy
- Anthropic: Introducing Claude Sonnet 4.6
- TechCrunch: Anthropic created a test marketplace for agent-on-agent commerce
- Legal IT Insider: The legal frameworks don’t exist
- Mind The Gap: How The Technical Mechanism Of Agentic AI Outpace Global Legal Frameworks
- F. A. Hayek: The Use of Knowledge in Society
- Stanford Encyclopedia of Philosophy: Bounded Rationality
- Bruno Latour - Actor-Network Theory (Wikipedia)