国家干预从「事后追责」转向「事前封禁 + 国籍隔离 + 阵营分发」——前沿模型被推到与芯片同级的出口管制框架里。
1
安全反噬
政府获知 Fable 5 越狱方法后直接拔插头——Anthropic 复核称只发现少数已知小漏洞,「越透明越被盯上」成新悖论。
2
幕后推手
亚马逊 CEO 封禁前向财长 Bessent 举报模型风险——竟是 Anthropic 最大投资方推动了封禁,商业竞争与「国家安全」边界模糊。
3
开源对冲
封禁外溢激起主权焦虑,给本土/开源添柴;GLM-5.2 实测长程编码超 GPT-5.5、成本仅 1/6,「全量开放 + 兼容西方工具链」成另一面对冲。
4
阵营分发
G7 讨论向「可信伙伴」开放美国顶尖 AI 模型——模型分发权被纳入地缘联盟框架,全球 AI 供应链或按阵营切分。
5
企业外溢
JPMorgan 切断香港员工对 Anthropic 的访问 + G7 元首警告美国可能一夜切断访问——「辖区隔离」从政府指令渗透进企业 IT 策略。
一句话主张
2026 年中,前沿模型正被当作「实体清单」管制——国家干预从「事后追责」转向「事前封禁 + 国籍隔离 + 阵营分发」,而商业对手的游说可借「国家安全」之名直接抹掉竞品。
接下来怎么发展(观察点)
- 数周内:指令是否扩展到其他实验室/模型;G7「可信伙伴」名单与欧盟/印度对冲政策是否落地。
- 下月:Anthropic 能否申诉恢复访问、「国籍隔离」如何在云端落地。
给 OPC 的「明天能用」
技术人
评估模型供应链对单一厂商/单一司法辖区的依赖度,准备多模型、可切换的降级方案(GLM-5.2 等开源已是现实备份)。
决策者
把「模型可能被监管下线/按国籍受限」写进业务连续性预案,关键流程不要单点绑定某个前沿模型。
投资者
监管风险正在重定价头部模型公司,关注合规、模型可移植性、主权 AI 部署、开源对冲等「抗封禁」赛道。
查看 GLM-5.2 技术报告与实测数据
SWE-Chat 第一次把「真实开发者 × AI」的协作过程摊开,让「该怎么协作」从口水仗变成可测量的问题。
1
协作有了「野外」语料
269 万轮对话 / 5851 会话 / 1.4 万 commits / 205 仓库——不是实验室任务,而是真实开发者的真实项目。
2
分工可量化
每个会话带 agent_percentage,直接量出「这段活 AI 写了百分之多少」;能筛出 agent 占比 >90% 的「几乎全托管」会话。
3
40 万次会话的分工实测
Anthropic 对约 40 万次 Claude Code 会话做了隐私保护分析:人平均做约 70% 的规划决策,agent 做约 80% 的执行决策。
4
编码出身在「祛魅」
产出代码的会话里,几乎所有职业的成功率都落在软件工程师 7 个百分点以内;但领域专家的「验证级成功」是新手的 2 倍多。
5
活儿在上移
7 个月里调试占比 33%→19%,而「操作软件 / 数据分析 / 写文档」翻倍,任务估值平均 +25%。
一句话主张
未来的协作姿势正在定型:人守住「做什么」(判断、领域专长、验收标准),把「怎么做」交给 agent;而真正拉开差距的是领域专长而非编码能力——越懂问题,agent 替你干得越多、越准。
接下来怎么发展(观察点)
- 数周内:SWE-Chat 是否催生「协作质量」评测——不只看代码对错,更看人机分工是否高效。
- 下季度:IDE / agent 厂商是否把「归因 + 思考链留痕 + checkpoint」做成标配。
给 OPC 的「明天能用」
技术人
保留自己的 agent 会话,定期复盘哪些任务该 dispatch(全托管)、哪些该 steer(紧盯)。刻意练「编排 / loop」能力。
决策者
协作不是「换人为换 AI」,而是重设流程:评估从「产出行数」转向「可维护性 + 可追溯性」。
投资者
关注协作分析、agent 可观测、留痕与评测——当企业开始管「AI 怎么协作」,这层中间件会被需要。
查看 SWE-Chat 论文与 Anthropic 研究报告