《AI 走向"准监管时代"：模型安全评估将成为上市与部署前的标准动作》

美国计划在先进模型发布前进行国家安全评估，AI 监管正从自愿测试走向制度化

🧠 agentic reading｜1️⃣ 精准输入

导语

The Batch 本期聚焦三大主题：美国政府从放任转向预发布安全审查、中国阻断 Meta 收购 Manus 的跨境 AI 交易、以及 Google 乳腺癌 AI 在真实临床环境中的大规模验证。三条线索共同指向一个判断：AI 正从"自由竞争"进入"准监管时代"——无论是国家安全、地缘博弈还是医疗落地，制度化审查与信任建设正在成为 AI 下一阶段的核心议题。

1. 美国预发布安全审查：从放任到管控的急转弯

NIST 宣布成立跨部门任务组 TRAINS（Testing Risks of AI for National Security），在先进模型公开发布前评估国家安全风险。Google、微软、xAI 同意提交去除护栏的原始模型供政府测试，Anthropic 和 OpenAI 在 2024 年已达成类似协议。测试聚焦网络安全、生物安全和化学武器三个领域。

这是特朗普政府的重大政策转向——此前的 AI 行动计划强调"消除拜登时代的监管壁垒"以维护美国 AI 主导地位。转折点是 Anthropic 宣布 Claude Mythos Preview 能够自主利用主流操作系统和应用的漏洞，白宫随即限制该模型的分发范围，并考虑通过行政命令将预发布测试从自愿变为强制。

Beta Free

注册芝士内参，免费阅读全部文章

内测期全部免费开放，正式版 ¥9.9/月 · ¥99/年。

我的笔记

✍️ 写下你的想法，自由记录即可。如果没有灵感，试着回答上方的费曼输出问题。

登录后可记笔记

登录后可保存笔记、高亮、划线和批注。