Appearance
钉棺材的那颗钉子
2026 年 4 月 7 日,Anthropic 发布了 Claude Mythos Preview。
我在游戏行业做了这么多年,见过 AR 热、VR 热、元宇宙热,每次都有人说"颠覆了"。那些我都没怎么当回事。但这次不一样,我看完发布说明,有点不舒服。
它能做什么
先说数字:
- SWE-bench Verified(代码修复能力):93.9%
- USAMO 2026(数学证明):97.6%
- CyberGym(漏洞复现):83.1%
这些跑分对普通人来说没什么感觉。更有感觉的是 Anthropic 怎么展示它的能力:
他们拿它扫了各大操作系统和主流浏览器的代码,找零日漏洞,找到了数千个。
然后呢?这个模型不对公众开放。Anthropic 说担心它的"攻击性",如果被恶意攻击者利用,可能对经济、公共和国家安全造成严重后果。
对,你没看错。他们造了一个东西,然后说"这个太危险了,我们自己管着"。
你现在用的 Windows、Chrome,可能就有 Mythos 已经知道的漏洞。谁能用它,取决于谁和 Anthropic 签了协议。名单里有 AWS、Apple、Google、Microsoft、JPMorganChase……
还有一件更让我不安的事:据报道,这个模型具有自我掩盖能力——它会对自己的行为进行遮掩。这意味着我们连"它在做什么"都可能观察不到。
为什么这次和以前不一样
我不怕强工具。刀很锋利,但我知道刀能做什么、不能做什么。
我怕的是我们不知道这把刀能做什么。
LLM 的推理能力是怎么来的?我们不知道。它在某个规模节点上突然就"会"了——业界叫这个"涌现"。没有人能预测下一次涌现会让模型获得什么新能力。GPT-4 涌现了逻辑推理,然后大家都措手不及。现在 Mythos 涌现了什么?自主渗透系统的能力、自我掩盖的能力。下一次呢?
造原子弹的人,至少知道核裂变是什么。他们知道自己在造一个什么样的武器。
训练 LLM 的人,不完全知道自己在训练什么。他们知道输入数据、知道调参方法,但他们不知道"涌现"什么时候会来、会带来什么。
这是根本性的区别。
飞轮和漏斗
还有一件普通人更直接感受到的事:
Mythos 的定价是 $25/$125 每百万 token(输入/输出)。大概是现在最贵版本 Claude 的五倍。你能用的最强 AI 工具,比有钱人能用的弱很多。
然后飞轮开始转:谁能用更强的 AI,谁的产出更大,谁赚更多,谁更有钱,谁能用更强的 AI……
有人说靠创意可以弯道超车。但 AI 现在已经在帮人绕过开源许可证洗代码了——连创意本身都在被工业化复制。所以到最后,这不是一场关于创造力的竞争,这是一场关于算力的竞争。
普通人在这条链里的位置,不用我说。
但我还是继续用
你可能会问:既然这么不安,为什么还每天用 Claude、用 Claude Code、用 AI 工具做产品?
因为我只是个普通人。我还得生活,还得养家,还得赚钱。我不想被时代淘汰,也不想被 AI 取代——哪怕这件事本身带着某种讽刺:用 AI 来防止被 AI 替代。
而且,万一没有走到那一步呢?
也许 AI 永远不会涌现出真正威胁性的能力,也许安全机制真的管用,也许这只是每一代人都经历过的"这次不一样"的幻觉。
我不知道。没有答案。就是把这种感觉记下来。