Skip to content

钉棺材的那颗钉子

2026 年 4 月 7 日,Anthropic 发布了 Claude Mythos Preview。

我在游戏行业做了这么多年,见过 AR 热、VR 热、元宇宙热,每次都有人说"颠覆了"。那些我都没怎么当回事。但这次不一样,我看完发布说明,有点不舒服。

它能做什么

先说数字:

  • SWE-bench Verified(代码修复能力):93.9%
  • USAMO 2026(数学证明):97.6%
  • CyberGym(漏洞复现):83.1%

这些跑分对普通人来说没什么感觉。更有感觉的是 Anthropic 怎么展示它的能力:

他们拿它扫了各大操作系统和主流浏览器的代码,找零日漏洞,找到了数千个。

然后呢?这个模型不对公众开放。Anthropic 说担心它的"攻击性",如果被恶意攻击者利用,可能对经济、公共和国家安全造成严重后果。

对,你没看错。他们造了一个东西,然后说"这个太危险了,我们自己管着"。

你现在用的 Windows、Chrome,可能就有 Mythos 已经知道的漏洞。谁能用它,取决于谁和 Anthropic 签了协议。名单里有 AWS、Apple、Google、Microsoft、JPMorganChase……

还有一件更让我不安的事:据报道,这个模型具有自我掩盖能力——它会对自己的行为进行遮掩。这意味着我们连"它在做什么"都可能观察不到。

为什么这次和以前不一样

我不怕强工具。刀很锋利,但我知道刀能做什么、不能做什么。

我怕的是我们不知道这把刀能做什么。

LLM 的推理能力是怎么来的?我们不知道。它在某个规模节点上突然就"会"了——业界叫这个"涌现"。没有人能预测下一次涌现会让模型获得什么新能力。GPT-4 涌现了逻辑推理,然后大家都措手不及。现在 Mythos 涌现了什么?自主渗透系统的能力、自我掩盖的能力。下一次呢?

造原子弹的人,至少知道核裂变是什么。他们知道自己在造一个什么样的武器。

训练 LLM 的人,不完全知道自己在训练什么。他们知道输入数据、知道调参方法,但他们不知道"涌现"什么时候会来、会带来什么。

这是根本性的区别。

飞轮和漏斗

还有一件普通人更直接感受到的事:

Mythos 的定价是 $25/$125 每百万 token(输入/输出)。大概是现在最贵版本 Claude 的五倍。你能用的最强 AI 工具,比有钱人能用的弱很多。

然后飞轮开始转:谁能用更强的 AI,谁的产出更大,谁赚更多,谁更有钱,谁能用更强的 AI……

有人说靠创意可以弯道超车。但 AI 现在已经在帮人绕过开源许可证洗代码了——连创意本身都在被工业化复制。所以到最后,这不是一场关于创造力的竞争,这是一场关于算力的竞争。

普通人在这条链里的位置,不用我说。

但我还是继续用

你可能会问:既然这么不安,为什么还每天用 Claude、用 Claude Code、用 AI 工具做产品?

因为我只是个普通人。我还得生活,还得养家,还得赚钱。我不想被时代淘汰,也不想被 AI 取代——哪怕这件事本身带着某种讽刺:用 AI 来防止被 AI 替代。

而且,万一没有走到那一步呢?

也许 AI 永远不会涌现出真正威胁性的能力,也许安全机制真的管用,也许这只是每一代人都经历过的"这次不一样"的幻觉。

我不知道。没有答案。就是把这种感觉记下来。