文章作者、来源:新智元 4月8号,Anthropic 官宣 Claude Mythos Preview。 最会把「安全」两个字挂在嘴边的公司,往全世界的软件行业扔了一颗炸弹——然后它没有庆功,没有开香槟,反手先把炸弹自己压住了。 按正常的路数,这本该是一场「参数更大、分数更高、价格更贵」的例行发布会。 结果这文章作者、来源:新智元 4月8号,Anthropic 官宣 Claude Mythos Preview。 最会把「安全」两个字挂在嘴边的公司,往全世界的软件行业扔了一颗炸弹——然后它没有庆功,没有开香槟,反手先把炸弹自己压住了。 按正常的路数,这本该是一场「参数更大、分数更高、价格更贵」的例行发布会。 结果这

行动奇点降临,Mythos把AI从“会说”跨进“动手”时代

2026/04/21 14:58
阅读时长 12 分钟
如需对本内容提供反馈或相关疑问,请通过邮箱 [email protected] 联系我们。

文章作者、来源:新智元

4月8号,Anthropic 官宣 Claude Mythos Preview

最会把「安全」两个字挂在嘴边的公司,往全世界的软件行业扔了一颗炸弹——然后它没有庆功,没有开香槟,反手先把炸弹自己压住了。

按正常的路数,这本该是一场「参数更大、分数更高、价格更贵」的例行发布会。

结果这次画风完全不对:模型造出来了,却不打算全面开放。

Anthropic 明确说,Mythos Preview 不会一般性开放,而是先放进 Project Glasswing 这个受控计划里,让少数合作伙伴拿去做防御性安全研究。

首批之外,又扩展给40多家 维护关键软件基础设施的机构使用,同时承诺最高 1 亿美元 usage credits 和 400 万美元 对开源安全组织的直接捐赠。

换句话说,它发布的不是一个「新模型」,而是一份带着隔离栏、灭火器和应急预案的技术通告。

这件事最震撼的地方,不是 Mythos 比 Opus 4.6 高了几分,而是 Anthropic 自己已经不再把它当成一个「更会说话的模型」来介绍了。

Anthropic 在告诉大家:模型正在从「会解题」跨进「会动手」。

世界正在进入行动智能时代

Mythos Preview 的强大网络能力,来自它的 agentic coding and reasoning skills。

它在评测页上把能力分成三块:agentic coding、reasoning、agentic search and computer use

这三个词连起来就是:它不是更会聊天了,而是更会 观察、推理、操作、回看结果、再继续操作了。

而一旦把「动手」这两个字看懂,整件事就不再像一条普通 AI 新闻了。

真正可怕的奇点,其实从来不是「它会不会像人一样想」,而是「它能不能像人一样干活,而且比人更快、更稳、更便宜」。

只要模型还停留在输出文字、图片、建议,它再惊艳,也主要是在信息层震动世界。

可一旦它开始读代码、开终端、跑测试、找漏洞、写 exploit、操作浏览器、调用工具,它进入的就不是「表达智能」,而是行动智能。

Mythos 正在逼近的,就是这条线。

Anthropic 红队博客写到,Mythos Preview 在用户指示下,能够识别并利用每一个主流操作系统每一个主流浏览器中的零日漏洞。

他们提到的已修补案例里,包括一个 OpenBSD 27 年前埋下的漏洞

所以华尔街为什么先慌了?

因为金融市场比普通人更敏感地意识到:软件行业最底层的一根柱子,正在被抽走。

几十年来,漏洞挖掘和漏洞利用一直是稀缺手艺,靠少数顶尖安全研究员的经验、直觉和耐心堆出来。

这个稀缺性,养肥了无数安全公司,也支撑了 SaaS 世界的一整套估值逻辑:软件永远会有洞,所以补丁、防护、监控、托管、咨询永远有人付费;顶尖安全人才永远稀缺,所以高毛利服务永远卖得出去。

可如果模型开始把这件事自动化、规模化,而且速度还快得离谱,那么软件行业最舒服的日子,就悬了。

Anthropic 更新之后,美国软件股再度下挫,S&P 500 软件与服务指数年内已跌 25.5%

资本在重新问一个问题:如果「漏洞发现」和「代码修补」都越来越像计算资源堆出来的能力,传统软件护城河还值多少钱?

更夸张的是,这种恐慌已经从市场蔓延到了监管层。

路透社报道,美国财长 Scott Bessent 和美联储主席 Jerome Powell 已与大型银行 CEO 讨论 Anthropic 模型的网络安全风险;英国这边,英格兰银行、FCA、财政部和 NCSC 也在紧急评估 Mythos Preview 带来的潜在冲击,准备向银行、保险公司和交易所做风险简报。

一个模型还没完全公开,银行、央行、财政部、监管机构就已经围着它开会。

很多人把奇点想象成「某一天世界忽然翻页」,但现实里的奇点往往不是世界翻页,而是世界先开始挪椅子

奇点不是模型更像人,而是模型第一次大规模像「数字世界里的行动者」。

人类社会的大多数系统,本质上都不是靠「说服」运转,而是靠「操作」运转。

只要模型还停在建议层,它再聪明,也只是高级顾问;一旦它能自己沿着闭环走下去,它就开始拥有「岗位替代性」和「秩序改写力」。

Mythos 让人真正发冷的地方,正是它展示出了这种闭环雏形

而这也解释了另一个极其刺眼、却又极其关键的反差:为什么 Anthropic 一边能在 Mythos 上展示近乎恐怖的行动智能,另一边却又在产品端被开发者骂「降智」?

GitHub 上那条著名 issue 写得一点面子都没留:Claude Code is unusable for complex engineering tasks with the Feb updates.

提交者基于 6852 个 Claude Code 会话文件、17871 个 thinking blocks、234760 次工具调用做分析,认为自 2 月以来,复杂工程任务能力明显退化。

但这恰恰是「动手型智能」最残酷的现实:你要它真能干活,就得给它更深推理、更长链路、更高 token、更大算力。

它其实是在提前暴露一个更大的行业真相:动手型智能不是白送的,它是一种高昂的系统能力。

它需要的不是一个更漂亮的聊天框,而是更长的上下文、更强的工具调用、更稳的资源调度、更贵的推理预算、更严的安全隔离,以及更复杂的产品策略。

Mythos 被「关起来」,某种意义上不只是因为它危险,也因为整个行业还没准备好怎么把这种危险而强大的行动能力,低成本、可控、可规模化地交给普通用户。

Anthropic 自己在 Glasswing 页面上说得很清楚:他们最终的目标,是让用户安全地部署 Mythos-class models at scale,不仅用于网络安全,也用于其他高价值场景。

这句话的潜台词其实是:今天还不行。

也正因此,OpenAI 现在最难受的地方,可能不只是榜单上被压一头,而是企业开始越来越认真地为这种「能动手」的智能买单。

Ramp 的 2026 年 3 月数据说得很明白:在首次购买 AI 服务的企业里,Anthropic 在与 OpenAI 的 head-to-head 对局中,已经赢下 约 70%。

Axios 根据 Ramp 数据进一步写到,Anthropic 在这类新增企业采购中的支出份额已超过 73%

这并不代表 OpenAI 已经全面输了——OpenAI 今年营收预期仍高于 Anthropic。

但它说明了一件更关键的事:企业开始用真金白银押注的,不再只是「谁最会回答问题」,而是谁更像一个 可以嵌进工作流、真正开始干活的系统。

说到底,Anthropic 这次祭出 Mythos,最值得记住的事只有一件:我们正在第一次清晰地看见,AI 从「语言智能」向「动手型智能」跃迁的拐点。

以前的模型,最强的时候像顾问、像老师、像段子手、像秘书。

它们能说服你、启发你、安慰你、替你写东西,但它们很少真正走进系统内部,替你完成一段完整的数字行动。

Mythos 的意义是它让全行业都突然意识到:这条路是真的,而且比很多人想得更近。

等模型真正大规模学会「看环境—做计划—调工具—动系统—验结果—继续迭代」,软件、金融、网络安全、企业服务,甚至监管逻辑,都会跟着重写。

奇点不是它突然说「我思故我在」。奇点是它突然开始动手,而且越动越像样。

从那一刻起,世界就不会再把它只当成一个会聊天的机器。

免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 [email protected] 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。

USD1 Genesis:0 费率 + 12% APR

USD1 Genesis:0 费率 + 12% APRUSD1 Genesis:0 费率 + 12% APR

新用户:质押最高享 600% APR。限时福利!