kaiyun云开体育突发！Anthropic命令全员罢手AI商榷

来源：未知作者：admin 时间：2026-06-05 01:12 浏览：89

要紧发现：AI 的自进化，驱动了。

这是 Anthropic 刚刚在长文博客中，发表的暴论。

咱们的里面数据炫耀，Claude 正在加快 AI 发展，这可能是一条递归自我普及（RSI）的旅途。

并非「耸东说念主听闻」，看了下著述，Anthropic 是果然实打实地用数据在语言——

截止本年 5 月，80% 以上的 Anthropic 代码，都是 Claude 写的。

而在 Claude Code 发布之前，这个数字还仅是个位数。

与此同期，Anthropic 工程师平均每季度请托的代码量，是 2021-2025 年的 8 倍。

更要紧的是质料——

在最敞开、最费解、连谜底长什么样都不笃定的编程任务上，Claude 的顺利率当今是 76%，六个月前才 26%。

50 个百分点的跳升。半年。

Anthropic 里面照旧有不少工程师以为，Claude 写的代码质料和东说念主类打平了。

展望年内会超过。

Anthropic 还强调，要是这个趋势接续下去，AI 我方规划和构建下一代 AI，是全都可能的。

这可能绝对改变社会，在医疗、科技、经济限度带来宏大的公道。但也可能让对皆问题考虑恶化，最终导致失控。

亚搏体育中国官方网站入口

因此，Anthropic 带头命令：

要是存在一个可考据的机制，能保证 AI 施行室如实都没暗暗卷，咱们悠然延缓、致使暂停。

除此除外，Anthropic 的这篇博客里，还放出了蛮多有酷好酷好的不雅点和事实。

以下是经过整理，更便捷巨匠阅读的版块。

Enjoy。

Anthropic 长文定调 AI 圈的摩尔定律来了

Anthropic 创建了个全新的意想维度，叫「AI 能寥寂完成的任务时长」。

2024 年 3 月，Claude Opus 3 能措置东说念主类约略需要 4 分钟的软件任务。

一年后，Claude Sonnet 3.7，1.5 小时。

又一年，Claude Opus 4.6，12 小时。

而最新的 Mythos，在内测中的弘扬是：

能皆集职责「至少」16 小时，照旧到了 METR 测试框架能意想的上限了。

这个翻倍速率，从蓝本的每 7 个月翻一倍，加快到了每 4 个月翻一倍。

要是趋势不变，2027 年，可能是好几周。

Claude 编写了大部分 Anthropic 代码

闭幕 2026 年 5 月，我 Anthropic 代码库的代码，超过 80% 由 Claude 编写。

在 Claude Code 发布前，龙虎棋牌2026世界杯官方最新版这个数字一直只须个位数。

这种变化，也体当今工程师的职责面孔上。

在 Anthropic 的滥觞四年，工程师每天 Merge 的代码行数基本保持不变。

2025 年， Claude 驱动我方写代码，merge 数一霎驱动飙升。

如今，2026 年第二季度，工程师每天 merge 的代码量是 2024 年的 8 倍。

不外，代码量上去了，代码质料是不是注水了？

Anthropic 说，这一年来，工程师更动 Claude 的次数，越来越少了。

这少量，在 benchmark 中可见一斑，如下图所示。

通盘难度类型的任务中，Claude 的顺利率，无一例外的一说念暴增。

是以，Anthropic 当今干脆用 Claude 来 review 代码。

是的，通盘提交到代码库的变嫌，都会先过一遍 Claude 自动审查，查验 bug、安全破绽和其他劣势。

他们回溯分析发现，kaiyun云开体育要是之前每次变嫌都有这说念自动审查，梗概三分之一导致 claude.ai 线上事故的 bug，上线之前就会被拦下来。

要知说念，写那些代码的工程师，照旧是全宇宙造 AI 系统最顶尖的一批东说念主了。

Claude 在持他们的罪过。

创造力的放大镜

接下来是 Claude 在商榷层面的参与进度。

Anthropic 有个旧例，每次发新模子，都会给 Claude 一段锻真金不怕火微型 AI 模子的代码，让它在保证正确性的前提下，把运行速率优化到最快。

2025 年 5 月，Claude Opus 4 交出的谜底是：加快 3 倍。

2026 年 4 月，Claude Mythos Preview 作念到了 52 倍。

算作参考，一个熟习的东说念主类商榷员，需要 4 到 8 个小时技巧免强达到 4 倍。

不到一年的时间，Claude 超过了东说念主类。

2026 年 4 月，Anthropic 丢给 Claude 一个 AI 安全商榷，草率是「一个弱模子能不行可靠地监督一个强模子」，然后让 Claude 我方提假定、跑施行……

此次先说东说念主类的弘扬吧，两个东说念主类商榷员花了梗概一周时间，把 gap 减弱了 23%。

而 Claude，在梗概 800 小时、花了梗概 18000 好意思元的算力之后——

减弱了 97%。

咱们何去何从？

到这里为止，论断照旧很明晰了。

东说念主类在 AI 开发历程里的脚色，每一个行为都在收窄。

代码，Claude 写了。代码 review，Claude 作念了。施行实施，Claude 快了东说念主类一个数目级。施行规划，Claude 驱动我方来了……

东说念主类当今终末的相比上风，是商榷品尝和判断力。

但这个上风能守多久？

Anthropic 在博客里说，他们也不笃定。

一种可能是，「商榷品尝」就像之前 AI 不会的其他东西一样，先是作念不到，然后一霎就作念到了。

就像 AI 表露幽默、展示心智表面、解语言谜题，都资格了雷同的弧线。

另一种可能是，即便 Claude 永恒学不会实在的商榷品尝，仅靠当今的加快趋势，每个东说念主类商榷员能同期迷惑的职责量照旧大了好几倍。

你不需要 AI 全都替代你想考，它只须把通盘「实施」的活全干了，你就只需要作念那 5% 的认识聘请。

RSI 的三种改日

博客结果，Anthropic 形色了对于此次「自进化」趋势三个可能演化认识。

1、停滞。

那些指数弧线其实是 S 弧线。

也许商榷判断力这个东西等于没法靠 scale 解决，需要一种全新的架构打破。

或者，瓶颈在动力、在芯片、在算力的物理供应链上。

不外，即便 AI 的才略就停滞在今天的水平，也会发生对宇宙带来紧要变化。

前段时间的 Project Glasswing，Mythos Preview 在上线头几周就发现了超过一万个高危和严重级别的软件破绽，遍布全球最要道的系统。

2、AI 接续加快，但东说念主类仍然把着认识盘。

组织恶果会指数级普及，100 东说念主的公司作念 1 万致使 10 万东说念主的活。知

Anthropic 以为咱们约略率正在走进这个场景。

但他们也发现了一个有酷好酷好的风物，等于阿姆达尔定律在组织里的体现 _

Claude 把代码写得速即了，结果代码 review 造成了新瓶颈。多样新想法、新器具、新施行爆炸式裸露，远超组织的消化才略。

瓶颈不会消逝，仅仅转念到下一个行为。

3、AI 达周全都的递归自我普及，驱动我方造下一代我方。

这个场景下，AI 的发展速率全都取决于算力了。东说念主类退到监督、考据、审核的位置。

要是果然发生，这种才略约略率会迁徙到其他科学限度，医学、材料、动力，全线升起。

虽然，另一种改日，是对皆失败。

这种情况下kaiyun云开体育，偏差会在 AI 自我迭代的过程中冉冉积蓄，最终—

kaiyun云开体育 突发！Anthropic命令全员罢手AI商榷

kaiyun云开体育突发！Anthropic命令全员罢手AI商榷