Reading view

There are new articles available, click to refresh the page.

让 Anthropic 破防的「蒸馏」风波，美国 AI 大牛泼冷水：中国 AI 成功不靠走捷径

爱范儿

杜晨

25 February 2026 at 20:27

Anthropic 昨天点名 DeepSeek、月之暗面、MiniMax 三家中国 AI 实验室「蒸馏」Claude 模型，全网炸锅。

对于此事件，RLHF （基于人类反馈的强化学习）领域最知名的研究者之一，《RLHF》一书的作者 Nathan Lambert 指出，这件事没有人们想象的那么严重，但也没有那么简单。

他认为，中国 AI 公司的基础设施非常好，取得了很多创新，也在攻克各种技术难题，但它们取得这样的结果，靠的并不是「走捷径」。

在讨论蒸馏这件事之前，先看看 Lambert 的话为什么值得听。

Nathan Lambert 是 Allen AI 研究所的科学家，博士毕业于加州大学伯克利分校，师从机器人领域的著名学者 Pieter Abbeel。他并非 RLHF 技术的发明者，但他写的《RLHF》这本开源书籍，如今是 AI 从业者理解大模型训练流程的标准参考材料之一。

和到处都是的 AI 网红不一样，他是真正上手训练过大模型的人。

在 Anthropic 博客发出的当天，Lambert 就发布了一篇详细分析文章《蒸馏对于中国大模型到底有多重要？》。他的核心论点，和主流媒体的解读方向截然不同，也比一般网友更加深入和全面。

蒸馏是什么，Anthropic 又说了什么？

首先我们来看 Anthropic 指控的核心：「蒸馏」（distillation）。

它指的是让弱模型学习强模型的输出，从而快速获得相似能力。

Anthropic 指控三家公司通过约 2.4 万个虚假账号，在违反服务条款和地区访问限制的情况下，用 Claude 生成了超过 1600 万次对话，用于训练各自的模型。

博客还附上了安全警告：非法蒸馏出来的模型可能缺失原模型的安全护栏，一旦被用于网络攻击、生物武器研发或大规模监控，后果难以预测。

Anthropic 把这套基础设施叫做「九头蛇集群」(hydra cluster)——多达数万个账号的分布式网络，流量同时分散在 Anthropic 自己的 API 和多个第三方 API 聚合平台上。

在最极端的案例里，一个代理网络同时管理超过 2 万个虚假账号，还把蒸馏流量混入普通用户请求流里，用来规避检测算法。这种网络没有单点故障，封掉一个账号，马上换一个。

海外媒体随即跟进，复述了 Anthropic 的话术。然而这套叙事逻辑很快就翻车了：毕竟「蒸馏」这件事美国 AI 公司训练的时候也会做，更何况 Anthropic 自己也有类似行为：

以及：Anthropic「蒸馏」了人类最大的知识库

但 Lambert 更加冷静，他认为要先把这三家中国 AI 实验室分开来看

Lambert 指出，Anthropic 把三家公司并排列在同一篇博客里，掩盖了一个关键差异：它们做的根本不是同一件事，量级天差地别，动机也各有侧重。

按照 Anthropic 的指控，DeepSeek 的蒸馏数量最少，只有 15 万次，但手法更精准。与其直接收集答案，Anthropic 指控 DeepSeek 在做的是批量生产思维链 (chain-of-thought)训练数据。

要的不是「你得出了什么结论」，而是得到结论的过程。

但 15 万次是个什么体量？Lambert 认为，这点数据对 DeepSeek 传闻中的 V4 模型或任何模型整体训练的影响可以忽略不计，「更像是某个小团队在内部做实验，大概率连训练负责人都不知道。」

月暗的规模就不是「可以忽略」了：340 万次交互，目标集中在智能体推理、、工具调用、代码与数据分析、computer-use 开发、计算机视觉等方向——这些方向当中，大部分都是 Claude 近期最受企业客户欢迎的能力组合。

Anthropic 指出三家里流量最大的是 MiniMax，约 1300 万次，目标是代理编码、工具调用和复杂任务编排。

月暗和 MiniMax 相加约 1650 万次，按对话平均 token 量估算，总量大约在 1500 亿到 4000 亿 token 之间，折合数百到上千万美元的 token 成本。

但问题是，只盯着蒸馏看，其实有很大问题。

蒸馏的天花板在哪里？

这才是 Lambert 真正想说的部分，也是整件事里最被忽视的地方。

把强模型的输出喂给弱模型，弱模型能快速获得类似能力——这个逻辑本身成立，Lambert 没有否认。但他指出了一个没人说清楚的问题：蒸馏的天花板到底在哪里，取决于你想要的是什么类型的能力。

作为 RLHF 方面的专家，Lambert 认为，当前最顶尖的模型训练，已经高度依赖强化学习（RL）。而 RL 和蒸馏在本质上是两种不同的事情：

蒸馏是模仿，学强模型的输出，把它的「答案形状」复制过来；RL 是探索，模型必须大量自己推理、自己生成、在错误里反复迭代，从试错中提炼能力。

换言之，真正强大的模型，需要的从来不只是正确答案，而往往要靠模型自己摸索出来的解题路径，这是依靠蒸馏别人 API 的输出，得不到的东西。

以 DeepSeek 自己做的蒸馏尝试为例：基于隔壁千问蒸馏自家的 R1 模型后得到的 DeepSeek-R1-Distill-Qwen 1.5B 这个小模型，仅靠 7000 条样本和极低的计算成本，就在 AIME24 数学竞赛基准上超越了 OpenAI 的 o1-preview。

但关键在于：这个提升等多仰仗强化学习的结果，而非来自蒸馏这个行为本身。

换句话说，蒸馏能帮你更快「热身」，要真正到达顶级水平，还是得靠自己跑 RL。

不同模型之间的数据分布差异

Lambert 还指出了一个技术层面很少被外界提及的问题：不同模型之间存在微妙的数据分布差异。

把 Claude 的输出直接喂给另一个架构的模型，不一定有效，有时甚至会产生干扰。两个模型内部表征空间的差异，会让「老师」的回答在「学生」那里引发意想不到的偏差。

这意味着蒸馏从来不是「拿来用就行」的事，而是需要大量工程工作才能真正发挥效果。这本身就是一个研究课题。

这也是为什么 Lambert 将 Anthropic 所指控的「蒸馏」行为，看作是一种创新的做法，可以理解为试图攻克这一研究课题的努力。

Anthropic 的杀手锏，恰恰最难蒸馏

Anthropic 点名的三家公司，抓取的重心都落在代理行为 (agentic behavior) 这同一个方向上，包括 AI 自主规划、工具调用、分解复杂任务并逐步执行的能力等。

这是 Claude 目前最突出的方向，也是 Anthropic 最不想被复制的能力。

但 Lambert 的判断是，这些能力恰恰也是最难通过蒸馏获得的。

正如前面提到，一个强大的 AI agent，强大之处从来不在于知道或者训练过正确答案，而是「在面对没见过的情况时能自主探索出解决路径」，可以理解为一种 0-shot 或 few-shot 实现 SOTA 效果的能力。

这个过程中产生的价值，体现在推理轨迹，而推理轨迹是很难通过蒸馏习得的——至少现在是这样。

DeepSeek-R1-Distill（蒸馏模型）和 DeepSeek-R1（蒸馏对象）之间的差距，是 Lambert 论点最直接的例证。

在格式化的数学推理任务上，前者表现不错；但在需要自主探索、动态规划的复杂代理任务上，两者的差距是真实存在的。

为什么 Anthropic 现在公开说?

Lambert 有一个判断，很多人可能都有同感：这次 Anthropic 公开点名中国 AI 公司，「技术防御」压根不是首要动机。

在 Anthropic 这篇博客发出的几天前，美国国防部刚刚威胁 Anthropic 配合提供「不受限制的使用权限」，否则就将做出对后者不利的安排，比如将其标记为「供应链危险」，也即无法进入国防/政府供应商名单。

Anthropic 现在处于一个「既要又要」的两难境地：既想维持安全、不反人性的模型定位和公司形象，又不愿意错过美国政府的大单。

Lambert 指出了一个根本矛盾：美国的学术界和开源模型开发者也在做蒸馏行为，但包括 Anthropic 在内的大厂并没有对它们做出实质性的打击。如果仅因为对方是中国公司，未免地缘的意味太重了。

结果就是，Anthropic 这篇博客与其说是报告一个重大技术风险事件……其实更像是一封「投名状」。

双标

关于 Anthropic 在这件事上的立场，有一个绕不开的背景。

APPSO 在昨天的文章里也有提到：Anthropic「蒸馏」了人类最大的知识库

2024 年年初，美国某仓库里，工人们把一本本新书送进机器，切掉书脊，扫描，然后把纸送去回收。下令做这件事的是 Anthropic，项目内部代号「巴拿马」，目标是以破坏性方式扫描全球所有书籍——Anthropic不希望外界知道他们做了这件事。

2021 年，Anthropic 联合创始人 Ben Mann 在 11 天里从盗版网站 LibGen 下载了大量侵权书籍；次年，另一个公开宣称「在大多数国家故意违反版权法」的网站 Pirate Library Mirror 上线，Mann 把链接发给同事，留言：「来得正是时候！！！」

在后来的书籍版权诉讼中，Anthropic 被迫支付 15 亿美元和解金，折算下来每本书约赔 3000 美元。

斯坦福和耶鲁的研究者发现，Claude 3.7 Sonnet 在特定条件下会以 95.8% 的准确率「近乎逐字逐句」地输出《哈利波特》等受版权保护的作品——这不仅与 Anthropic 长期以来关于「模型只是学习了语言规律」的说法背道而驰，更让该公司对任何人的「蒸馏」指控显得缺乏底气。

Futurism 的标题写得很直接：「Anthropic 对 DeepSeek 未经授权复制 AI 大发雷霆——考虑到它是怎么构建 Claude 的，这相当讽刺。」

Musk 在 X 上也补了一刀：「Anthropic 大规模窃取训练数据，还为此支付了数十亿美元的和解金。这是事实。」

反驳者还有一个更尖锐的逻辑：Anthropic 当年从那些书里拿走的，不仅没付过任何使用费，回头还用于商业行为（Claude 和 Anthropic API 都是付费服务）；而从商业角度来看，蒸馏 Claude 的公司至少付了钱……

当然，从法律层面来看，这两件事的性质完全不同。但不论怎样，Anthropic 看起来还是很像个伪善的双标者。

「后蒸馏时代」

最后再强调一遍：蒸馏有用，但没有你们想象的那么有用。

DeepSeek 的 15 万次，按任何合理标准来看都是可以忽略的数字。Moonshot 和 MiniMax 合计 1650 万次，量级是另一回事——但能转化成多少真实能力，取决于他们能不能解决「如何用好这些数据」的技术问题。

考虑到数据分布差异、模型架构差异，以及代理能力的获得本身对于强化学习的重度依赖，蒸馏从来不是「拿来就用」那么简单。

Lambert 还是给了 Anthropic 面子：「快速迭代加上高质量数据可以走很远，让学生模型超越老师也并非不可能。」

但他也明确指出，真正的创新靠的是强化学习，不是蒸馏。从 DeepSeek、月暗、MiniMax 公开的论文来看，它们都用有相当完善的基础设施和优秀的人才，远非只靠小聪明小伎俩企图弯道超车的「小作坊」。

蒸馏能帮你更快入场，但真要打到顶级水平，从来没有捷径。

某种意义上，Anthropic 提出的「蒸馏」争议，本身就是这个 AI 时代缩影。

整个行业打一开始就建立在暧昧不清的规则上：用人类写的东西训练，用别人的开源成果迭代，在法律没有明确禁止的地方快速行动。

现在，规则开始慢慢收紧——先是版权，再是芯片，现在又是 API……谁在制定规则？谁受益于规则？谁一边打着人类的旗号，却滥用规则谋求私利？

这些问题的答案，都越来越清晰。

#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博

向懒人学习

KAIX.IN

dimlau

20 November 2025 at 12:15

女儿问我怎么搭建编程环境。我们远程交流了一会，她应该打开编辑器还不到 10 分钟，问出一个我从来不知道会有的需求问题：在输入完print("Hello World"引号里的内容之后怎么把光标移动到引号外边去输入后括号？

不是按一下向右的方向按键吗？

但是如果光标在l处呢？

好吧。我搜索了一下，不知道是不是（往好处说）因为我不够懒，我从来不知道command+→键是光标移动到行末尾，option+→键是移动到单词末尾。

fin.

激赏！来信。

向懒人学习

KAIX.IN

dimlau

20 November 2025 at 12:15

不是按一下向右的方向按键吗？

但是如果光标在l处呢？

好吧。我搜索了一下，不知道是不是（往好处说）因为我不够懒，我从来不知道command+→键是光标移动到行末尾，option+→键是移动到单词末尾。

fin.

激赏！来信。

甄仁岛的来信

KAIX.IN

dimlau

13 November 2025 at 23:15

这事儿，得从上次写那个「互动小说生成器」说起。哦，抱歉，估计大家每天都会被迫看几条AI相关的文章，这篇多少又和它有关。上次那个互动小说生成器就是 AI 驱动的嘛。说实话，虽然我当时只是把它嫁接在 mastodon 上面，作为一个社交平台机器人，接收网友的互动指令来生成故事内容，但是我对比了一些市面上专为写小说而设计的工具，其实设计思路上，我自己感觉，那个简单的机器人已经是第一流的水平了：它有世界状态快照，记录故事中出现过哪些人物、物品、线索，「第一幕中有把枪挂在墙上，那么在第二幕或者第三幕中这把枪必须发射」；它有因果链，记录每一个事件的前因后果，避免情节出现矛盾；它还有节奏器，负责控制不同章节的节奏快慢，以及实现我个人趣味方面的章节间字数多少的某种韵律感……好了，不说了，虽然我自认为设计的很不错，不过我也必须承认，AI 搞创作，还是不行。对文字有足够的敏感度，就总会觉察到，处处别扭。所以再是耗费心力写出来的代码，也毫不吝惜地删了。

不过能不心疼吗？我都没存到 github 上就那么给删了。所以，后来又想着，也不真用它写小说，就玩儿呗，再写一个更周详的工具吧。于是就有了现在这个还在弄的游戏。刚才也提到了世界快照，生产故事已经用到了「世界」这个概念，那么继续把这个世界充实起来，就也顺理成章。其实我读小说时经常会想，曾经和主角擦肩而过的那些无名的角色，他们的日常是怎样的呢？难道他们的生活就没有被书写价值吗？所以一开始，这个游戏是想呈现出一部全景小说。玩家随便选择一个角色，就能观看聚焦在这个角色周围的故事。因为一开始的想法是游戏里的每个 NPC 都由 AI 驱动，所以很自然想到了《西部世界》，所以我给项目文件夹命名「东部世界」，但是想也知道那不太现实，先不说 AI 太贵，就算不差钱，如果 NPC 每个行为都要几十秒运算，那也卡得不像样了。还是得老老实实像传统游戏一样写代码，给 NPC 设定日常流程，饿了该吃饭、渴了要喝水，这些不能是 AI，而是 if else。不过还是得感谢 AI，慢慢程序有了个雏形，我弄得很慢，因为 AI 写出来的东西我要求自己不看明白咱就不继续往下走，边看边学吧。这也是我没打算把这个东西开源的原因，小玩意不值得拿出来现眼是一方面，主要是高手云集，诸位写得快，我学得慢，还不一下子就成了我看都看不懂的东西了？那可不行，别剥夺我的快乐。总之吧，游戏渐渐也跑起来了，让我想到《楚门的世界》，因为我就像是在对着镜头窥视这些一无所知的 NPC 生活。所以我又给游戏取名字叫《甄仁岛的故事》。楚门对甄仁，还不错。

我跟朋友聊起这个游戏，他说，啊？就是看文字？哈哈，好像「看文字」现在成了很奇怪的事，这倒又给了我一些想法。我觉得游戏叫《甄仁岛的来信》吧，不光是纯文字的游戏，索性，连原计划实时查看世界正在发生的故事的「信息看板」都砍掉，游戏世界就是个黑盒子，我们不知道里面在发生什么。倒也符合游戏世界的设定：那是一个被奇特场域包围，导致人类无法进入或离开的一个小岛，有大约几十个岛民居住其上，每天只有一班无人驾驶的轮渡进出岛屿，补给物资，同时也运送信件。玩家唯一可用的交互方式就是，特定时间段，在游戏的网站上投递信件，回信第二天才能跟随轮渡回到码头，寄送到玩家手上——也就是注册时填写的电子邮箱里。

如果当作小说来看，AI 的创作的确不行，但是当作游戏来玩，那种略有些别扭的文风，恰好带来一种复古游戏体验。第一个阶段的游戏目标是，通过文字交流，画出甄仁岛的大致地图。我还在想奖品是什么。毕竟这还挺难的，奖品也得够有吸引力才行。为了实现这个探索地图的功能，我已经实现了 NPC 在地图上自由行走，并且会记录下从 a 点到 b 点用了多少时间，但是，行走速度和身高和年龄有关——又是 if else 算出来的数值。而且岛的面积可不小，要想确定地图内容，得和不止一个 NPC 对话，互相参照和补充着分析才行。他们现在也已经可以主动规划去走一遍 a 到 b 的旅程，但是经我测试，怎么劝他下定决心，放弃当天的工资，去专程走这么几趟，是需要一些笼络人心的话才行的。

然而。我支线开得太多，性格又拖泥带水，总感觉离「现在就上线吧」还差那么一点：应该有真实的经济系统；应该有最初设想的故事性……而且一边写，一边学，有时候恍然大悟，哇哦原来可以这样实现？那岂不是之前那个功能可以写得更优雅些？于是，版本才到 0.001，却已经重构三次了。哦，我还忘了提，李飞飞工作室出的那个简单提示词生成一整个图形化可交互世界的 AI 产品，简直是和我这个小小小游戏完全两极的东西。总之就到这里吧，今天就不看代码了，梳理一下思绪，记上这一笔。希望早日完工，但也可能完不了工。

fin.

激赏！来信。

近期做了啥

KAIX.IN

dimlau

26 September 2025 at 13:02

有一眼能看到的，我把博客页脚的互动按钮改了呈现方式，原来是一排长条按钮，现在换成了更小一些的emoji图标，而且，原本就只是提供个看完文章随手点喜欢的方式，所以索性默认不展示数字了——但点心心不问数字。

还有一个我不说您就看不到的工程，就是做了个互动小说生成游戏。起因是看到一个帖子标题这样写：「用一个知识点构建一个虚拟世界」，感觉有趣，仔细去看了看，发现作者是用 AI 生成妳感兴趣话题的知识卡片，然后会自动推荐一些延伸知识点，如果妳和我差不多年纪，应该想到了一个类似的场景，就是美好的过去，我们打开一个维基百科的词条，顺着链接，一不小心就花光了一晚上的时间。总之，我其实只是因为那个标题，产生了一些自以为有趣的想法。做了一个「互动小说生成器」——向程序发送一条故事背景设定，让它构建一个世界。然后妳自己，或者和其他玩家一起，随便描述个角色，程序会给妳安排个人物背景，将妳送进故事的世界。接下来就在一来一回的对话中，推进故事世界的演化。到这里为止，对我来说也不新颖，但是还有一步，程序会在后台，把故事世界写成小说……我自己一人分饰两角，演绎了一个简短故事，献丑了。

哈哈哈，我不是开发者，看了一下 AI 模型的 API 费率，负担不起。好在用简单模型在免费额度内，好像也能勉强生成一点东西。作为小说来讲，它可能是 💩，但是作为我的沙盘，它给了我一点（准确说是 4 天工作之余的时间）快乐。

fin.

激赏！来信。