摘要

1) 一句话总结 2月23日,Anthropic发布报告指控DeepSeek、月之暗面和MiniMax三家中国AI公司对其Claude模型发起涉及1600万次对话的“蒸馏攻击”,并将其强行上升至国家安全与芯片管制层面,引发马斯克及公众的广泛嘲讽。

2) 关键要点

  • 指控对象与规模:Anthropic指控DeepSeek、月之暗面(Moonshot)和MiniMax对Claude发动工业级“蒸馏攻击”,涉及2.4万个欺诈账号与1600万次对话。
  • 对月之暗面的指控:称其集中提取Agent推理、工具调用、代码分析等能力,并尝试重建Claude的推理轨迹。
  • 对MiniMax的指控:称其攻击规模最大,在Claude新版发布后的24小时内,就将近一半的流量切换到了新模型上。
  • 定性争议:Anthropic承认模型蒸馏本身合法,但指责利用该技术提取竞争对手核心能力的行为。
  • 绑定出口管制:报告声称中国AI的进步相当程度上依赖于提取美国模型能力,暗示美国政府应通过限制芯片来限制蒸馏攻击。
  • 外界反应:马斯克发文嘲讽Anthropic“偷取了人类程序员的资料”,并曾批评其AI存在偏见;该报告在社交媒体上引发了一边倒的群嘲。

3) 风险与不足 (Risks/Gaps)

  • 安全护栏失效风险:Anthropic在报告中明确指出,蒸馏过程大概率会导致模型内置的安全护栏(如防止生物武器研发、恶意网络攻击)丢失,使危险能力在无保护机制下自由扩散。
  • 证据链缺失(Gap):报告对月之暗面的溯源仅基于请求元数据与高级员工公开资料的匹配,且未公开具体资料,被指溯源方式简陋、缺乏实打实的证据。

正文

2月23日,Anthropic发布了一篇措辞严厉的调查报告,指名道姓控诉中国三家头部AI公司——DeepSeek、月之暗面(Moonshot)和MiniMax,称其对旗舰模型Claude发动了工业级别的“蒸馏攻击”。

报告开篇便给出了具体的“攻击”数据:涉及 2.4万个 欺诈账号与 1600万次 对话。Anthropic在报告中承认,蒸馏行为本身是合法且没有问题的,几乎所有大厂都会用自家强模型蒸馏出轻量版本。但他们认为,真正的问题在于利用蒸馏非法提取竞争对手的核心能力。

针对月之暗面与MiniMax的具体指控

报告详细描述了这三家公司的“攻击”方式、规模和目标:

  • 月之暗面(Moonshot): Anthropic指控其目标集中在Agent推理、工具调用、代码分析、计算机视觉等领域,这与月之暗面旗下Kimi的产品方向高度吻合。报告还称,在后期阶段,月之暗面切换到了更精准的模式,尝试提取并重建Claude的推理轨迹。不过,Anthropic的溯源方式显得过于简陋——仅根据请求元数据内容与月之暗面多名高级员工的公开资料进行匹配,且并未在报告中公开具体的员工资料。
  • MiniMax: 报告称其规模最大,并声称捕获了完整的攻击生命周期。Anthropic表示,在发布新版Claude后的24小时内,MiniMax就将近一半的流量切换到了新模型上。

强行上升至国家安全层面

令人反感的是,Anthropic并没有将这些行为简单定性为商业竞争范畴,而是直接提升到了国家安全层面。

Anthropic在报告中称,Claude内置了防止生物武器研发、恶意网络攻击等高风险用途的护栏。“但这些护栏在蒸馏过程中会大概率丢失,意味着危险能力可以在没有任何保护机制的情况下自由扩散。”

此外,报告还将此事与芯片出口管制强行捆绑:

“在没有掌握这些攻击全貌时,中国实验室看似飞速的进步,被错误地解读为出口管制无效的证据。但实际上,这些进步相当程度上依赖的是从美国模型中提取的能力。”

其言下之意,是要求美国政府通过限制芯片,来限制蒸馏攻击的规模。

马斯克与网友的群嘲

此报告一出引起轩然大波,推特上出现了一边倒的嘲讽声音。马斯克直接反击嘲讽道:“你们还偷取了人类程序员的资料。”

这并非马斯克首次表达对Anthropic的不满。此前Anthropic宣布完成300亿美元融资、估值达3800亿美元时,马斯克就曾在评论区写道:

“你们的AI讨厌白人和亚裔,尤其是中国人、异性恋和男性。这是仇视人类,是邪恶的。”

早在今年1月,马斯克就嘲讽过这家名字带有“人类学(Anthropic)”含义的公司,却在做着最反人类的事。而在Anthropic发布的帖子下方,公众同样是一边倒的嘲讽之声。

结语

商业竞争其实无可厚非,但Anthropic在报告中并没有拿出实打实的证据,很难让人信服。其故意将抹黑上升到政治层面的做法,更是显得其心可诛。

相关文档

关联主题