博客

Claude自称自己是Ds是不是蒸馏?从舆论场的角度整理一下我们应该如何应对“借着蒸馏的名词忽悠人污名化国模”问题的想法 (又名为了痛痛快快的怼A畜自己找的一大堆理由)

打开 .md 源

随着 Claude Opus 4.8 发布,大家又迎来了一波经典讨论的回归:

Claude 到底蒸没蒸

技术上,当然不能这么简单判断,“蒸馏”是个比较严谨的词汇,在大模型领域有明显的定义和边界,不能简单靠ai的自称来下结论。

但舆论上,这波就是一个非常漂亮的回旋镖:过去很多人拿“国模自称 Claude、GPT”来证明国模偷懒,蒸馏洋模,现在 Claude 自己也开始自称 DeepSeek。那按他们之前的标准,A\ 是不是也蒸馏 DS 了?

蒸不蒸是个技术问题一会会说,但我先下个结论,

我们承认国模的蒸馏现象,但蒸馏本来就是正常的行为。我们反对的是那些借着”蒸馏“污名化国模带节奏的人,光靠”蒸馏“带来不了什么真正的性能提升和跨越,不能用一个”蒸馏“来踩掉所有其他的架构上、训练方式上、软硬件协同上的努力和进步。(不过某些模型厂商也加加油吧,别光在哪里跑分了,挨骂说实话也真不委屈,我们反感的是瞎说的骂,要是骂到点上了那我也得来一句好骂)

A\这次干的漂亮,咱们就抓住了这个使劲的怼,才会让这股看啥都是蒸馏的 “歪风” 彻底终结掉。

至于为啥呢?这么个打法不会被对方抓住了我们 “不理性思考” ”不客观辩证“ 的把柄吗?

完全不会,在意的挂个甲,从那些乱说蒸馏的人的角度出发,不在意的直接上,怼就完了。

首先,

互联网的舆论场是没有记忆,只有印象的

舆论是由观点的双方共同构建的。在这里没有身份,只有发起议题和讨论议题的个体。 反对我们观点的人,和我们想批判的人可能根本对不上号,这也是许多舆论现象中过度扩大批判导致混乱的原因。(毕竟,对方压根就没说过这话,这么一批判反而让对方更团结了带着共同委屈的使命感过来和你对了,相当于主动给对方挂情绪buff ,不值个啊)

而舆论的作用对象也并非讨论者而是旁观者。人们在看舆论场的时候,和在看骂街的时候的心态大多是一样的看热闹心态。早期是谁气势大心理就默认站那边,现在好多了,是第一眼看谁在理就站那边。这种时候用主动出击的怀疑去争取”第一眼“,才能打破这种局面。群众的眼睛是雪亮的,虽然看不懂具体细节,但是可以看懂双方的态度。舆论不会自动趋于理性,但在反复碰撞中,低级论据会被迫暴露成本。我们要做的是把“模型自称谁=蒸馏谁”这套东西推到它自己的荒谬结论上,启发观众的思考。我们不能只让别人在群众的心中种下负面的自卑怀疑,更要去主动出击,在群众心中种下正面的对对方的怀疑。这才能产生真正辨证的思考。

所以,在大多数都情况下,

论据不成熟那是暂时的不成熟,印象烂了那是真的烂了

(这也是老实人在舆论场上总是吃亏的原因,在思考如何不沾泥点的回击的犹豫的时候,在看客眼里他就是理亏说不出话了就是输了)

如果再合理拓展一下:

论据不成熟那是暂时的不成熟,多么不理性的讨论发展到最后总会自然筛选后自动趋于理性 可是A\被怼了那是真的被怼了,印象烂了那是真的烂了,我只能说好怼哈哈

如果真是蒸馏,那就使劲的怼,咬死直接怼死A\,搞的动静大点还能反噬外网,打打A\这个出生的脸XD

如果不是,那也要使劲的怼。因为这说明有些坏蛋们之前拿来刻意抹黑国模,不择手段的给国模污名化造成坏印象的那套证据,本来就是扯淡,就要这么去怼,让人们去反思啥是真正的蒸馏,啥是真正能够决定模型能力的努力。

一、那蒸馏到底是什么?

“蒸馏”本身无罪。在机器学习里,知识蒸馏在早期就是一种正常技术:让一个更强、更大、成本更高的教师模型产生输出,再让一个更小、更便宜、更方便部署的学生模型去学习这些输出。

而 A\ 自己在那篇臭名昭著的《Detecting and preventing distillation attacks》里也承认,蒸馏是 widely used and legitimate training method,也就是“广泛使用且合法的训练方法”。他们指控的是某些实验室通过欺诈账号、大规模 API 调用、规避地区限制等方式提取 Claude 能力。(原文)

(在此附一个佬友找到的A\臭不要脸嘎嘎蒸其他家模型的文档截图) ![[Pasted image 20260529201327.png]]

所以这里要分清四种”蒸馏“:

第一种,正常蒸馏。比如自己蒸馏自己的模型,或者用开源许可允许的数据和模型来蒸馏。这是正常工程手段。

第二种,公开授权蒸馏。比如 DeepSeek-R1 官方就公开了 DeepSeek-R1-Distill 系列模型,基于 Qwen 和 Llama 做蒸馏版本,并且说明这些蒸馏模型可以像 Qwen/Llama 模型一样使用。

第三种,违反服务条款的 API 提取。比如大量绕限制、刷 API,把闭源模型输出拿去训练竞品。这是 A\ 之前指控的东西。A\ 的文章里声称国模通过欺诈账号来和claude交互,然后来提取高质量信息获得数据用做自己训练(但是要注意,别掉到A\的逻辑陷阱里面去说我们不守规则,他自己管过各种信息来源的作者的版权吗?(用盗版书被罚好多亿)他自己不蒸馏其他的模型吗?都是互相蒸馏的,自己吃饱了然后开始骂别人需要吃饭了,真tm双标,该骂)

第四种,舆论场里的“蒸馏”。这个就已经不是技术词了,而是变成了代表“偷”“抄”“不干事情无所作为”的情绪词。这种现象也是我们要怼的,需要让大众明白的东西。

二、所以到底蒸了吗?

理智地讲,一个模型说“我是 DeepSeek”,不能证明它真的蒸馏了 DeepSeek。

LLM 基本没有明显的自我认知。你问它“你是谁”,它只能根据系统提示词、训练语料、上下文、产品外壳、常见对话模式等等,来生成一个它觉得像答案的答案。

这类问题有专业的定义 ,叫 LLM identity confusion,也就是模型身份混淆。相关论文把这种问题定义为:模型在被直接询问身份时,错误地把自己说成另一个模型。论文还统计过 27 个 LLM,其中 25.93% 出现过身份混淆。(arXiv) (arXiv)(gpt给的链接)

所以技术上要证明蒸馏,对于普通人来说,真正像样的证据不太好找,除非是假如claude说不出 马+7 这种,能明显证明他蒸馏了M*****x (bushi

谁蒸馏了谁这种事情,证据不好找,只能知道是行业内部的公开训练方式,都是左脚踩右脚的谁也别说谁,但也说明了,Claude 自称 DeepSeek,这个还真没法说是蒸馏DS。

三、不蒸馏我们就不怼了吗?

蒸否不明,只要是国模那就是蒸了!只要是外模那就是自研!—来自某音上的一大堆某“ai”博主的言行

怼,得怼。

具体一点,我们怼的是那些引导大众对蒸馏的那种错误认知的人。 平常调侃正常没啥说的,可是要是真一本正经的去这么信了去硬黑那可不行.

“它自己都说自己是 Claude 了,那不就是蒸馏的 Claude 吗?这就是所谓的“自研”?所谓的“国产”?”

之前国模自称 Claude、GPT 的时候,一大堆人就这么来黑国模了。

你解释训练语料污染和内置提示词问题,他们说你急了。 你解释模型身份不是证据,他们说你不敢承认在这绕弯。 你跟他讲蒸馏是正常技术,他直接走了不听不听气死你。

我也承认国模确实比不上国外顶模的实力,我们也都骂过国模不当人和华子的卡难用,国模有不对的地方也不包庇,该骂就骂,没毛病。 可是如果是那种不分青红皂白,那种在cc里面用国模连默认提示词都不懂,上来就是阴阳怪气,也不听人解释的东西(这种在某音某书某乎里面见到的可是太多了),我只能说你该如何接下这一次A\递过来的回旋镖呢?是撒泼打滚接着无理取闹,还是就此明白啥是啥我们好好说话好好做朋友呢?这就不是我需要想的了。让他们自己想去吧。

看,现在 Claude 自己也开始自称 DeepSeek 了。 如果“模型自称谁=蒸馏谁”,那 Claude 也蒸馏 DeepSeek。 如果“模型自称谁≠蒸馏谁”,那之前拿国模自称 Claude 来肆无忌惮的骂国模的人,就是在用垃圾证据和垃圾认知带节奏,非蠢即坏。

这叫什么家人们,这叫一根筋变两头堵了~ :laughing:

四、我们的目的是什么?

我们的目的,是让所有拿“模型自称谁”来羞辱国模的人闭嘴,给大众心里面留下真正的辨证思考的材料,这也是为净化网络环境,抵抗反智浪潮出一份力。

毕竟,对于大多数人来讲,我们用心写的论证和科普是看不懂也不会看的,任何复杂事实在一段时间之后都会自动简化为印象。所以,在讲道理的时候能够尽快促成对印象的影响,相当重要。

在舆论场上,没人会在认为自己占理的时候听你讲事实。 什么能给对方的认知造成自我矛盾的暴击并转化为对印象的怀疑,就拼命招呼什么上去,有辨证能力的人自然会留下,情绪上头的人也自然会在事实的映衬下被迫脱下 所谓理性实则诡辩的伪装,从之前让我们 自证 转到让自己 自证 ,谁是真正的独立思考,一看便知。

  • 在面对自己论点造成的现实的时候,冷静下来做出真正的客观独立思考的人,是可以拉拢壮大自身力量的朋友;
  • 撕破脸皮破防攻击或是撒泼打滚就是不信的人呢,这种也没人会在意他们,烂就烂那块吧误导不了其他人就行。

他们过去用低级论据混淆是非,现在同样的低级论据砸回他们崇拜的东西身上,就突然开始讲技术了,突然开始讲身份幻觉了,突然开始讲语料污染了,突然开始讲不能这么判断了。呵呵。

群众的眼睛是雪亮的,大家看了他们的言行和我们的质疑,也会开始怀疑,同等的事情,国模也有,那么也会有这些可能啊?这些又不是外模的专利,自此以后对那种没证据硬黑“蒸馏”的言论,就多一份怀疑,对国模的发展,也会多一份理解和支持。

五、以防你不知道,拿着A\的毛病去怼,看起来不优雅,实则非常优雅。

有的人值得和他认真讨论,而有的人只是在情绪输出。给情绪输出的人讲超出他认知的道理,他听不懂,也不想懂。他只是想踩一脚国模满足自己畸形的优越感,然后拍拍屁股走人。和这种人较劲,对我们的精力和积极性都是一种浪费。而真实需要科普和了解到人也有很多,对于这种可以做朋友的我们也不能敷衍了事,那样反而让本来占理的我们变得傲慢和让人反感。所以,把不同的人辨认出来,是在交流的时候很重要的事情。

而A\这次递过来的论据,就能够让我们在交流中实现优雅的自动分层。在友善的讨论的过程中(也要给对方面子和台阶才方便屈人之威嘛),这几类人就自动分开了,这就叫按需渐进披露精力XD

  • 那些纯拿蒸馏说事的,直接用这次claude说ds的来怼就行,直接把对方的立论之本打掉,后续无论是继续争论还是科普讲解都方便。
  • 开始讨论之后,逐步摆事实,讲道理。
    • 如果撒泼打滚耍无赖,我们帮大家鉴别性质的使命就完成了,大家自然就能看出来是谁在瞎说。
    • 如果理性思考然后承认问题,那我们帮助同志的任务也完成了,又多了个理性的朋友,还可以多聊聊多说说。

感谢A\开源论据 \o/ \o/ \o/ \o/

六、如果你真的烦了,那就现在开怼,我这个就是为了让大家可以光明正大的开开心心的去怼A\而写的XD

干翻A\!!蘸豆!爽!XD

七、天下苦A\久矣! 苦一苦A\天下人皆大欢喜!

虽然A\骂别人蒸馏的那个文章里面说的冠冕堂皇,奈何再好看的雕花都掩盖不了这个公司行事作风双标的屎一样的事实。没问题的东西你说成问题,自己这么干可以别人这么干就威胁安全,这就不厚道的真该骂了。

更况且,这么一篇文章居然还成为一堆人肆无忌惮无脑瞎抹黑国产的借口,我们不反对说国模的问题,甚至嘲讽嘲讽那也没事,毕竟国模的问题各个方面都确实存在甚至不少,但请说出具体是啥问题,而非是为了黑而黑,肆无忌惮的抹黑造谣从而误导大众,用一个“蒸馏”就抹掉无数进步和努力的成果。

之前可以光靠一个自称就说国模蒸馏claude,然后抹杀所有进步就抱着那个蒸馏不放手, 那现在 Claude 自称 DeepSeek,大家当然可以按之前的标准反过来调侃嘛

八、最后,都给我狠狠的怼A\去,不用带啥心理负担,干就完了