DeepSeek将发布新模型美拆穿其自主谎言-墙外头条

去年中国新年期间搅动全球的中国AI初创公司DeepSeek，今年3月份将发布其新大型模型DeepSeek V4。不过，经过一年多的沉淀后，西方舆论已经反转， DeepSeek所声称的廉价高效的模型，实际上并非“独立自主”，无论芯片还是知识产权都建立在美国科技的基础至上。

非法使用美芯片

去年年初，DeepSeek一直对外宣称，其新推出的DeepSeek-V3大模型是使用英伟达非高端H800芯片训练，训练成本仅557万美元，但多项数据超越国内外一众大模型产品，击败了美国昂贵的投入。

当时业界颇为震惊，美国科技巨头如英伟达、博通、Alphabet、微软股价均大幅下跌，有评论甚至认为这是人工智能界的“Sputnik时刻”。

不过，在今年3月DeepSeek V4即将推出之前，这类故事被反转。

路透社2月22日报道，川普政府高级官员证实，DeepSeek即将发布的V4模型是在内蒙古某数据中心内，利用非法走私的Blackwell芯片集群训练而成，并计划删除相关证据（很可能会谎报实际使用的芯片种类）。

目前，DeepSeek V4仍未发布，但DeepSeek V4打破行业惯例，优先向华为等国内硬件厂商开放测试，将英伟达、AMD拒之门外。大陆的宣传是“以实际行动扛起国产算力自主大旗”，但国外专家则认为，这是因为向美国芯片制造商展示该模型，将暴露其真实硬件。

2024年5月21日，位于美国加州圣克拉拉(Santa Clara)的英伟达公司（Nvidia，又叫辉达）总部。(Justin Sullivan/Getty Images)

实际上，去年DeepSeek-V3发布之时，国外质疑声不断。硅谷科技投资公司Altimeter Capital创办人格斯特纳（Brad Gerstner）直斥DeepSeek的宣称是“假新闻”。

另有报道说，DeepSeek的主要投资方“幻方量化”（High-Flyer）早在2021年美国出口管制生效前，就囤积了一万块英伟达（Nvidia，辉达）的A100 GPU。DeepSeek不仅搞到了H100，还搭建了一套完整的“绕过体系”，通过东南亚空壳公司采购芯片，远程接入当地服务器调用“云端算力”，甚至用行李箱装满硬盘人肉运输训练数据。

《The Information》也曾报道DeepSeek走私芯片到中国，用于训练其下一代模型。

美国众议院“对中共特设委员会”（House Select Committee on the CCP）去年4月份报告也指出，DeepSeek使用受出口管制的Nvidia芯片驱动其模型。

台湾国防安全研究院国家安全研究所助理研究员杨一逵对大纪元表示，各界高度怀疑DeepSeek使用了透过灰色管道或利用第三方转移 Blackwel 晶片，确实充满争议。

他认为，这反映出，美方专家已认定DeepSeek V4确实使用了Blackwell，但验证上需要更多证据佐证，实质证据证实窃取行为难以查找，美方政策圈目前聚焦的讨论，已从花费资源与时间去判定DeepSeek到底有无使用禁运的Blackwell晶片，转向到商讨如何更有效的掌握与监控卖出去的晶片，不让其透过第三方落入中方厂商的手中。

灰色地带蒸馏

同时，DeepSeek通过灰色地带蒸馏美国大型AI模型的手法也遭到曝光。

在路透社报道的第二天，2月23日，Anthropic公布详细证据，指出DeepSeek通过24,000个虚假账户进行逾15万次交互，以此提炼Claude的推理能力。谷歌同日披露，其Gemini模型遭遇逾10万次针对推理轨迹的攻击。

蒸馏（distillation）是指让一个更成熟、更强大的人工智能模型，评估一个新模型输出结果的质量，并有效地迁移旧模型的学习成果。

Anthropic表示，采用“蒸馏”的做法，中国AI公司在非法挖取美国竞争对手的模型能力，以此节省研发时间与成本。

Anthropic认为，这已超出一般合法使用范围，构成刻意“抽取”先进模型能力的蒸馏行为，甚至可能把美国研发的AI能力外溢到外国军事与情报系统，对美国国家安全构成潜在风险。

此前， OpenAI发布了一份备忘录，警告中国人工智能公司DeepSeek正以ChatGPT和Claude为目标，试图复制美国的AI模型并将其用于自身训练。

引发英国政府和马斯克交锋的是Grok人工智慧工具被人利用来制作不道德的图片。（RICCARDO MILANI/Hans Lucas/AFP via Getty Images)

国防安全研究院中共政军与作战概念研究所助理研究员王绣雯对大纪元表示，在中国人或企业心中根本不认为“盗窃美国知识产权”违法，这其实反映出中国AI技术落后美国的事实，否则他们不必想方设法盗窃美国企业技术或利用开源AI技术，以及走私英伟达先进晶片。

她指出，“遥遥领先”原本就是中共大内宣的欺骗伎俩，若他们对外宣称“遥遥领先”，就只好接受全球检视。

杨一逵表示，从技术上来看，让小模型学习大模型的推理与逻辑并不违法，但在业界中，公司往往因为训练资料来源是否有正当授权而引发争端。

他说，多数美国AI公司在提供服务的合约中，都会禁止竞争者使用特殊程式大规模收集其模型输出、复制其推论过程或爬取“思维链”（Chain of Thought），再以此训练自家模型。这种“搭便车”的模型复制，在合约上是违法的。

杨一逵指出，中国公司常以大量虚假账号，日以继夜地爬取美国模型的思维链与推论逻辑，刻意维持在难以查证、难以举证的灰色地带。即便违反公平竞争的规范，却因取证困难，使得法律诉讼难以成立。目前美国政策圈正在尝试跳脱这类辩论框架，回到更关键的问题，去研究中国（中共，下同）如何以国家资本推动AI技术? 中国如何强化其AI相关的基础建设，例如电力? 中国如何透过外交工具、国际市场与舆论操作，推广中国AI技术的扩散，建立国际市场辨模？

拆穿“独立自主”谎言

在美中科技竞争中，凡涉及到AI、芯片、量子科技等前沿科技领域，中共就会对美大肆展开“独立自主”的舆论战。

2023年华为8月底华为发布 Mate 60 Pro 时，时任美国商务部长雷蒙多（Gina Raimondo）正好在中国访问。而去年Deepseek发布新模型的时间，恰好选择在川普就职美国总统期间，与美国叫板的意味很浓。

DeepSeek创办人梁文锋在接受媒体的访问时称，他的核心团队“没有海归人士，都是本地人才”，他还强调，中国的AI产业“不能永远做跟随者”，宣传中共所谓独立自主叙事。

在2026年马年央视春晚上国产人形机器人密集亮相，也被中共媒体吹嘘为“遥遥领先”。

如今，Deepseek在新模型发布之前，美国曝光了其对美科技的依赖链，揭示出来的真相是：DeepSeek既依赖禁运的美国芯片，又使用禁运的美国模型进行训练，还编造独立自主的故事来推销产品。

对外关系委员会（CFR）中国与新兴技术高级研究员克里斯‧麦圭尔（Chris McGuire）在X平台上发文回应说：当Deepseek发布其新模型，并声称使用2000个H800芯片从零开始训练时，希望世人能够识破这是谎言。事实上，Deepseek几乎完全依赖于被禁的美国技术和知识产权。它通过非法使用美国芯片和非法窃取美国知识产权来训练模型。

“这些行为必须承担后果”，他写道。

王绣雯表示，路透社报道其实反映出一个事实：技术发展从来就不是横空出世，必须建立在长期摸索尝试的基础上。DeepSeek大模型虽然在2025年令世界惊艳，但追踪到底，还是必须依赖美国的先进技术。

她补充说，DeepSeek说谎造假并不意外，他们是新创公司，急需大量资金投入，为了抢快抢钱，大概什么手段都使得出来。特别是这还和中国人的所谓民族自尊心挂在一起，不大力灌水怎么骗得到资金和市场？这种前例太多了，眼下还有个人形机器人产业之例。

王绣雯表示，DeepSeek被美国企业指控利用盗窃，反映出中共抄捷径、想一步登天，结果却连马步都蹲不好，就算一时令世界惊艳，时间久了就会真相大白。这对中共的国际名誉是大大损伤，日后中共又发布什么“遥遥领先”的技术，很多人大概会认为“又来骗人”。

杨一逵认为，中方大肆宣传其AI技术如何突破美国封锁的与论，是一种扩展市场应用与需求的策略，试图形塑美国晶片抵挡不住中国AI产业的崛起，凸显美国禁运政策的失败，间接说服美方政策圈开放更多的高阶晶片出口，同时也向其它国家展现中国在美方晶片制裁下的创新能力。借此吸纳外国的资本与投资，以及外国的人才。

杨一逵表示，中国的AI当然不是“遥遥领先”，美方最新的政策走向已不再着眼于强调中国AI发展的虚假性，务实地分析中国AI产业的真正实力、限制与脆弱性，以及防堵美国高阶晶片在地下市场的外流，可能才是美国政策圈当前的方向。

加大出口管制

Anthropic报告同时指出，这些中国AI实验室看似迅速取得的进展被错误解读为出口管制无效，且可以通过创新规避管制。实际上，这些进展在很大程度上依赖于从美国模型中提取的能力，而大规模提取这些能力需要获得先进芯片。

“因此，蒸馏攻击强化了出口管制的合理性：限制芯片访问权限既限制了直接模型训练，也限制了非法蒸馏的规模。”报告写道。

王绣雯表示，是否加大对中出口管制，要看川普怎么想。一方面有英伟达不愿失去庞大的中国市场，一方面有Anthropic暴露中国企业的盗窃。若按照川普1.0时期的进展，川习会后，如果觉不满意，可能随后就采取包严格的措施。不过，现在中共祭出稀土管制，可能美国要设法拖延时间、迂回作战。

杨一逵表示，美方目前正研拟如何强化受管制高阶晶片的追踪技术与管制模式。例如在晶片中嵌入俗称“晶片指纹”的溯源机制，并加入地理围栏（Geofencing）功能，让晶片一旦在未授权地区启动，就能自动回传异常讯号，便于主管机关追踪其流向并防止第三方转运至中国。但这类措施在产业界，尤其是像Nvidia这样的主要供应商可能引发反弹。AI 企业担心，强制性的追踪功能会削弱客户的信任，甚至带来新的网络资安风险，使晶片成为黑客攻击与植入恶意程式的目标。因此，这项政策构想目前仍处于美方内部讨论阶段，尚未形成定案。

杨一逵表示，美方未来的政策走向将呈现表面放宽、实质强化追踪的双轨模式。也就是说，表面上可能有条件地放松部分高阶晶片出口（例如开放 H200），以维持中国企业对美制晶片的高度依赖。但在实质操作上，美方会同步加强对高阶晶片的流向监管与追踪机制，确保关键硬体不会被第三方转移与走私。