消息:美出口禁令阻碍DeepSeek新模型进程
2025-06-26 09:25:39 · chineseheadlinenews.com · 来源: 大纪元
美国媒体报道说,美国芯片出口管制措施已经阻碍了中国人工智能公司DeepSeek(深度求索)的新模型进程。
The Information周四(6月26日)引述知情人士的消息说,因为中国市场短缺英伟达(Nvidia)服务器芯片,这将限制中国云服务商为DeepSeek新模型提供服务的速度和规模。
知情人士是向企业客户提供DeepSeek模型的中国主要云服务提供商的员工。他们表示,预计DeepSeek即将推出的大型语言模型R2在中国的普及速度和规模可能都不如其前身R1。
DeepSeek依靠英伟达的硬件和软件进行训练,并且在英伟达芯片上运行时性能最佳。知情人士还透露,虽然中国国内芯片公司——包括华为等提供了英伟达芯片的替代品,但DeepSeek的模型完全以英伟达硬件和软件为基础进行优化,因此换中国芯片来运行这些模型会更难管理,效率也会更低。
禁H20芯片出口 限制云服务商为DeepSeek服务
中国云计算公司的员工表示,如果R2模型的性能超越现有的开源模型,那么对它的后续需求将使中国的云服务提供商不堪重负,因为这些服务提供商已经在努力应对英伟达芯片短缺的问题。
他们表示,在目前使用R1模型的云客户中,大多数都使用英伟达的H20芯片运行模型。
尽管DeepSeek尚未确定何时发布R2,但云计算公司员工透露,该公司一直在与一些中国云计算公司保持密切沟通,为他们提供技术规范,以指导他们在服务器上托管和分发该模型。这些计划包括为希望使用完整版R2的客户准备足够的H20芯片。
美国4月份的禁令粉碎了中国云计算公司囤积更多H20芯片的希望。如果依赖中国现有的H20芯片库存,这可能会限制企业使用R2的程度。
美国禁令凸显中国仍然严重依赖美国技术的现实。H20芯片于2023年发布,是英伟达对美国收紧出口限制的回应,该限制实际上禁止英伟达向中国销售其强大的Hopper系列图形处理器芯片。随后,英伟达订制面向中国市场销售的缩减版H20芯片。
中国云计算公司之前因DeepSeek大量采购H20芯片
在R1发布之前,中国的一些云计算公司和开发者一直回避H20,因为其规格受限,不足以运行大型语言模型(LLM)。
但在R1发布后,情况发生了改变,几乎所有中国企业——从云计算公司和科技初创公司到国有企业和政府机构——都争相使用R1。
为了满足对R1的激增需求,包括字节跳动、阿里巴巴和腾讯控股在内的科技巨头在2025年前三个月订购了价值160亿美元的H20芯片,相当于120万片芯片。相比之下,据SemiAnalysis估计,英伟达2024年全年一共向中国发货了100万片H20芯片。
由于美国出口管制,这在今年早些时候R1需求激增时就已经对中国构成了芯片挑战。为了弥补缺口,许多国内企业购买了英伟达专为电子游戏设计的芯片,例如RTX 5090和RTX 4090,来驱动R1。这两种芯片也被限制在中国销售,但在黑市上比获得Hopper芯片更容易买到。
DeepSeek仍在完善R2模型 传梁文锋对结果不满意
据两位知情人士透露,DeepSeek尚未确定R2模型的具体发布时间。DeepSeek的工程师在过去几个月里一直在紧张开发R2,但首席执行官梁文锋对新模型的表现并不满意。知情人士说,工程师们正在努力完善R2模型,直到梁批准发布。
今年1月,总部位于杭州的DeepSeek在科技界引起轩然大波,引发对美国高端芯片是否适用的质疑。该公司声称其R1推理模型与美国领先模型相当,而成本却仅为后者的一小部分。
美国公司OpenAI指控DeepSeek在R1的训练过程中使用了他们的AI模型。
美国国务院高级官员周一(23日)接受路透社专访时透露,DeepSeek正在利用变通手段逃避美国出口管制,获取美国制造的先进芯片。
该官员表示,DeepSeek手上有“大量”英伟达高端H100芯片。自2022年以来,美国全面禁止H100芯片出口到中国,因为美国担心北京可能会利用这些芯片来提升军事能力或在AI竞赛中领先。
“DeepSeek试图利用东南亚的空壳公司逃避出口管制,并且正在寻求进入东南亚的数据中心,以远程访问美国芯片。”官员说。