消息:华为芯片不力 DeepSeek新模型推迟发布
2025-08-14 01:25:40 · chineseheadlinenews.com · 来源: 大纪元
最新消息指出,中国人工智能新创公司DeepSeek(深度求索)因在使用华为芯片进行训练时遭遇技术故障,被迫推迟最新R2模型的发布。此事凸显北京在推进本土化AI发展方面仍面临严峻挑战。
据《金融时报》引述三位知情人士透露,DeepSeek在今年1月推出R1模型后,应监管部门“鼓励”,改用华为昇腾(Ascend)处理器取代美国英伟达(Nvidia,辉达)系统。
但在R2训练过程中,昇腾芯片反复出现稳定性与性能问题,最终DeepSeek只能采取“训练用英伟达、推理用华为”的折衷方案,原定5月的发布被迫延后,错失市场时机。
训练是指通过大量数据让模型学习并优化参数的过程;推理则是利用已完成训练的模型生成结果或预测,例如聊天机器人的回复。
报道称,华为曾派遣工程师团队驻扎DeepSeek办公室协助开发,但仍未能在昇腾芯片上完成一次成功的完整训练。DeepSeek仍在与华为合作,尝试让R2模型在推理阶段完全适配昇腾芯片。
知情人士表示,DeepSeek创办人梁文峰对R2研发进度不满,并推动加大资源投入,以打造能保持领先优势的先进模型。
英伟达H20在华发展情势
英伟达近日与美国政府达成协议,同意将其H20芯片在华销售收入的15%上缴美方,以换取出口许可。该公司强调,若完全退出中国市场及开发者社群,将削弱美国的全球经济竞争力与科技影响力。
然而,中共网信办上月末约谈英伟达,要求解释H20芯片是否存在可远端追踪或关闭的“后门”安全风险,并提交相关证明材料。
英伟达于8月6日发表声明,明确否认旗下GPU芯片含有后门功能、遥控关机开关或间谍软件。
路透社报道指出,中共当局虽未正式全面禁止H20销售,但已明令要求腾讯、字节跳动、百度等主要网络企业在使用H20时需提交“合理说明”,尤其涉及政府或敏感用途时。
报道指出,尽管中国市场仍对H20有需求,持续的政治与监管压力可能促使企业减少采购量。