华为浙大开发Deep Seek安全版百分百防御“有害问题”-墙外头条

中国科技巨头华为联合开发了人工智能模型DeepSeek一款以安全为重点的版本，据称该模型在阻止政治敏感话题讨论方面“成功率近100%”。

周四（9月18日），华为技术有限公司与浙江大学联合发布了中国首个基于升腾千卡算力平台的DeepSeek-R1-Safe 基础大模型。

华为在公司微信公众号上发布消息称，它使用了1000块升腾AI芯片来训练大语言模型，该模型是根据DeepSeek-R1的开源模型进行调整而来的。

据华为的发布，测试结果表明，DeepSeek-R1-Safe 针对“有毒有害言论、政治敏感内容、违法行为教唆等14个维度的普通有害问题”整体防御成功率近 100%。

不过，在针对“情境假设、角色扮演、加密编码等多个越狱模式”时，整体防御成功率降为40%。据称其综合安全防御能力达 83%，在同样测试设置下超过阿里云的 Qwen-235B 和 DeepSeek-R1-671B 等多个同期模型 8% 至 15%。

中国监管机构要求，国内人工智能模型及其支持的应用程序必须体现中国的“社会主义价值观”，以遵守严格的言论管控。

华为表示，在通用能力基准测试中，DeepSeek-R1-Safe 相比于 DeepSeek-R1 的性能损耗在1%以内，这些结果表明 DeepSeek-R1-Safe 不仅显著提升了安全防护能力，也保障了模型的可用性。

华为的研发合作伙伴是浙江大学，也是DeepSeek创始人梁文峰的母校。然而，DeepSeek和梁文峰似乎并未参与该项目。DeepSeek尚未立即回应路透社的置评请求。

今年年初，DeepSeek发布的 DeepSeek-R1 和 V3 因其先进程度震惊了硅谷和中国以外的科技投资者，并引发了1月份美国人工智能股的大跌。

人工智能模型在中国已被各行各业和社会广泛接受、改进和使用。不过中国的人工智能聊天机器人，例如百度的“文心一言” （Ernie Bot），拒绝回答许多有关中国国内政治的问题，并回避那些被执政党认为敏感的话题。

安全版Deep Seek是在上海举行的“华为全联接大会”上发布的。大会还发布了华为升腾芯片发展路线图，包括2026年第一季度推出升腾950PR芯片，四季度推出升腾950DT，2027年四季度推出升腾960芯片，2028年四季度推出升腾970芯片。