DeepSeek V4下周登场

2026-03-01 10:25:20 · chineseheadlinenews.com · 来源: 新智元

DeepSeek V4下周登场:原生多模态,绕过英伟达,针对国产芯片深度优化。华尔街最怕的那条逻辑可能又要重演:算力霸权松动,美股先颤抖。

朋友们,见证历史的时刻又要到了!

《金融时报》报道,DeepSeek V4,下周正式登场!

距离上一次DeepSeek发布重大模型R1,已经过去了整整一年多。

这一年里,AI行业风起云涌,OpenAI连推数代GPT,Anthropic的Claude杀入顶级阵营,谷歌Gemini疯狂迭代。

整个硅谷都在用数百亿美元甚至数千亿美元疯狂“烧钱”。

而DeepSeek呢?

它安安静静地待在杭州,没有发布会,不路演,不炒作。

只做一件事:磨刀。

预计下周发布的V4将是一款支持图片、视频和文本生成的原生多模态大模型。

更炸裂的是,V4并没有选择跟英伟达做优化适配,而是优先与国产芯片厂商合作,针对国产AI芯片进行了深度调优。

这意味着,DeepSeek V4将不只是一次模型升级,也是一次底层架构的战略转向。

是中国AI从“用别人的芯片跑自己的模型”走向“用自己的芯片跑自己的模型”的历史性一步。

DeepSeek选择国内重磅会议前夕发布V4,无疑发出了一个信号:中国AI,不只是在追赶,还在定义新的游戏规则。

网友称,“V4 将对 OpenAI 和 Google 形成巨大压力。中国没有放缓,而是在加速。”

“人工智能竞赛又提升了一个档次。”

有网友爆料,DeepSeek V4的API成本将比对手便宜50多倍。

更有网友豪言,美股已经瑟瑟发抖。

V4强在哪?

第一个关键词:多模态。

过去的DeepSeek模型主要是“文字选手”——写代码一流,做推理一绝,但图像和视频能力一直是短板。

V4彻底补齐了这块拼图。

据目前泄露的信息,V4是一个原生多模态模型,能够同时理解和生成图片、视频和文本。

而且,V4 Lite已经在至少一家推理服务商处进行内测,据称拥有高达100万token的上下文窗口,表现远超网页版和应用版模型。

目前已经在外网疯传的一张对比图显示,DeepSeek V4 Lite(代号“Sealion-lite”)在不开启思考模式的情况下,生成的SVG图像质量已经明显超越了当前的DeepSeek V3.2思考模型。

有大V发帖称,V4的编码性能甚至比当前的GPT和Claude更强。

第二个关键词:国产芯片适配。

这是V4最具战略意义的突破。

据路透社和《金融时报》报道,DeepSeek这次绕开了英伟达,没有向这家美国芯片巨头提供V4的早期接入权限。

这打破了AI行业长期以来的惯例——过去,任何一个顶级大模型发布前,都会先跟英伟达做性能优化。

这一次,DeepSeek选择了“反向操作”。

DeepSeek用V4告诉全世界:我们不挑芯片,也能跑出世界一流的模型。

当然,客观地说,英伟达在训练阶段的芯片上依然占据主导地位,尤其是在计算密集型的预训练环节。

但在推理阶段,V4可能已经实现了国产芯片的全面适配。

推理环节是大模型商业化落地最核心的一环,这一步的突破意义不可估量。

第三个关键词:开源。

据知情人士透露,DeepSeek将在V4发布时同步放出一份简短的技术说明,并在大约一个月后发布一份更全面的技术报告。

这延续了DeepSeek一贯的“开放精神”。

去年R1发布时附带的那份详尽技术报告,曾让全球AI研究者受益匪浅,被视为推理模型领域最重要的开源贡献之一。

回顾R1

那一天,硅谷真的慌了

要理解V4的分量,必须先回看去年DeepSeek R1发布时的那场“地震”。

2025年1月20日,DeepSeek悄然上线了R1推理模型。

没有发布会,没有媒体吹风会,没有CEO站在台上挥手致意——就是简简单单地把模型放了出来,附带一份技术报告。

然后,全世界炸了。

R1在多项基准测试上达到了与OpenAI最强模型o1相当甚至超越的水平,而DeepSeek声称其训练成本仅为约560万美元——这个数字不到GPT-4训练成本的十分之一。

更要命的是,R1是开源的!

2025年1月27日——这是一个将被载入AI史册的日子,DeepSeek的手机App超越ChatGPT,成为苹果App Store下载量第一的免费应用。

同一天,英伟达股价暴跌近17%,单日市值蒸发约5890亿美元,创下美国股市单家公司历史最大单日跌幅纪录。

博通下跌超过17%,微软下跌2.1%,整个纳斯达克血流成河。

知名风投家马克·安德森称DeepSeek为“我见过的最令人惊叹和印象深刻的突破之一”。

多位美国科技界人士将其比作“斯普特尼克时刻”——1957年苏联先于美国将卫星送入太空的那一刻,象征着中国AI实力的强势崛起。

而华尔街投资人最恐惧的问题浮出水面:如果一家中国公司用十分之一的成本就能做出同等水平的模型,那美国科技巨头每年砸下的数百亿美元基础设施投资,还值得吗?

英伟达的高端GPU还会有那么大的需求吗?

蛰伏一年,DeepSeek都干了什么?

R1之后,DeepSeek进入了长达一年多的“静默模式”。

没有新的旗舰模型,只有渐进式更新。

但这并不意味着他们无所作为——恰恰相反,DeepSeek一直在为V4铺路。

来看看这份更新时间线:

2025年3月:DeepSeek-V3-0324发布。这是V3的一次重要升级,通过吸收R1的强化学习技术改进了后训练流程,在数学和编程评测上甚至超过了GPT-4.5。2025年5月:DeepSeek-R1-0528发布。R1的大幅升级版,推理能力显著增强,代码生成质量提升,被认为是开源推理模型的新标杆。2025年8月:DeepSeek-V3.1发布。这是一个里程碑式的更新——V3.1首次将V3和R1的能力融合到一个模型中,支持“思考模式”和“非思考模式”的自由切换,在SWE-bench等基准上比前代提升超40%。此后更新至V3.1-Terminus版本,进一步修复了多语言混合、Agent能力等问题。2025年9月:DeepSeek-V3.2-Exp发布。引入了全新的稀疏注意力机制(DeepSeek Sparse Attention),为更长上下文和更高效率的推理奠定了架构基础。2025年11月:DeepSeekMath V2发布,基于V3.2-Exp-Base构建,在多项数学竞赛中达到金牌水平,并验证了自验证(self-verification)技术的有效性。2025年12月:DeepSeek-V3.2正式发布。V3.2-Speciale版本在2025年国际数学奥林匹克(IMO)和国际信息学奥林匹克(IOI)中取得金牌级表现,首次将思考能力整合到工具调用中。2026年1月:DeepSeek先后发布了关于Manifold-Constrained Hyper-Connections(mHC)和Engram条件记忆技术的研究论文,被业界普遍视为V4的架构基石。mHC改变了信息在模型层间的流动方式,Engram则让模型能够选择性地记忆和调用上下文信息,支持超过100万token的上下文处理。

每一步,都在为V4的最终亮相做准备。

一场精心策划的舆论战?

就在V4即将发布的节骨眼上,美国那边也没闲着。

2月24日,Anthropic在X上高调发帖,指控DeepSeek等3家对其Claude模型发动了“工业级蒸馏攻击”,声称这三家中国实验室创与Claude进行了超过1600万次对话,以此提取能力来训练自己的模型。

但讽刺的一幕紧随其后。

就在Anthropic高调指责“蒸馏”的同一周,网友发现了一个令人瞠目的bug:当你用中文问Claude“你是什么模型”时,它竟然回复:“我是DeepSeek V3。”

甚至通过Anthropic官方API测试,结果还是一样。

用法语提问时,Claude则回答“我是ChatGPT”。

这一幕的戏剧性实在太强了。

你刚指控别人“蒸馏你”,转头自己的模型就在中文环境下认了别人当“爹”。

Anthropic那条推文下面6000多条评论,超过70%都在嘲讽。

Reddit上的讨论更加一针见血。

有用户总结道:这是一场有组织的FUD(恐惧、不确定性和怀疑)营销。

目的很明确——在V4发布前抢占叙事高地,预先埋下“他们只会作弊抄袭”的框架,无论V4表现多惊艳,公众的第一反应都会被引导到负面解读上。

同时通过舆论手段稀释V4发布的媒体关注度,防止美国科技股再次出现去年R1发布时那样的两位数暴跌。

美股再次颤抖?

去年R1发布时,英伟达单日跌去17%,5890亿美元灰飞烟灭。

如今V4不仅在模型能力上更进一步(多模态、百万上下文、原生国产芯片适配),更在战略层面发出了优先适配国产芯片的明确信号。

如果V4发布后的基准测试再次验证了DeepSeek的效率优势——用更少的计算资源达到世界一流水平——那华尔街的投资者势必要再次面对那个令人不安的问题:AI基础设施的天量投资,真的有必要吗?

更值得关注的是,即便是竞争对手阵营的研究人员也在私下承认,DeepSeek V4不可小视。

“可能发布就登顶开源第一”。

DeepSeek V4的发布,不会是一个平静的事件。

从蛮力到结构

中国AI的进化之路

2023年7月成立,2024年12月发布V3,2025年1月R1震撼全球,一整年持续迭代打磨。

2026年3月V4携多模态能力与国产芯片适配强势回归。

这条路径揭示了一个深刻的趋势:中国AI正在从依赖硬件蛮力走向依靠架构创新和工程效率的道路。

美国的出口管制试图用“卡脖子”的方式遏制中国AI的发展,但DeepSeek的存在本身就是对这种策略最有力的回应。

当你无法获得最顶级的芯片时,被迫去思考更聪明的方法——更高效的训练策略、更精妙的架构设计、更极致的资源优化。

而这些创新一旦形成,价值远超任何一款芯片。

下周,我们拭目以待。

全世界都在看。


    24小时新闻排行榜更多>>
  1. 中共央企高管频落马 华润集团副总经理投案
  2. 伊朗政权崩溃在即:民众庆祝 流亡王储呼吁行动(图/视频)
  3. 川普与以总理告知伊朗人民准备接管政权
  4. 以色列证实伊朗最高领袖哈梅内伊身亡(图/视频)
  5. 美将收回25年前“最惠国大礼” 伊朗之后是中共
  6. 回应哈梅内伊身亡 川普:我们认为消息准确
  7. 德媒盛赞默茨:未迎合北京也未作态 成功访华之行
  8. 习三任大秘都出事?分析:军方指挥中枢已塌方
  9. 中共党媒称哈梅内伊“几分钟后露面”遭打脸
  10. 两名伊朗高官死于美以空袭
  11. 6年为女友花100多万,她竟已婚生俩娃
  12. 顶级经济学家警示:美国经济已悄然转向
  13. 罕见月全食,错过再等几年
  14. 白宫发布川普在佛州庄园监控对伊朗行动照片
  15. 美以袭伊朗前 中国科技公司连曝美军部署卫星图
  16. 投30枚炸弹轰炸哈梅内伊
  17. 出动200战机袭伊朗 以军史上规模最大空袭
  18. 美伊空袭伊朗 北京“川习会”交易算盘落空
  19. 美以攻击伊朗,如何影响A股、黄金和原油?
  20. 川普公布对伊朗打击持续时间
  21. 破例白昼突袭的关键决策内幕
  22. 马年首虎 华润副总经理韩嵩投案 或涉马兴瑞案
  23. 以色列证实哈伊朗哈梅内伊在空袭中丧生(图/视频)
  24. 美对伊朗展开史诗之怒行动 战斧导弹打头阵
  25. 军工背景高官陈求发三名前大秘接连落马
  26. 伊朗官员:美以将遭受“从未感受过的打击”
  27. 【翻墙必看】美以斩首哈梅内伊 中共吓破胆
  28. 毛新宇挺张又侠言论流出 替红二代发声?四疑点解析
  29. 关于美国袭击伊朗,你应该了解的最新信息
  30. 伊朗发动报复性空袭!迪拜豪华酒店被导弹击中
  31. 哈梅内伊被斩首 川普:我知道谁在伊朗掌权
  32. 都不是人 习风水转运失败 2026全国大丧?
  33. 关闭霍尔木兹海峡,伊朗能做到吗?
  34. 世界超市义乌新春开市
  35. 专访余宗基将军:美以空袭伊朗 中东格局有变
  36. 迪丽热巴签约天伊娱乐?
  37. 巴基斯坦“公开宣战” 轰炸喀布尔
  38. 中东最大航空公司,罕见全线停航
  39. 海格塞斯:对伊朗实施史上最致命最精准空袭
  40. 哈梅内伊的命运:最后一条帖子与第一条讣告
  41. 以色列:1分钟内炸死40名伊朗军事指挥官
  42. 第2个“马斯克”,出现在中国?
  43. 哈梅内伊开会时遭空袭 多名高层团灭 伊朗官方确认
  44. 粤动物园惊魂一幕:女孩投喂狮子被隔栏抓腿
  45. 川普:对伊朗的不间断打击将持续一周甚至更长
  46. 沃尔玛高层示警:中国5岁儿童就在学DeepSeek
  47. 美以袭击伊朗后,为何黄金暗盘价格却跌了
  48. 这是危险时刻,但美以认为机不可失
  49. 阿曼大臣昨日刚宣布伊朗核外交进展,就被打脸
  50. 对伊朗的打击将会让石油市场受到何种冲击?
  51. 白宫公布川普及国安团队监控伊朗空袭照片
  52. 最大斩首行动之一 美以空袭击毙数十伊朗高官
  53. 近百名在伊中国人正紧急撤离
  54. 伊朗总统医学出身总统是单亲爸爸,三天前表示伊朗不会走核武之路
  55. 哈梅内伊身亡后 伊朗宣布由总统等三人暂时领导国家
  56. 对伊朗发动史诗之怒打击行动 美发布震撼视频
  57. OpenClaw杀出中国黑马
  58. 美众议员推出法案,要求禁止进口自中国远程监控储能系统
  59. 北大3学者重大突破:2000年数学难题
  60. 菜鸟挑战百内O线