4月27日——DeepSeek 推迟了其 V4 模型的发布,以便对其软件堆栈进行微调以适配华为的昇腾芯片,反映出北京更广泛的举措:随着对先进外国半导体的获取日益受限,推动建设本土 AI 供应链。

DeepSeek 的 V4-Pro 模型在主要测试中与 OpenAI 和 Anthropic 设定的性能基准相匹配,同时其 API 成本显著更低:每百万输入 tokens 为 $1.74,相较于西方竞争对手大幅下降。该公司表示,V4-Pro 的计算效率比其 V3.2 前身高 27%,在 100 万 token 的上下文中使用的计算能力显著更少。DeepSeek 先前已通过其 R1 模型展示了成本效率,该公司称其开发所需投入少于 $6 百万。

市场反应体现了对国产芯片采用的转向。中国 AI 公司 MiniMax 和智谱 (Knowledge Atlas Technology) 的股价各自大约下跌 8%,而芯片制造商受益:作为中国最大的代工芯片制造商的中芯国际上涨 9%,华虹半导体攀升 15%。

不过,DeepSeek 的技术报告表明,该公司仍在一定程度上依赖 Nvidia 芯片。目前,中国半导体承担模型推理,但似乎只有 V4 训练的部分内容已为国产硬件做了适配;该报告未能澄清 Nvidia 芯片是否完成了模型训练阶段的大部分工作。