英伟达推出 Nemotron 3 Ultra，配备 550B 参数的旗舰模型，采用 Mamba-Transformer 混合 MoE 架构

据 Beating 称，Nvidia 于 6 月 4 日发布其旗舰大型语言模型 Nemotron 3 Ultra，包含 5500 亿总参数，其中 550 亿为激活参数。该模型在 Artificial Analysis 的智能指数上得分 48，使其成为表现最强的开源美国模型，仅次于得分 54 的 Kimi K2.6。

该模型采用混合 Mamba-Transformer MoE 架构，在 Mamba-2 状态空间层与 Transformer 注意力层之间交替，同时支持 100 万 token 的上下文窗口，并避免二次方 KV cache 增长。与同等规模的密集模型相比，混合架构在代理任务上实现了 5 倍更高的吞吐量和 30% 更低的推理成本。Nemotron 3 Ultra 可在 Hugging Face、NVIDIA NIM 和 OpenRouter 上使用。

声明：文章不代表币圈网立场和观点，不构成本站任何投资建议。内容仅供参考！

英伟达推出 Nemotron 3 Ultra，配备 550B 参数的旗舰模型，采用 Mamba-Transformer 混合 MoE 架构

相关阅读