模型参数

Nemotron 3 Nano 30B 模型规格与 1M 上下文

Nemotron 3 Nano 30B：混合 Mamba-Transformer 稀疏 MoE，6/128 专家路由，1M 上下文窗口，约 3.6B 激活参数，支持 Reasoning ON/OFF 与思考预算，适配多智能体与工具调用。

Nemotron 3 Nano 参数Nemotron 3 1M contextMamba Transformer MoE6/128 专家长上下文模型

核心规格

Nemotron 3 Nano 30B 的上下文是多少？

默认 1,000,000 tokens，通过 512k 连续预训练与 4k 混合训练获得。

是否支持 Reasoning 开关？

支持 Reasoning ON/OFF，并可设置思考 token 预算，控制成本和隐私。

推理部署推荐哪种框架？

官方兼容 vLLM 与 SGLang，可在 H200 等 GPU 上获得高吞吐。