API & SDK

Nemotron 3 API 调用方式与示例

通过 vLLM、SGLang 或 OpenRouter 访问 Nemotron 3，提供示例请求、思考预算控制与多智能体调用建议。

nemotron 3 apinemotron openrouternemotron 3 sglang apinemotron 3 budgetnemotron tool calling

REST 示例（vLLM）

Python: `from sglang import client; client.chat(model="nemotron3", messages=[...])`
工具调用：在 schema 中声明函数，Reasoning ON 时保留链式思考。

API 是否支持流式输出？

是，vLLM 与 OpenRouter 均支持 SSE 流式返回。

如何控制思考预算？

在 prompt 或 request 中声明最大思考 token，并结合 Reasoning ON/OFF 切换。

工具调用是否开箱可用？

支持函数调用/工具调用，建议提供结构化 schema 并限制函数数量以控成本。