/chat/completions
接口使用推理模型。
max_tokens
:设置模型输出的最大 token 数。temperature
:建议设置为 0.5 至 0.7(推荐 0.6)以平衡输出的创造性与逻辑性。top_p
:建议设置为 0.95。deepseek/deepseek-r1-0528
deepseek/deepseek-r1-0528-qwen3-8b
deepseek/deepseek-r1-turbo
deepseek/deepseek-r1-distill-qwen-32b
deepseek/deepseek-r1-distill-qwen-14b
deepseek/deepseek-r1/community
qwen/qwen3-235b-a22b-fp8
qwen/qwen3-30b-a3b-fp8
qwen/qwen3-32b-fp8
qwen/qwen3-8b-fp8
qwen/qwen3-4b-fp8
minimaxai/minimax-m1-80k
system
消息中添加推理指令,应在 user
消息中直接明确指令。