/chat/completions 接口使用推理模型。
max_tokens:设置模型输出的最大 token 数。temperature:建议设置为 0.5 至 0.7(推荐 0.6)以平衡输出的创造性与逻辑性。top_p:建议设置为 0.95。deepseek/deepseek-r1-0528deepseek/deepseek-r1-0528-qwen3-8bdeepseek/deepseek-r1-turbodeepseek/deepseek-r1-distill-qwen-32bdeepseek/deepseek-r1-distill-qwen-14bdeepseek/deepseek-r1/communityqwen/qwen3-235b-a22b-fp8qwen/qwen3-30b-a3b-fp8qwen/qwen3-32b-fp8qwen/qwen3-8b-fp8qwen/qwen3-4b-fp8minimaxai/minimax-m1-80ksystem 消息中添加推理指令,应在 user 消息中直接明确指令。