Qwen3-235B-A22B-Instruct-2507 是基于 Qwen3-235B 架构的多语言指令微调混合专家语言模型,每次前向推理激活 220 亿参数。该模型针对通用文本生成任务优化,涵盖指令遵循、逻辑推理、数学计算、代码生成及工具调用等能力。其原生支持 26.2 万 token 的超长上下文窗口,且未采用 "<think>" 思维链显式标注模式。 相较于基础版本,本版本在知识覆盖广度、长文本推理能力、编程基准测试以及开放性任务对齐度等方面实现显著提升。模型尤其擅长多语言理解、数学推理(如美国数学邀请赛 AIME、哈佛-麻省理工数学锦标赛 HMMT),并在 Arena-Hard 综合评测与写作专项评测 WritingBench 中表现优异。
模型价格立即体验模型
| 输入 | ¥1.45/Mt |
| 输出 | ¥5.8/Mt |
示例代码
1base_url="https://api.ppinfra.com/openai"
2api_key="<您的 API Key>"
3
4curl "$base_url/v1/chat/completions" \
5 -H "Content-Type: application/json" \
6 -H "Authorization: Bearer $api_key" \
7 -d @- << 'EOF'
8{
9 "model": "qwen/qwen3-235b-a22b-instruct-2507",
10 "messages": [
11
12 {
13 "role": "user",
14 "content": "Hi there!"
15 }
16 ],
17 "response_format": { "type": "text" }
18}
19EOF
20 模型信息
上下文窗口:
262144
最大输出 token 数:
260000
模态:
支持的功能
API 接入指南
Base URL:
https://api.ppinfra.com/openai
API Endpoints:
/v1/chat/completions/v1/completions/v1/batch-api
Model ID:
qwen/qwen3-235b-a22b-instruct-2507
API Key:
创建 & 查询您的 API KeyRate Limits
| 用量级别 | RPM | TPM |
|---|---|---|
| T1 | 10 | 50,000,000 |
| T2 | 100 | 50,000,000 |
| T3 | 1,000 | 50,000,000 |
| T4 | 3,000 | 50,000,000 |
| T5 | 6,000 | 50,000,000 |
功能使用教程