Qwen3-Next采用高度稀疏的混合专家(MoE)架构设计:模型总参数量达800亿,但每次推理仅激活约30亿参数。实验数据显示,在全局负载均衡机制下,保持激活专家数量不变而持续增加总专家参数量,能有效降低训练损失。相比前代Qwen3的MoE架构(128个总专家,8个路由专家),Qwen3-Next将专家规模扩展至512个,创新采用"10个路由专家+1个共享专家"的组合方案,在最大化资源利用率的同时确保性能无损。 特别值得注意的是,Qwen3-Next-80B-A3B-Instruct版本在性能表现上已接近我们的旗舰模型Qwen3-235B-A22B-Instruct-2507,并在处理超长上下文(最高支持256K tokens)的任务中展现出显著优势。
模型价格立即体验模型
| 输入 | 活动价¥1/Mt¥1/Mt |
| 输出 | 活动价¥4/Mt¥4/Mt |
示例代码
1base_url="https://api.ppinfra.com/openai"
2api_key="<您的 API Key>"
3
4curl "$base_url/v1/chat/completions" \
5 -H "Content-Type: application/json" \
6 -H "Authorization: Bearer $api_key" \
7 -d @- << 'EOF'
8{
9 "model": "qwen/qwen3-next-80b-a3b-instruct",
10 "messages": [
11
12 {
13 "role": "user",
14 "content": "Hi there!"
15 }
16 ],
17 "response_format": { "type": "text" }
18}
19EOF
20 模型信息
上下文窗口:
65536
最大输出 token 数:
65536
模态:
支持的功能
API 接入指南
Base URL:
https://api.ppinfra.com/openai
Anthropic Base URL:
https://api.ppinfra.com/anthropic
API Endpoints:
/v1/chat/completions/v1/completions
Model ID:
qwen/qwen3-next-80b-a3b-instruct
API Key:
创建 & 查询您的 API KeyRate Limits
| 用量级别 | RPM | TPM |
|---|---|---|
| T1 | 30 | 50,000,000 |
| T2 | 100 | 50,000,000 |
| T3 | 1,000 | 50,000,000 |
| T4 | 3,000 | 50,000,000 |
| T5 | 6,000 | 50,000,000 |
功能使用教程