PPIO - 中国领先的分布式云计算服务商

Qwen3 Next 80B A3B Instruct

qwen/qwen3-next-80b-a3b-instruct

Qwen3-Next采用高度稀疏的混合专家(MoE)架构设计：模型总参数量达800亿，但每次推理仅激活约30亿参数。实验数据显示，在全局负载均衡机制下，保持激活专家数量不变而持续增加总专家参数量，能有效降低训练损失。相比前代Qwen3的MoE架构（128个总专家，8个路由专家），Qwen3-Next将专家规模扩展至512个，创新采用"10个路由专家+1个共享专家"的组合方案，在最大化资源利用率的同时确保性能无损。特别值得注意的是，Qwen3-Next-80B-A3B-Instruct版本在性能表现上已接近我们的旗舰模型Qwen3-235B-A22B-Instruct-2507，并在处理超长上下文（最高支持256K tokens）的任务中展现出显著优势。

模型价格立即体验模型

输入	￥1/Mt
输出	￥4/Mt

示例代码

一键复制

1base_url="https://api.ppio.com/openai"
2api_key="<您的 API Key>"
3
4curl "$base_url/v1/chat/completions" \
5  -H "Content-Type: application/json" \
6  -H "Authorization: Bearer $api_key" \
7  -d @- << 'EOF'
8{
9    "model": "qwen/qwen3-next-80b-a3b-instruct",
10    "messages": [
11        
12        {
13            "role": "user",
14            "content": "Hi there!"
15        }
16    ],
17    "response_format": { "type": "text" }
18}
19EOF
20

模型信息

上下文窗口:

65536

最大输出 token 数:

65536

模态:

输入:

Text

输出:

Text

支持的功能

Function Calling支持

结构化输出支持

reasoning不支持

Anthropic API支持

API 接入指南

Base URL:

https://api.ppio.com/openai

Anthropic Base URL:

https://api.ppio.com/anthropic

API Endpoints:

/v1/chat/completions/v1/completions

Model ID:

qwen/qwen3-next-80b-a3b-instruct

API Key:

创建 & 查询您的 API Key

Rate Limits

关于 Rate Limits |去充值

用量级别	RPM	TPM
T1	5	50,000,000
T2	100	50,000,000
T3	1,000	50,000,000
T4	3,000	50,000,000
T5	6,000	50,000,000

常见工具接入

Chatbox 接入教程 Cherry Studio 接入教程 Cursor 接入教程 Dify 接入教程 Claude Code 接入教程查看更多教程

功能使用教程

Function Calling 结构化输出

用更高性价比的产品服务

助您释放无限创新元力，引领智能时代新进程

马上咨询