Q
Qwen3 4B
qwen/qwen3-4b-fp8

实现思考模式和非思考模式的有效融合,可在对话中切换模式。推理能力达到同规模业界SOTA水平、模型人类偏好能力显著增强,创意写作、角色扮演、多轮对话、指令遵循能力均有明显提升,用户体验预期明显更佳。

模型价格立即体验模型

输入0.2145/Mt0.2145/Mt
输出0.2145/Mt0.2145/Mt

示例代码

一键复制
1base_url="https://api.ppinfra.com/openai"
2api_key="<您的 API Key>"
3
4curl "$base_url/v1/chat/completions" \
5  -H "Content-Type: application/json" \
6  -H "Authorization: Bearer $api_key" \
7  -d @- << 'EOF'
8{
9    "model": "qwen/qwen3-4b-fp8",
10    "messages": [
11        
12        {
13            "role": "user",
14            "content": "Hi there!"
15        }
16    ],
17    "response_format": { "type": "text" }
18}
19EOF
20  

模型信息

上下文窗口:

128000

最大输出 token 数:

20000

模态:

输入:
Text
输出:
Text

支持的功能

Function Calling不支持
结构化输出不支持
reasoning支持
Anthropic API不支持

API 接入指南

Base URL:

https://api.ppinfra.com/openai

API Endpoints:

/v1/chat/completions/v1/completions/v1/batch-api

Model ID:

qwen/qwen3-4b-fp8

用量级别RPMTPM
T15050,000,000
T21,00050,000,000
T31,00050,000,000
T41,00050,000,000
T51,00050,000,000
用更高性价比的产品服务
助您释放无限创新元力,引领智能时代新进程
马上咨询