Qwen3-VL-30B-A3B-Instruct 是一款多模态模型,将强大的文本生成能力与对图像和视频的视觉理解深度融合。其 “Instruct” 版本专为多模态任务中的指令跟随能力进行优化。 该模型在真实世界与合成场景的识别、二维/三维空间理解,以及长篇视觉内容理解等方面表现卓越,并在多模态基准测试中取得了领先的成绩。 在智能体(Agent)应用中,它能够处理多图像、多轮指令、视频时间轴对齐、GUI自动化等复杂任务,还能实现从草图到调试完善的用户界面视觉编程。 其文本生成能力与 Qwen3 系列旗舰模型相当,适用于文档智能(Document AI)、OCR识别、界面辅助、空间任务以及智能体研究等多种场景。
模型价格立即体验模型
| 输入 | ¥0.75/Mt |
| 输出 | ¥3/Mt |
示例代码
1base_url="https://api.ppinfra.com/openai"
2api_key="<您的 API Key>"
3
4curl "$base_url/v1/chat/completions" \
5 -H "Content-Type: application/json" \
6 -H "Authorization: Bearer $api_key" \
7 -d @- << 'EOF'
8{
9 "model": "qwen/qwen3-vl-30b-a3b-instruct",
10 "messages": [
11
12 {
13 "role": "user",
14 "content": "Hi there!"
15 }
16 ],
17 "response_format": { "type": "text" }
18}
19EOF
20 模型信息
上下文窗口:
131072
最大输出 token 数:
32768
模态:
支持的功能
API 接入指南
Base URL:
https://api.ppinfra.com/openai
API Endpoints:
/v1/chat/completions
Model ID:
qwen/qwen3-vl-30b-a3b-instruct
API Key:
创建 & 查询您的 API KeyRate Limits
| 用量级别 | RPM | TPM |
|---|---|---|
| T1 | 30 | 50,000,000 |
| T2 | 100 | 50,000,000 |
| T3 | 1,000 | 50,000,000 |
| T4 | 3,000 | 50,000,000 |
| T5 | 6,000 | 50,000,000 |
功能使用教程