Qwen2.5-VL 是 Qwen2.5 系列最新推出的视觉语言模型。该模型在多方面有显著提升:具备更强的视觉理解能力,能够识别常见物体、分析文本、图表和布局;作为视觉代理能够推理并动态指导工具使用;支持理解超过 1 小时的长视频并捕捉关键事件;能够通过生成边界框或点准确定位图像中的物体;支持生成结构化输出,尤其适用于发票、表格等扫描数据。模型在多项基准测试中表现出色,包括图像、视频和代理任务评测。
模型价格立即体验模型
| 输入 | ¥4.2/Mt |
| 输出 | ¥4.2/Mt |
示例代码
1base_url="https://api.ppinfra.com/openai"
2api_key="<您的 API Key>"
3
4curl "$base_url/v1/chat/completions" \
5 -H "Content-Type: application/json" \
6 -H "Authorization: Bearer $api_key" \
7 -d @- << 'EOF'
8{
9 "model": "qwen/qwen2.5-vl-72b-instruct",
10 "messages": [
11
12 {
13 "role": "user",
14 "content": "Hi there!"
15 }
16 ],
17 "response_format": { "type": "text" }
18}
19EOF
20 模型信息
上下文窗口:
32000
最大输出 token 数:
32000
模态:
支持的功能
API 接入指南
Base URL:
https://api.ppinfra.com/openai
API Endpoints:
/v1/chat/completions/v1/completions/v1/batch-api
Model ID:
qwen/qwen2.5-vl-72b-instruct
API Key:
创建 & 查询您的 API KeyRate Limits
| 用量级别 | RPM | TPM |
|---|---|---|
| T1 | 20 | 50,000,000 |
| T2 | 100 | 50,000,000 |
| T3 | 1,000 | 50,000,000 |
| T4 | 3,000 | 50,000,000 |
| T5 | 6,000 | 50,000,000 |
功能使用教程