DeepSeek-V4-Flash是DeepSeek打造的兼顾极致响应速度与高性价比的轻量级模型。得益于更精简的模型参数与极低的激活开销,V4-Flash 能够为您提供更加快捷、经济的 API 接口服务。在核心能力方面,V4-Flash 展现出了与 V4-Pro 高度接近的卓越推理水准;尽管在世界知识储备上略微精简,但依然能满足绝大多数应用场景的需求。在智能体(Agent)应用中,V4-Flash 在处理各类常规与基础任务时,表现与 Pro 版本旗鼓相当。作为追求高并发、低延迟与成本控制的理想之选,DeepSeek-V4-Flash 为大规模、高频次的轻量级 AI 任务部署提供了最优解。
模型价格立即体验模型
| 输入 | ¥1/Mt |
| 缓存 | Cached reads¥0.2/Mt |
| 输出 | ¥2/Mt |
示例代码
1base_url="https://api.ppio.com/openai"
2api_key="<您的 API Key>"
3
4curl "$base_url/v1/chat/completions" \
5 -H "Content-Type: application/json" \
6 -H "Authorization: Bearer $api_key" \
7 -d @- << 'EOF'
8{
9 "model": "deepseek/deepseek-v4-flash",
10 "messages": [
11
12 {
13 "role": "user",
14 "content": "Hi there!"
15 }
16 ],
17 "response_format": { "type": "text" }
18}
19EOF
20 模型信息
上下文窗口:
1048576
最大输出 token 数:
393216
模态:
支持的功能
API 接入指南
Base URL:
https://api.ppio.com/openai
Anthropic Base URL:
https://api.ppio.com/anthropic
API Endpoints:
/v1/chat/completions
Model ID:
deepseek/deepseek-v4-flash
API Key:
创建 & 查询您的 API KeyRate Limits
| 用量级别 | RPM | TPM |
|---|---|---|
| T1 | 5 | 50,000,000 |
| T2 | 100 | 50,000,000 |
| T3 | 1,000 | 50,000,000 |
| T4 | 3,000 | 50,000,000 |
| T5 | 6,000 | 50,000,000 |
功能使用教程