D
DeepSeek-OCR 2
deepseek/deepseek-ocr-2

DeepSeek-OCR 2 是 DeepSeek AI 发布的多模态文档识别模型,作为 DeepSeek-OCR 的升级版本,通过引入 DeepEncoder V2 架构,实现了视觉编码从「固定扫描」向「语义推理」的范式转变。该模型将原有 CLIP 编码器替换为轻量级语言模型(Qwen2-0.5B),并引入因果流查询机制,解码器沿用 DeepSeek-3B-MoE。模型仅需 256 至 1120 个视觉 Token 即可覆盖复杂文档页面,在 OmniDocBench v1.5 评测中综合得分达 91.09%,较前代提升 3.73%,阅读顺序识别编辑距离从 0.085 降至 0.057。

模型价格立即体验模型

输入0.216/Mt
输出0.216/Mt

示例代码

一键复制
1base_url="https://api.ppio.com/openai"
2api_key="<您的 API Key>"
3
4curl "$base_url/v1/chat/completions" \
5  -H "Content-Type: application/json" \
6  -H "Authorization: Bearer $api_key" \
7  -d @- << 'EOF'
8{
9    "model": "deepseek/deepseek-ocr-2",
10    "messages": [
11        
12        {
13            "role": "user",
14            "content": "Hi there!"
15        }
16    ],
17    "response_format": { "type": "text" }
18}
19EOF
20  

模型信息

上下文窗口:

8192

最大输出 token 数:

8192

模态:

输入:
TextImage
输出:
Text

支持的功能

Function Calling不支持
结构化输出不支持
reasoning不支持
Anthropic API不支持

API 接入指南

Base URL:

https://api.ppio.com/openai

API Endpoints:

/v1/chat/completions

Model ID:

deepseek/deepseek-ocr-2

用量级别RPMTPM
T1550,000,000
T210050,000,000
T31,00050,000,000
T43,00050,000,000
T56,00050,000,000
用更高性价比的产品服务
助您释放无限创新元力,引领智能时代新进程
马上咨询