PPIO - 中国领先的分布式云计算服务商

XiaomiMiMo/MiMo-V2-Flash

xiaomimimo/mimo-v2-flash

Xiaomi MiMo-V2-Flash 是小米专为极致推理效率自研的总参数 309B(激活 15B)的 MoE 模型，通过引入 Hybrid 注意力架构创新及多层 MTP 推理加速，在多个 Agent 测评基准上进入全球开源模型 Top 2;代码能力超过所有开源模型，比肩标杆闭源模型 Claude 4.5 Sonnet，但推理价格仅为其2.5% 且生成速度提升至 2倍，成功将大模型效果和推理效率推向极致。

模型价格立即体验模型

输入	￥0.7/Mt
缓存	Cached reads￥0.07/Mt
输出	￥2.1/Mt

示例代码

一键复制

1base_url="https://api.ppio.com/openai"
2api_key="<您的 API Key>"
3
4curl "$base_url/v1/chat/completions" \
5  -H "Content-Type: application/json" \
6  -H "Authorization: Bearer $api_key" \
7  -d @- << 'EOF'
8{
9    "model": "xiaomimimo/mimo-v2-flash",
10    "messages": [
11        
12        {
13            "role": "user",
14            "content": "Hi there!"
15        }
16    ],
17    "response_format": { "type": "text" }
18}
19EOF
20

模型信息

上下文窗口:

262144

最大输出 token 数:

32000

模态:

输入:

Text

输出:

Text

支持的功能

Function Calling支持

结构化输出支持

reasoning支持

Anthropic API不支持

API 接入指南

Base URL:

https://api.ppio.com/openai

API Endpoints:

/v1/completions/v1/chat/completions

Model ID:

xiaomimimo/mimo-v2-flash

API Key:

创建 & 查询您的 API Key

Rate Limits

关于 Rate Limits |去充值

用量级别	RPM	TPM
T1	5	50,000,000
T2	100	50,000,000
T3	1,000	50,000,000
T4	3,000	50,000,000
T5	6,000	50,000,000

常见工具接入

Chatbox 接入教程 Cherry Studio 接入教程 Cursor 接入教程 Dify 接入教程 Claude Code 接入教程查看更多教程

功能使用教程

Function Calling 结构化输出

用更高性价比的产品服务

助您释放无限创新元力，引领智能时代新进程

马上咨询