X
XiaomiMiMo/MiMo-V2-Flash
xiaomimimo/mimo-v2-flash

Xiaomi MiMo-V2-Flash 是小米专为极致推理效率自研的总参数 309B(激活 15B)的 MoE 模型,通过引入 Hybrid 注意力架构创新 及 多层 MTP 推理加速, 在多个 Agent 测评基准上进入全球开源模型 Top 2;代码能力超过所有开源模型,比肩标杆闭源模型 Claude 4.5 Sonnet,但推理价格仅为其2.5% 且生成速度提升至 2倍,成功将大模型效果和推理效率推向极致。

模型价格立即体验模型

输入0.7/Mt
输出2.1/Mt

示例代码

一键复制
1base_url="https://api.ppinfra.com/openai"
2api_key="<您的 API Key>"
3
4curl "$base_url/v1/chat/completions" \
5  -H "Content-Type: application/json" \
6  -H "Authorization: Bearer $api_key" \
7  -d @- << 'EOF'
8{
9    "model": "xiaomimimo/mimo-v2-flash",
10    "messages": [
11        
12        {
13            "role": "user",
14            "content": "Hi there!"
15        }
16    ],
17    "response_format": { "type": "text" }
18}
19EOF
20  

模型信息

上下文窗口:

262144

最大输出 token 数:

32000

模态:

输入:
Text
输出:
Text

支持的功能

Function Calling支持
结构化输出支持
reasoning支持
Anthropic API不支持

API 接入指南

Base URL:

https://api.ppinfra.com/openai

API Endpoints:

/v1/completions/v1/chat/completions

Model ID:

xiaomimimo/mimo-v2-flash

用量级别RPMTPM
T1550,000,000
T210050,000,000
T31,00050,000,000
T43,00050,000,000
T56,00050,000,000
用更高性价比的产品服务
助您释放无限创新元力,引领智能时代新进程
马上咨询