MiniMax-M3 是 MiniMax 推出的一款多模态基础模型。它支持文本、图像和视频输入以及文本输出,具备 100 万 token 的上下文窗口,非常适合长周期的智能体(Agent)任务、编程和工具使用。 该模型基于 MiniMax 稀疏注意力机制(MSA)构建,通过 KV 块选择替代全注意力机制,从而大幅降低长上下文环境下的单 token 计算量——在处理 100 万 token 时,计算成本仅约为上一代的 1/20。在绝大多数任务中保持模型质量的同时,其预填充(prefill)和解码(decode)速度均得到了显著提升。 作为一个原生多模态模型,MiniMax-M3 在交错数据上进行了训练,并通过交互式用户模拟器框架针对多轮、生产级协作进行了微调。因此,该模型主要面向持续的多步任务,而非单轮执行。
模型价格立即体验模型
| 输入 | ¥8.4/Mt |
| 缓存 | Cached reads¥1.68/Mt |
| 输出 | ¥33.6/Mt |
阶梯计费
| 每次请求输入长度 | 输入价格(每百万 tokens) | 输出价格(每百万 tokens) | Cached reads(每百万 tokens) |
| 1 <= tokens < 524288 | ¥2.1 | ¥8.4 | ¥0.42 |
| 524288 <= tokens < 1000000 | ¥8.4 | ¥33.6 | ¥1.68 |
示例代码
1base_url="https://api.ppio.com/openai"
2api_key="<您的 API Key>"
3
4curl "$base_url/v1/chat/completions" \
5 -H "Content-Type: application/json" \
6 -H "Authorization: Bearer $api_key" \
7 -d @- << 'EOF'
8{
9 "model": "minimax/minimax-m3",
10 "messages": [
11
12 {
13 "role": "user",
14 "content": "Hi there!"
15 }
16 ],
17 "response_format": { "type": "text" }
18}
19EOF
20 模型信息
上下文窗口:
1000000
最大输出 token 数:
131072
模态:
支持的功能
API 接入指南
Base URL:
https://api.ppio.com/openai
Anthropic Base URL:
https://api.ppio.com/anthropic
API Endpoints:
/v1/chat/completions
Model ID:
minimax/minimax-m3
API Key:
创建 & 查询您的 API KeyRate Limits
| 用量级别 | RPM | TPM |
|---|---|---|
| T1 | 5 | 50,000,000 |
| T2 | 100 | 50,000,000 |
| T3 | 1,000 | 50,000,000 |
| T4 | 3,000 | 50,000,000 |
| T5 | 6,000 | 50,000,000 |
功能使用教程