PPIO 派欧云文档中心 home page
简体中文
搜索...
⌘K
Ask AI
控制台
返回官网
返回官网
搜索...
Navigation
大语言模型API
调用频率控制(Rate Limits)
产品公告
模型服务用户指南
模型服务 API 手册
GPU 容器用户指南
GPU 容器 API 手册
Agent 沙箱服务用户指南
账号用户指南
产品介绍
产品简介
模型广场
私有化部署
开始使用
新手指引
在线体验
大语言模型API
大语言模型
视觉语言模型
推理模型
Function Calling
结构化输出
调用频率控制
大语言模型监控
兼容 Anthropic SDK
图像及视频
图像生成模型
图像编辑模型
查找 Stable Diffusion 模型
上传自定义 LoRA 模型
调用频率控制
问题合集
常见问题
常见错误码说明
热门工具接入
教程概览
Claude Code
OpenAI Agents SDK
UI-TARS
FastGPT
OpenManus
Chatbox
Cherry Studio
Cline
Cursor
Dify
AnythingLLM
沉浸式翻译
沉浸式导读
LobeChat
NextChat
ChatHub
RAGFlow
Siri
Microsoft Word
WPS Office AI
流畅阅读
OneAPI
思源笔记
Obsidian
欧路词典
Deep Searcher
Deepchat
LangBot
AstrBot
ChatWise
Apifox
RuoYi AI
n8n
GPT4All
Zotero
在此页面
理解调用频率控制
默认调用频率控制
避免触发调用频率控制
处理429错误
大语言模型API
调用频率控制(Rate Limits)
理解调用频率控制
调用频率控制规定了在特定时间内可发起的 API 请求的数量,可以帮助优化 API 使用。
防止 API 滥用和误用
确保公平的资源分配
保持 API 性能和可靠性
保护服务的稳定性
默认调用频率控制
每个账户在调用模型时都有默认的速率限制,分别以 RPM(每分钟每个模型的请求数)和 TPM(每分钟每个模型的 token 数)为单位进行衡量。速率限制会因账户等级不同而有所差异,具体标准见下方表格。
Quota 等级
资质(单位:人民币元)
T1
最近 3 个自然月中,单月最高充值总金额< ¥50
T2
¥50 ≤ 最近 3 个自然月中,单月最高充值总金额< ¥500
T3
¥500 ≤ 最近 3 个自然月中,单月最高充值总金额< ¥3000
T4
¥3000 ≤ 最近 3 个自然月中,单月最高充值总金额< ¥10000
T5
¥10000 ≤ 最近 3 个自然月中,单月最高充值总金额
各等级的默认速率限制(RPM / TPM):
避免触发调用频率控制
如果您的 API 请求数量超过了调用频率控制,API 将返回:
HTTP 状态码:429(请求过多)。
响应体中返回调用频率超出的信息。
为避免触发调用频率控制,您可以采取以下措施:
在您的应用中实现请求限制。
在重试时使用指数退避机制。
监控您的 API 使用情况。
处理429错误
如果您收到 429 错误,您可以尝试以下操作:
稍后再试
:等待一段时间后再重试您的请求。
优化请求
:减少请求频率。
提高调用频率控制
:如果需要更高的调用频率控制,可以联系我们。
结构化输出
大语言模型监控
助手
Responses are generated using AI and may contain mistakes.