429,并附带 Retry-After 响应头(单位:秒)。
推荐节流
| 路径 | 建议 RPM | 说明 |
|---|---|---|
POST /v1/chat/completions | ≤ 60 | 流式调用同样计数;请等一次调用结束后再发起下一次 |
POST /v1/files | ≤ 30 | 尽量批量处理;OCR 计算开销较大 |
POST /v1/data | ≤ 120 | 将记录批量合并到一次请求中(每批最多 1000 条) |
GET 读取(/v1/data、/v1/files、/v1/models) | ≤ 120 | — |
精确阈值会按部署逐一注入。上线前请邮件联系 Mirobody Support,确认你账户的限额。
客户端退避
- 收到
429时,遵守Retry-After——切勿立即重试。 - 连续两次
429后将退避时长翻倍,上限为 5 分钟。 - 不要并行发起 chat 调用;先让每个流式调用完成。