> ## Documentation Index
> Fetch the complete documentation index at: https://docs.mirobody.ai/llms.txt
> Use this file to discover all available pages before exploring further.

# 限流

> 配额机制 + 客户端节流。

Mirobody 按**账户 × 路径 × 分钟**计数请求。超额时会返回 HTTP `429`，并附带 `Retry-After` 响应头（单位：秒）。

```text theme={null}
HTTP/1.1 429 Too Many Requests
Retry-After: 47
```

## 推荐节流

| 路径                                            | 建议 RPM | 说明                         |
| --------------------------------------------- | ------ | -------------------------- |
| `POST /v1/chat/completions`                   | ≤ 60   | 流式调用同样计数；请等一次调用结束后再发起下一次   |
| `POST /v1/files`                              | ≤ 30   | 尽量批量处理；OCR 计算开销较大          |
| `POST /v1/data`                               | ≤ 120  | 将记录批量合并到一次请求中（每批最多 1000 条） |
| `GET` 读取（`/v1/data`、`/v1/files`、`/v1/models`） | ≤ 120  | —                          |

<Note>
  精确阈值会按部署逐一注入。**上线前请邮件联系 [Mirobody Support](mailto:developer@thetahealth.ai)，确认你账户的限额。**
</Note>

## 客户端退避

* 收到 `429` 时，**遵守 `Retry-After`**——切勿立即重试。
* 连续两次 `429` 后将退避时长翻倍，上限为 5 分钟。
* 不要并行发起 chat 调用；先让每个流式调用完成。
