本文将介绍一个快速参考,并详细说明了 Azure 认知服务中 Azure OpenAI 的配额和限制。 配额和限制参考
以下部分提供适用于 Azure OpenAI 默认配额和限制的快速指南:
限制名称 | 限制值 | 每个 Azure 订阅中每个区域的 OpenAI 资源 | 30 | 每个模型和地区的默认配额(以每分钟令牌为单位)1 | Text-Davinci-003:120 K
GPT-4:20 K
GPT-4-32K:60 K
其他:240 K | 默认 DALL-E 配额限制 | 2 个并发请求 | 每个请求的最大提示令牌数 | 每个模型不同。 | 最大微调模型部署 | 2 | 每个资源的训练作业总数 | 100 | 每个资源同时运行的最大训练作业数 | 1 | 排队的最大训练作业数 | 20 | 每个资源的最大文件数 | 30 | 每个资源的所有文件的总大小 | 1 GB | 最大训练作业时间(如果超过,作业将失败) | 720 小时 | 最大训练作业大小(训练文件中的标记数)×(时期数) | 20 亿 |
注1:默认配额限制可能会更改。
保持在速率限制范围内的一般最佳做法
若要最大程度地减少与速率上限相关的问题,可以遵循以下方法: - 在应用程序中实现重试逻辑
- 避免工作负载的急剧变化。 逐步增大工作负载。
- 测试不同负载增加模式。
- 增加分配给部署的配额。 如有必要,从另一个部署中移动配额。
|