找回密码
 立即注册

扫一扫,访问移动社区

搜索
0赞
赞赏
手机版
扫码打开手机版
把文字装进口袋

Azure OpenAI 服务配额和限制

向蓝 2023-7-14 18:35:03 IP属地:四川成都
本文将介绍一个快速参考,并详细说明了 Azure 认知服务中 Azure OpenAI 的配额和限制。
配额和限制参考
以下部分提供适用于 Azure OpenAI 默认配额和限制的快速指南:

限制名称
限制值
每个 Azure 订阅中每个区域的 OpenAI 资源30
每个模型和地区的默认配额(以每分钟令牌为单位)1Text-Davinci-003:120 K
GPT-4:20 K
GPT-4-32K:60 K
其他:240 K
默认 DALL-E 配额限制2 个并发请求
每个请求的最大提示令牌数每个模型不同。
最大微调模型部署2
每个资源的训练作业总数100
每个资源同时运行的最大训练作业数1
排队的最大训练作业数20
每个资源的最大文件数30
每个资源的所有文件的总大小1 GB
最大训练作业时间(如果超过,作业将失败)720 小时
最大训练作业大小(训练文件中的标记数)×(时期数)20 亿
注1:默认配额限制可能会更改。

保持在速率限制范围内的一般最佳做法
若要最大程度地减少与速率上限相关的问题,可以遵循以下方法:
  • 在应用程序中实现重试逻辑
  • 避免工作负载的急剧变化。 逐步增大工作负载。
  • 测试不同负载增加模式。
  • 增加分配给部署的配额。 如有必要,从另一个部署中移动配额。

您需要登录后才可以回帖 立即登录
向蓝
XBeanAi产品经理,专家领航员
返回顶部