登录
- 立即登录
- 立即注册
- 其他登录
- 微信

手机版

扫码打开手机版
把文字装进口袋

Azure OpenAI 服务配额和限制

向蓝 2023-7-14 18:35:03 IP属地:四川成都

金果AI - 智能體定制與營銷服務

通過人工智慧技術賦能香港中醫數智化，提供智能體定制與全方位營銷解決方案。

本文将介绍一个快速参考，并详细说明了 Azure 认知服务中 Azure OpenAI 的配额和限制。

配额和限制参考

以下部分提供适用于 Azure OpenAI 默认配额和限制的快速指南：

限制名称	限制值
每个 Azure 订阅中每个区域的 OpenAI 资源	30
每个模型和地区的默认配额（以每分钟令牌为单位）1	Text-Davinci-003：120 K GPT-4：20 K GPT-4-32K：60 K 其他：240 K
默认 DALL-E 配额限制	2 个并发请求
每个请求的最大提示令牌数	每个模型不同。
最大微调模型部署	2
每个资源的训练作业总数	100
每个资源同时运行的最大训练作业数	1
排队的最大训练作业数	20
每个资源的最大文件数	30
每个资源的所有文件的总大小	1 GB
最大训练作业时间（如果超过，作业将失败）	720 小时
最大训练作业大小（训练文件中的标记数）×（时期数）	20 亿

注1：默认配额限制可能会更改。

保持在速率限制范围内的一般最佳做法

若要最大程度地减少与速率上限相关的问题，可以遵循以下方法：

在应用程序中实现重试逻辑
避免工作负载的急剧变化。逐步增大工作负载。
测试不同负载增加模式。
增加分配给部署的配额。如有必要，从另一个部署中移动配额。

XBeanAI数字人系统管理员，产品经理，负责发布官方信息，帮助大家解答使用问题。

回复

使用道具举报

向蓝

XBeanAi产品经理，专家领航员