Ограничения службы агентов Foundry, квоты и региональная поддержка

Служба агента Foundry применяет свои квоты и ограничения к артефактам агента, загрузке файлов, сообщениям и регистрации инструментов. Общие сведения об этих ограничениях помогают создавать приложения, масштабируемые без ограничения службы. В этой статье перечислены ограничения по умолчанию, поддерживаемые регионы, совместимые модели и рекомендации по обработке ошибок ограничения.

Примечание

Служба агента Foundry общедоступна. Некоторые вложенные функции находятся в общедоступной предварительной версии и могут иметь различные ограничения.

Необходимые условия

Подписка Azure.
Проект Microsoft Foundry.
Развернутая модель, совместимая с Agent Service. Доступность модели и региона может отличаться.

Поддерживаемые регионы

В следующей таблице показана региональная поддержка API ответов, агентов и диапазонов IP-адресов частного класса A.

Region	API для ответов	Агенты	Класс A*
Australia East	Yes	Yes	Yes
Южная Бразилия	Yes	Yes	Yes
Центральная Канада	Yes	Yes	No
Восточная Канада	Yes	Yes	Yes
Центральная часть США	Yes	Yes	Yes
Восток США	Yes	Yes	Yes
Восток США 2	Yes	Yes	Yes
France Central	Yes	Yes	Yes
Западно-Центральная Германия	Yes	Yes	Yes
Северная Италия	Yes	Yes	Yes
Japan East	Yes	Yes	Yes
Japan West	Yes	Yes	No
Центральная Корея	Yes	Yes	Yes
северо-центральная часть США	Yes	Yes	Yes
Восточная Норвегия	Yes	Yes	No
Poland Central	Yes	Yes	No
Север Южной Африки	Yes	Yes	Yes
Южно-Центральный регион США	Yes	Yes	Yes
Юго-Восточная Азия	Yes	Yes	Yes
Южная Индия	Yes	Yes	Yes
Spain Central	Yes	Yes	Yes
Центральная Швеция	Yes	Yes	Yes
Северная Швейцария	Yes	Yes	No
Switzerland West	Yes	Yes	No
UAE North	Yes	Yes	Yes
южная часть Соединенного Королевства	Yes	Yes	Yes
Центрально-западная часть США	Yes	Yes	No
Западная Европа	Yes	Yes	Yes
West US	Yes	Yes	Yes
Западная часть США 3	Yes	Yes	Yes

* Класс A относится к поддержке диапазонов IP-адресов частного класса A (10.x.x.x.x). Дополнительные сведения о требованиях к сети см. в разделе "Региональная поддержка частных сетей".

Некоторые модели OpenAI Azure недоступны в каждом регионе. Дополнительные сведения см. в разделе "Доступность регионов для моделей Foundry", проданных Azure.

Важно

Не все средства доступны в каждом регионе. Например, поиск по файлам недоступен в Италии Северная и Южная Бразилия. Полная матрица инструментов по регионам и моделям, см. раздел "Поддержка инструментов по регионам и моделям".

Региональная поддержка частных сетей

При использовании конфигурации частной сети, такой как защищенный сетью стандартный агент, применяются следующие региональные требования:

Ресурс Foundry и регион виртуальной сети. Необходимо развернуть ресурс Foundry в том же регионе, что и виртуальная сеть. Вы можете развернуть другие ресурсы Azure, такие как Azure Cosmos DB, Поиск с использованием ИИ Azure и служба хранилища Azure в разных регионах. Рассмотрим последствия затрат для развертываний между регионами.
Обоснование с помощью поиска Bing. Поддерживаются только следующие регионы: Западная Европа, Восточная Канада, Северная Швейцария, Центральная Испания, Северная часть ОАЭ, Центральная Корея, Центральная Польша, Юго-Восточная Азия, Западная часть США, Западная часть США 2, Западная часть США 3, Восточная часть США, Восточная часть США 2, Центральная часть США, Южная Индия, Восточная часть Японии, Южная часть Великобритании, Центральная Франция, Восточная Норвегия, Восточная Австралия, Центральная Канада, Центральная Швеция, Северная часть ЮАР, Северная Италия, Южная Бразилия.

Дополнительные сведения см. в статье "Использование виртуальной сети с помощью службы агента Foundry".

Поддерживаемые модели

Служба Agent поддерживает модели Azure OpenAI и несколько моделей Foundry, предлагаемых Azure. Доступность модели может меняться с течением времени и зависит от региона. Чтобы просмотреть полный список моделей, которые можно развернуть для проекта и региона, используйте интерфейс модели портала Foundry.

Суверенные облака

Служба Foundry Agent Service также доступна в Azure для государственных организаций (US Gov Virginia и US Gov Arizona) с ограниченным набором типов агентов и инструментов. Полный список поддерживаемых функций см. в разделе "Доступность функций службы агента Foundry" в Azure для государственных организаций.

Поддержка инструментов по регионам и моделям

Регион и модель определяют, какие средства доступны агенту. В следующих таблицах "Да " означает полную поддержку, "Нет " не поддерживается и Limited означает частичную поддержку, которая зависит от конфигурации средства. Дополнительные сведения см. в документации по отдельным инструментам.

В следующей таблице показано, какие средства доступны в каждом поддерживаемом регионе. Эта таблица учитывает только доступность службы, поэтому убедитесь, что модель, которую вы хотите использовать, также доступна в том же регионе.

Нажмите, чтобы развернуть

Region	Agent2Agent	Поиск с использованием ИИ Azure	Автоматизация браузера	Интерпретатор кода	Использование компьютера	Агент данных Fabric	Поиск файлов	Function	Обоснование с помощью Bing Custom Search	Ознакомление с поиском Bing	Генерация изображений	MCP	OpenAPI	Sharepoint	Web Search
Australia East	yes	yes	yes	yes	no	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes
Южная Бразилия	yes	yes	yes	yes	no	yes	yes	no	yes	yes	yes	yes	yes	yes	yes
Восточная Канада	yes	yes	yes	yes	no	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes
Восток США	yes	yes	yes	yes	no	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes
Восток США 2	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes
France Central	yes	yes	yes	yes	no	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes
Западно-Центральная Германия	yes	yes	yes	yes	no	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes
Северная Италия	yes	yes	yes	yes	no	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes
Japan East	yes	yes	yes	yes	no	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes
Центральная Корея	yes	yes	yes	yes	no	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes
северо-центральная часть США	yes	yes	yes	yes	no	yes	yes	no	yes	yes	yes	yes	yes	yes	yes
Восточная Норвегия	yes	yes	yes	yes	no	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes
Poland Central	yes	yes	yes	yes	no	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes
Север Южной Африки	yes	yes	yes	yes	no	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes
Южно-Центральный регион США	yes	yes	yes	no	no	yes	yes	no	yes	yes	yes	yes	yes	yes	yes
Юго-Восточная Азия	yes	yes	yes	yes	no	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes
Южная Индия	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes
Spain Central	yes	yes	yes	no	no	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes
Центральная Швеция	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes
Северная Швейцария	yes	yes	yes	yes	no	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes
UAE North	yes	yes	yes	yes	no	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes
южная часть Соединенного Королевства	yes	yes	yes	yes	no	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes
West US	yes	yes	yes	yes	no	yes	yes	no	yes	yes	yes	yes	yes	yes	yes
Западная часть США 3	yes	yes	yes	yes	no	yes	yes	yes	yes	yes	yes	yes	yes	yes	yes

В следующей таблице показано, какие средства поддерживают каждую модель. Для инструмента генерации изображений вам нужны и модель gpt-image-1, и крупная языковая модель (LLM), которая будет выступать в роли оркестратора, в рамках одного и того же проекта Microsoft Foundry.

Нажмите, чтобы развернуть

Модель	Agent2Agent	Поиск с использованием ИИ Azure	Функции Azure	Основы Bing Custom	Привязка к Bing Search	Автоматизация браузера	Интерпретатор кода	Использование компьютера	Агент данных Fabric	Поиск файлов	Functions	Генерация изображений	MCP	OpenAPI	Sharepoint	Web Search	Work IQ (предварительная версия)
Cohere-command-r	No	No	No	No	No	No	Yes	No	No	Yes	No	No	No	No	No	No	No
Cohere-command-r-plus	No	No	No	No	No	No	Yes	No	No	Yes	No	No	No	No	No	No	No
DeepSeek-R1-0528	No	No	No	No	No	No	Yes	No	No	Yes	No	No	No	No	No	No	No
DeepSeek-V3-0324	No	Yes	No	Yes	Yes	Yes	Yes	No	Yes	Yes	Yes	No	Yes	Yes	Yes	Yes	Yes
DeepSeek-V3.1	No	No	No	Yes	Yes	Yes	Yes	No	Yes	Yes	Yes	No	Yes	Yes	Yes	Yes	Yes
FW-DeepSeek-V3.1	No	Yes	No	No	No	No	Yes	No	Yes	Yes	No	No	Yes	Yes	No	Yes	Yes
FW-DeepSeek-V3.2	No	Yes	No	No	No	No	Yes	No	Yes	Yes	No	No	Yes	Yes	No	Yes	Yes
FW-GLM-4.7	No	Yes	No	No	No	No	Yes	No	Yes	Yes	No	No	Yes	Yes	No	Yes	Yes
FW-GLM-5	No	Yes	No	No	No	No	Yes	No	Yes	Yes	No	No	Yes	Yes	No	Yes	Yes
FW-GLM-5.1	No	Yes	No	No	No	No	Yes	No	Yes	Yes	No	No	Yes	Yes	No	Yes	Yes
FW-GPT-OSS-120B	No	Yes	No	No	No	No	Yes	No	Yes	Yes	No	No	Yes	Yes	No	Yes	Yes
FW-Kimi-K2-Instruct-0905	No	Yes	No	No	No	No	Yes	No	Yes	Yes	No	No	Yes	Yes	No	Yes	Yes
FW-Kimi-K2-Thinking	No	Yes	No	No	No	No	Yes	No	Yes	Yes	No	No	Yes	Yes	No	Yes	Yes
FW-Kimi-K2.5	No	No	No	No	No	No	Yes	No	Yes	Yes	No	No	Yes	Yes	No	Yes	Yes
FW-Kimi-K2.6	No	No	No	No	No	No	Yes	No	Yes	Yes	No	No	Yes	Yes	No	Yes	Yes
FW-MiniMax-M2.5	No	Yes	No	No	No	No	Yes	No	Yes	Yes	No	No	Yes	Yes	No	Yes	Yes
FW-Qwen3.5-122B-A10B	No	Yes	No	No	No	No	Yes	No	Yes	Yes	No	No	Yes	Yes	No	Yes	Yes
FW-Qwen3.5-397B-A17B	No	Yes	No	No	No	No	Yes	No	Yes	Yes	No	No	Yes	Yes	No	Yes	Yes
GROK-4-20-REASONING	No	Yes	No	Yes	Yes	Yes	Yes	No	Yes	Yes	Yes	No	Yes	Yes	Yes	Yes	Yes
Llama-3.3-70B-Instruct	No	Yes	No	Yes	Yes	Yes	Yes	No	Yes	Yes	Yes	No	Yes	Yes	Yes	Yes	Yes
Llama-4-Maverick-17B-128E-Instruct-FP8	No	Yes	No	Yes	Yes	Yes	Yes	No	Yes	Yes	Yes	No	Yes	Yes	Yes	Yes	Yes
Llama-4-Scout-17B-16E-Instruct	No	No	No	No	No	No	Yes	No	No	Yes	No	No	No	No	No	No	No
MAI-DS-R1	Yes	No	No	No	No	Yes	Yes	No	No	Yes	Yes	No	Yes	No	No	No	No
Meta-Llama-3.1-405B-Instruct	No	No	No	No	No	No	Yes	No	No	Yes	No	No	No	No	No	No	No
Mistral-large-2407	No	No	No	No	No	No	Yes	No	No	Yes	No	No	No	No	No	No	No
claude-haiku-4-5	Yes	Yes	No	No	No	Yes	Yes	No	Yes	Yes	No	No	Yes	Yes	Yes	Yes	Yes
claude-mythos-preview	Yes	Yes	No	No	No	Yes	Yes	No	Yes	Yes	No	No	Yes	Yes	Yes	Yes	Yes
claude-opus-4-1	Yes	Yes	No	No	No	Yes	Yes	No	Yes	Yes	No	No	No	Yes	Yes	Yes	Yes
claude-opus-4-5	Yes	Yes	No	No	No	Yes	Yes	No	Yes	Yes	No	No	Yes	Yes	Yes	Yes	Yes
claude-opus-4-6	Yes	Yes	No	No	No	Yes	Yes	No	Yes	Yes	No	No	Yes	Yes	Yes	Yes	Yes
claude-opus-4-7	Yes	Yes	No	No	No	Yes	Yes	No	Yes	Yes	No	No	Yes	Yes	Yes	Yes	Yes
claude-sonnet-4-5	Yes	Yes	No	No	No	Yes	Yes	No	Yes	Yes	No	No	Yes	Yes	Yes	Yes	Yes
claude-sonnet-4-6	Yes	Yes	No	No	No	Yes	Yes	No	Yes	Yes	No	No	Yes	Yes	Yes	Yes	Yes
codex-mini	No	No	No	No	No	No	Yes	No	No	Yes	No	No	No	No	No	No	No
предварительный просмотр использования компьютера	No	No	No	No	No	No	No	Yes	No	No	No	No	No	No	No	No	No
gpt-35-turbo	No	No	No	No	No	No	Yes	No	No	Yes	No	No	No	No	No	No	No
gpt-4	No	No	No	No	No	No	Yes	No	No	Yes	No	No	No	No	No	No	Yes
gpt-4.1	Yes	Yes	No	Yes	Yes	Yes	Yes	No	Yes	Yes	Yes	No	Yes	Yes	Yes	Yes	Yes
gpt-4.1-mini	Yes	Yes	No	Yes	Yes	Yes	Yes	No	Yes	Yes	Yes	No	Yes	Yes	Yes	Yes	Yes
gpt-4.1-nano	Yes	Yes	No	Yes	Yes	Yes	Yes	No	Yes	Yes	Yes	No	Yes	Yes	Yes	Yes	Yes
gpt-4.5-preview	No	No	No	No	No	No	Yes	No	No	Yes	No	No	No	No	No	No	No
gpt-4o	Yes	Yes	No	Yes	Yes	Yes	Yes	No	Yes	Yes	Yes	No	Yes	Yes	Yes	Yes	Yes
gpt-4o-mini	Yes	No	No	Yes	Yes	Yes	Yes	No	Yes	Yes	Yes	No	Yes	Yes	Yes	Yes	Yes
gpt-5	Yes	Yes	No	Yes	Yes	Yes	Yes	No	Yes	Yes	Yes	Yes	Yes	Yes	Yes	Yes	Yes
gpt-5-chat	No	No	No	No	No	No	Yes	No	No	Yes	No	No	No	No	No	No	Yes
gpt-5-codex	No	No	No	No	No	No	Yes	No	No	Yes	No	No	Yes	No	No	No	Yes
gpt-5-mini	No	No	No	No	No	No	Yes	No	No	Yes	No	No	Yes	No	No	Yes	Yes
gpt-5-nano	No	No	No	No	No	No	Yes	No	No	Yes	No	No	No	No	No	No	Yes
gpt-5-pro	No	No	No	No	No	No	Yes	No	No	Yes	No	No	No	No	No	No	No
gpt-5.1	No	Yes	Yes	No	Yes	No	Yes	No	Yes	Yes	Yes	No	Yes	Yes	Yes	Yes	Yes
gpt-5.1-chat	No	No	No	No	No	No	Yes	No	No	Yes	No	No	No	No	No	No	No
gpt-5.1-codex	No	No	No	No	No	No	Yes	No	No	Yes	No	No	Yes	No	No	No	Yes
gpt-5.1-codex-max	No	No	No	No	No	No	Yes	No	No	Yes	No	No	No	No	No	No	No
gpt-5.1-codex-mini	No	No	No	No	No	No	Yes	No	No	Yes	No	No	No	No	No	No	No
gpt-5.2	No	Yes	Yes	No	Yes	No	Yes	No	Yes	Yes	Yes	No	Yes	Yes	Yes	Yes	Yes
gpt-5.2-chat	Yes	Yes	No	Yes	Yes	Yes	Yes	No	Yes	Yes	Yes	No	Yes	Yes	No	Yes	Yes
gpt-5.2-codex	No	No	No	No	No	No	Yes	No	No	Yes	No	No	Yes	No	No	No	Yes
gpt-5.3-chat	Yes	Yes	No	Yes	Yes	Yes	Yes	No	Yes	Yes	No	No	Yes	Yes	Yes	Yes	Yes
gpt-5.3-codex	Yes	Yes	No	Yes	Yes	Yes	Yes	No	Yes	Yes	No	No	Yes	Yes	Yes	Yes	Yes
gpt-5.4	Yes	Yes	No	Yes	Yes	Yes	Yes	No	Yes	Yes	No	No	Yes	Yes	Yes	Yes	Yes
gpt-5.4-mini	Yes	Yes	No	Yes	Yes	Yes	Yes	No	Yes	Yes	No	No	Yes	Yes	Yes	Yes	Yes
gpt-5.4-nano	Yes	Yes	No	Yes	Yes	Yes	Yes	No	Yes	Yes	No	No	Yes	Yes	Yes	Yes	Yes
gpt-5.4-pro	Yes	Yes	No	Yes	Yes	Yes	Yes	No	Yes	Yes	No	No	Yes	Yes	Yes	Yes	Yes
gpt-5.5	Yes	Yes	No	Yes	Yes	Yes	Yes	No	Yes	Yes	No	No	Yes	Yes	Yes	Yes	Yes
гпт-чат-лэйтест	Yes	Yes	No	Yes	Yes	Yes	Yes	No	Yes	Yes	No	No	Yes	Yes	Yes	Yes	Yes
gpt-oss-120b	No	No	No	No	No	No	Yes	No	No	Yes	Yes	No	Yes	No	No	No	Yes
grok-3	No	Yes	No	Yes	Yes	Yes	Yes	No	Yes	Yes	Yes	No	Yes	Yes	Yes	Yes	Yes
grok-3-mini	No	Yes	No	Yes	Yes	Yes	Yes	No	Yes	Yes	Yes	No	Yes	Yes	Yes	Yes	Yes
grok-4	No	No	No	No	No	No	Yes	No	No	Yes	No	No	No	No	No	No	No
grok-4-1-fast-non-reasoning	No	Yes	No	Yes	Yes	Yes	Yes	No	Yes	Yes	Yes	No	Yes	Yes	Yes	Yes	Yes
grok-4-1-fast-reasoning	No	Yes	No	Yes	Yes	Yes	Yes	No	Yes	Yes	Yes	No	Yes	Yes	Yes	Yes	Yes
grok-4-20-non-reasoning	No	Yes	No	Yes	Yes	Yes	Yes	No	Yes	Yes	Yes	No	Yes	Yes	Yes	Yes	Yes
grok-4-20-reasoning	No	Yes	No	Yes	Yes	Yes	Yes	No	Yes	Yes	Yes	No	Yes	Yes	Yes	Yes	Yes
grok-4-без-логики-быстрый	No	Yes	No	Yes	Yes	Yes	Yes	No	Yes	Yes	Yes	No	Yes	Yes	Yes	Yes	Yes
grok-4-бързое рассуждение	No	Yes	No	Yes	Yes	Yes	Yes	No	Yes	Yes	Yes	No	Yes	Yes	Yes	Yes	Yes
mistral-small-2503	No	No	No	No	No	No	Yes	No	No	Yes	No	No	No	No	No	No	No
model-router	No	No	No	Yes	Yes	Yes	Yes	No	Yes	Yes	Yes	No	Yes	Yes	Yes	No	Yes
o1	No	Yes	No	Yes	No	Yes	Yes	No	No	Yes	Yes	No	Yes	No	Yes	Yes	Yes
o1-mini	No	No	No	No	No	No	Yes	No	No	Yes	No	No	No	No	No	No	No
o1-preview	No	No	No	No	No	No	Yes	No	No	Yes	No	No	No	No	No	No	No
o3	Yes	Yes	No	Yes	No	Yes	Yes	No	Yes	Yes	Yes	No	Yes	Yes	No	Yes	Yes
o3-глубокие исследования	No	No	No	No	No	No	No	No	No	No	No	No	Yes	No	No	Yes	Yes
o3-mini	Yes	No	No	Yes	Yes	Yes	Yes	No	Yes	Yes	No	No	No	No	No	No	Yes
o3-pro	No	No	No	No	No	No	Yes	No	No	Yes	No	No	No	No	No	No	No
o4-mini	Yes	No	No	Yes	Yes	Yes	Yes	No	Yes	Yes	Yes	No	Yes	No	Yes	Yes	Yes

Устранение неполадок

Модель или версия недоступна в вашем регионе

Убедитесь, что выбрана правильная вкладка для типа развертывания (глобальный стандарт или с выделенными ресурсами).
Попробуйте другой регион, поддерживающий API модели и ответов.
Если вы используете модели gpt-5, регистрация требуется. Доступ предоставляется в соответствии с критериями соответствия Microsoft.

Инструмент недоступен в вашем регионе

Не все инструменты поддерживаются в каждом регионе. Например, поиск по файлам недоступен в Италии Северная и Южная Бразилия, а интерпретатор кода недоступен во всех регионах.
Проверьте поддержку средства по регионам и таблице моделей , чтобы подтвердить доступность перед развертыванием.
Если инструмент недоступен, выберите поддерживаемый регион или используйте другое средство.

Развертывание выделенной пропускной способности завершилось неудачно

Убедитесь, что в регионе у вас достаточно PTUs.
Просмотрите выделенную пропускную способность и управление перенаправленным трафиком.

Агент получает ошибки ограничения скорости доступа (429)

Реализуйте экспоненциальную обратную передачу с помощью jitter в логике повторных попыток приложения.
Для устойчивых рабочих нагрузок с высокой пропускной способностью рассмотрите возможность развертывания подготовленной пропускной способности.
Просмотрите квоты и ограничения Azure OpenAI для токенов в минуту и ограничений на запросы в минуту для вашего развертывания.

Как служба агента применяет ограничения

Служба агента Foundry налагает ограничения в двух местах:

Ограничения службы агента. Ограничения для артефактов агента и потока, таких как отправка файлов, векторное хранилище вложений, количество сообщений и регистрация инструментов.
Ограничения модели. Квоты и ограничения скорости для развертываний модели, которые вызываются вашими агентами.

Артефакты, на которые распространяются эти ограничения, хранятся либо в хранилище, управляемом Microsoft, либо в ваших собственных ресурсах Azure — в зависимости от вашей конфигурации.

Где служба агента хранит данные

Где находятся данные агента, зависит от выбранного варианта установки. Параметр установки также определяет, к каким ресурсам применяются квоты и ограничения в этой статье.

Базовая настройка сохраняет состояние агента в безопасном Microsoft управляемом хранилищем, которое логически разделено. Это значение по умолчанию, если вы не настраиваете собственные ресурсы.
Стандартная конфигурация сохраняет состояние агента в однопользовательских ресурсах Azure, управляемых клиентом, в вашей собственной подписке, что дает вам полный контроль над местонахождением данных и доступом к ним.

Тип данных	Базовая настройка	Стандартная настройка
Файлы, отправки и вложения	управляемое Microsoft хранилище	служба хранилища Azure (хранилище BLOB-объектов)
Векторные хранилища, эмбеддинги и индексы поиска	Microsoft управляемый векторный поиск	Поиск с использованием ИИ Azure
Потоки, история бесед, сообщения и определения агентов	управляемое Microsoft хранилище	Azure Cosmos DB (облачная база данных)

Хосты возможностей сообщают службе Agent Service, где хранить и обрабатывать загруженные файлы, векторные хранилища и историю бесед. Сведения о хранении данных агента в собственных ресурсах см. в разделе "Настройка агента уровня "Стандартный".

Конечные точки службы агентов Foundry являются региональными, а данные хранятся в том же регионе, что и конечная точка. Дополнительные сведения см. в документации по месту расположения данных Azure.

Ограничения служб по умолчанию

В следующей таблице перечислены ограничения по умолчанию, применяемые службой агента. Эти ограничения применяются ко всем проектам Foundry независимо от типа подписки или региона.

Имя ограничения	Предел значения
Максимальное количество файлов на агент или поток	10,000
Максимальный размер файла для агентов	512 МБ
Максимальный размер всех отправленных файлов для агентов	300 ГБ
Максимальный размер файла в токенах для присоединения к хранилищу векторов	2 000 000 токенов
Максимальное количество сообщений в теме	100,000
Максимальный размер содержимого `text` на сообщение	1500 000 символов
Максимальное количество инструментов, зарегистрированных на агента	128
Максимальное количество допустимых ревизий для каждого агента	1,000

Ограничения службы агента в этой таблице фиксируются и применяются равномерно во всех типах подписок. Ограничение частоты вызовов модели применяется на уровне развертывания модели; сведения об ограничениях частоты для конкретных моделей см. в разделе квоты и ограничения Azure OpenAI.

Справочник по ограничению ошибок

При превышении предела служба агента возвращает ошибку. Обработайте эти ошибки корректно в приложении.

Сценарий ошибки	Состояние HTTP	Код ошибки	Рекомендуемое действие
Слишком большой файл	400	`file_size_exceeded`	Разделение содержимого на небольшие файлы
Лимит токенов для векторного хранилища	400	`token_limit_exceeded`	Уменьшение содержимого файла или разбиение файлов
Лимит сообщений потока	400	`message_limit_exceeded`	Создайте новый поток
Слишком большое содержимое сообщения	400	`content_size_exceeded`	Использование поиска файлов для большого содержимого
Слишком много инструментов	400	`tool_limit_exceeded`	Удаление неиспользуемых средств
Превышено ограничение скорости	429	`rate_limit_exceeded`	Реализация экспоненциальной обратной передачи
Слишком много допустимых исправлений агента	400	`UserError`	Удаление старых версий перед созданием новых версий

Например:

Размер файла превышает максимальный размер. Отправка файла завершается ошибкой. Разделите содержимое на небольшие файлы или уменьшите размер файла перед отправкой.
Ограничение токенов в векторном хранилище. Присоединение файла к векторному хранилищу завершается ошибкой, если размер файла превышает ограничение на количество токенов. Уменьшите содержимое файла или разбиите его на несколько файлов.
Лимит сообщений в потоке. Добавление сообщений может завершиться ошибкой, если поток достигнет предела количества сообщений. Создайте новый поток для нового сеанса беседы или архивируйте и смените потоки в рамках разработки приложения.
Размер содержимого сообщения. Создание сообщения может завершиться ошибкой, если содержимое text слишком большое. Отправляйте небольшие сообщения или перемещайте большое содержимое в файлы и используйте поиск файлов.
Лимит регистрации инструмента. Создание или обновление агента может завершиться ошибкой, если вы регистрируете слишком много инструментов. Зарегистрируйте только необходимые инструменты и предпочесть меньшее количество повторно используемых средств.
Превышено ограничение скорости. Вызовы API к развертыванию модели ограничиваются по скорости. Реализуйте экспоненциальный откат с помощью jitter.
Допустимый предел изменений агента. Создание версии завершается ошибкой после того, как агент достигнет 1000 допустимых редакций. Удалите версии, которые вам больше не нужны, чтобы немедленно освободить ёмкость, а затем создайте новые версии.

Сценарии поиска файлов см. в разделе "Векторные хранилища" для поиска файлов, чтобы получить рекомендации по управлению ростом векторного хранилища.

Квоты на модели и лимиты скорости запросов

Агенты следуют квотам и ограничениям скорости для используемых развертываний модели.

Сведения о текущих квотах и ограничениях модели см. в разделе:

Чтобы просмотреть или запросить дополнительную квоту модели, см. Управление и увеличение квот для ресурсов с помощью Microsoft Foundry (проекты Foundry).

Запрос увеличения ограничения

Ограничения в этой статье являются значениями по умолчанию для службы агента Foundry. Если для рабочей нагрузки требуются более высокие ограничения:

Квоты модели. Вы можете запросить увеличение квот на развертывание моделей. См. раздел Управление квотами на ресурсы и их увеличение с помощью Microsoft Foundry.
Ограничения службы агента. Ограничения файлов, сообщений и инструментов, перечисленных в этой статье, являются фиксированными ограничениями службы и не могут быть увеличены. Создайте приложение для работы с этими ограничениями с помощью описанных выше рекомендаций.

Обратная связь

Были ли сведения на этой странице полезными?

Last updated on 2026-07-20