Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В настоящее время просмотр:Версия портала Foundry (классическая версия) - Переключиться на версию для нового портала Foundry
Примечание
Содержание в новой документации Microsoft Foundry может открываться по ссылкам в этой статье вместо документации Foundry (классической версии), которую вы просматриваете сейчас.
Модели Microsoft Foundry перемещаются через предсказуемый жизненный цикл (от предварительной версии до общедоступной версии) до окончательного вывода из эксплуатации, что позволяет оценить замены и перенести рабочие нагрузки. В этой статье описывается каждый этап жизненного цикла, обязательства, которые берет на себя Microsoft при выводе модели из эксплуатации, а также механизм уведомления. Для получения сведений о конкретных датах списания см. расписание списания моделей.
Принцип работы жизненного цикла модели
Microsoft Foundry постоянно обновляет свой каталог моделей с более новыми, более способными моделями. При замене модели она перемещается через прогнозируемый жизненный цикл, который дает клиентам время для оценки замен и миграции. Жизненный цикл применяется равномерно для моделей Foundry продаваемых непосредственно Azure и от партнеров и сообщества, хотя временные шкалы уведомлений немного отличаются по происхождению модели.
Этапы жизненного цикла
Каждая модель в каталоге Foundry принадлежит именно одному из следующих пяти этапов:
| Этап | Что это означает | Можно ли создавать новые развертывания? | Работают ли существующие развертывания? |
|---|---|---|---|
| Предварительный просмотр | Экспериментальный. Может измениться вес, среда выполнения и схема API. Не гарантируется, что это станет общедоступным. Помеченный как "Предварительная версия" в каталоге. | Да | Да |
| Общедоступная версия (GA) | Готово к работе. Весы и API зафиксированы. Исправления среды выполнения для уязвимостей безопасности не влияют на выходные данные. Метка не отображается (состояние по умолчанию). | Да | Да |
| Наследие | Существуют более новые, более способные модели. Необходимо запланировать перенос рабочих нагрузок. Этот этап является необязательным — модели могут переходить непосредственно из общедоступного (GA) в статус устаревшего. | Да (до устаревания) | Да |
| Устаревшие | Существующие клиенты могут продолжать создавать развертывания и управлять ими. Больше недоступен новым клиентам— новые клиенты не могут создавать развертывания или получать доступ к модели. "Существующий клиент" определяется на уровне подписки: если эта Azure подписка когда-либо развернула определенную версию модели. Новая подписка в том же клиенте не наследует доступ. | - Существующие клиенты: Да. - Новые клиенты: Нет |
Да |
| Отставке | Удален из службы. Все запросы вывода возвращаются 410 Gone. |
Нет | Нет |
Примечание
- Точно настроенные модели следуют отдельному графику вывода из эксплуатации для обучения и развертывания. См. точно настроенные модели для получения деталей.
- Модели foundry (catalog): некоторые поставщики моделей определяют более короткий жизненный цикл общедоступной версии( например, 12 месяцев вместо 18. Если применяется более короткий жизненный цикл, это отмечается непосредственно на модели в Графике снятия модели с производства.
Запуск модели и доступность
Новые модели становятся доступными с помощью типов развертывания в этом порядке:
| Заказ | Тип развертывания | Когда доступно |
|---|---|---|
| 1 | Глобальный стандарт | При запуске — самая широкая доступность и наименьшая задержка в разных регионах |
| 2 | Глобально предоставленный | Следует сразу после глобального стандарта—обеспечивает зарезервированную пропускную способность с глобальной маршрутизацией. |
| 3 | Стандартная зона данных и Подготовленная зона данных | После этапа глобального распределения обработка данных остаётся в пределах определённой географии. |
| 4 | Стандартный и подготовленный | Последние — только для регионов, так как старые модели выводятся из эксплуатации, и емкость перераспределяется. |
Совет
Полное сравнение типов развертывания см. в разделе "Сравнение типов развертывания".
Варианты жизненного цикла и доступности
Некоторые факторы влияют на то, как стандартный жизненный цикл применяется к развертываниям, включая регион, в который вы работаете, используемую облачную среду и требования к безопасности.
Региональная доступность
- Не все сочетания моделей и версий доступны во всех регионах.
- Как правило, более специализированные модели, например, аудио, изображения и видео, доступны только в виде зоны данных или в виде глобальных типов развертывания.
- Последовательные версии модели могут быть недоступны в одном регионе. Более новая версия может появиться в некоторых регионах перед планированием обновлений в других регионах.
- Microsoft может ограничить новых клиентов в определенных регионах для поддержания качества обслуживания для существующих клиентов.
облака Azure для государственных организаций
- Развертывания глобального стандарта недоступны в государственных облаках.
- Не все модели или версии, доступные в коммерческих облаках, доступны в облаках государственных организаций.
- Облака для государственных организаций обычно поддерживают только одну версию данной модели одновременно, с 30-дневным периодом перекрытия, когда становится доступна новая версия.
Для получения дополнительной информации см. Модели Foundry, продаваемые напрямую Azure (государственные), Версии моделей и Типы развертывания в Azure для государственных организаций.
Уход на пенсию, обусловленный факторами безопасности
Если у модели обнаружены проблемы с соответствием или безопасностью, Microsoft оставляет за собой право на экстренное прекращение использования с уведомлением в короткие сроки. Обратитесь к условиям обслуживания Azure для подробностей.
Обязательства по временной шкале жизненного цикла
Microsoft берет на себя определенные обязательства по поводу того, как долго версии моделей остаются в доступе и когда появятся новые версии, чтобы вы могли с уверенностью планировать миграцию.
Общедоступная модель замен (GA) совпадает с обязательствами
Мы обеспечиваем значительное перекрытие между GA моделью и её заменяющей версией, чтобы у клиентов была возможность с уверенностью тестировать, оценивать и переносить.
| Фаза | Узор |
|---|---|
| Запуск версии общего доступа | Каждая модель запускается в зависимости от типа развертывания и матрицы доступности по регионам. Дата выхода на пенсию (18 месяцев) устанавливается программным способом и доступна через API моделей. |
| Устаревшие (только существующие клиенты) | Через 12 месяцев после запуска существующие клиенты могут продолжать создавать развертывания и управлять ими. Новые клиенты не могут получить доступ к модели. |
| Замена, доступная в глобальном стандарте | Клиенты могут использовать и тестировать модель замены в глобальном стандарте примерно через 90 дней до выхода на пенсию. |
| Замена, доступная в предоставленных регионах | Модель замены становится доступной для тестирования в подготовленных регионах, где предшественник выходит на пенсию примерно через 30 дней до выхода на пенсию, предоставляя подготовленным клиентам окно миграции вручную. |
| Модель версии устарела | На 18 месяцев после запуска все выводы возвращаются 410 Gone. |
Совет
Почему 90–120 дней? Официальная модель замены выбрана и объявлена примерно 90–120 дней до даты выхода на пенсию модели— не раньше. Учитывая быстрый темп прогресса в области генеративного ИИ, слишком ранняя замена может привести к тому, что клиенты будут направлены на модель, которая к моменту необходимости миграции уже не является лучшим доступным вариантом.
Жизненный цикл модели предварительной версии
Предварительные версии моделей имеют фундаментальный жизненный цикл, отличный от моделей общедоступной версии. Они имеют «не раньше чем» дату снятия с эксплуатации (обычно через 90 дней), но иногда продлеваются за рамки этого начального периода, пока не станет доступна подходящая предварительная версия или версия модели общего пользования. При принятии решения о прекращении поддержки клиенты принудительно обновляются до заменяющей версии (новой предварительной версии или общедоступной модели) или модель выводится из эксплуатации без замены. Нет возможности остаться в устаревшей модели предварительной версии. Все развертывания предварительной версии будут обновлены или прекращены.
Примечание
Модели предварительной версии не рекомендуется использовать для рабочих нагрузок.
| Результат | Что происходит |
|---|---|
| Обновление до более новой предварительной версии | Существующие развертывания предварительной версии автоматически обновляются до более новой предварительной версии. Клиенты получают по крайней мере 30 дней уведомления. Цикл повторяется до тех пор, пока не будет доступна общедоступная версия. |
| Обновление до общедоступной версии | При запуске модели общедоступной версии предварительные версии принудительно обновляются до общедоступной версии. Клиенты получают по крайней мере 30 дней уведомления. Модель общедоступной версии затем следует стандартному 18-месячному жизненному циклу. |
| Без замены (редко) | Если замены нет, клиенты получают уведомление за 30 дней до вывода модели из эксплуатации и возврата результатов вывода 410 Gone. |
Автоматическое обновление
Для типов развертывания Global Standard, Data Zone Standard и Standard Microsoft управляет автоматическими обновлениями при выходе из эксплуатации версии модели:
- Автоматическое обновление планируется на последовательной основе по регионам .
- Расписание обновления заранее публикуется в графике вывода модели из эксплуатации.
- Обновление может произойти, даже если новая версия модели еще не доступна отдельно в этом регионе или для этого номера SKU, процесс обновления сделает его доступным.
Важно
Подготовленные развертывания не обновляются автоматически. Клиенты, которым предоставлены ресурсы, должны вручную перейти на замещающую модель.
Используйте API моделей для программной проверки lifecycleStatus, deprecation, и каждого номера SKU deprecationDate в любое время для любой модели.
Пример: обновление gpt-4o → gpt-5.1
Когда версии gpt-4o 2024-05-13 и 2024-08-06 были выведены из эксплуатации 2026-03-31, версии были автоматически обновлены до gpt-5.1 на стандартном SKU. До обновления у gpt-5.1 совсем не было присутствия в стандарте. После обновления gpt-5.1 Standard был добавлен ко всем восьми регионам, которые ранее имели эти gpt-4o версии (centralus, eastus, eastus2, northcentralus, southcentralus, swedencentralus, westus, westus3). Версия 2024-11-20 не была затронута (вывод из эксплуатации 2026-10-01).
Миграция на замещающую модель
Когда модель, используемая вступает в устаревшую или нерекомендуемую стадию, проверьте столбец "Рекомендуемая замена" в расписании выхода на пенсию модели и выполните действия, описанные в разделе " Работа с моделями для развертывания, тестирования и миграции на замену".
Уведомления
Модели GA имеют свою дату снятия с производства, устанавливаемую программно на момент запуска на срок до 18 месяцев — отдельного "объявления" нет. Устаревшие и снятые с производства переходы следуют опубликованной временной шкале и отображаются в режиме реального времени с помощью API моделей.
При получении активных уведомлений
| Событие | Времени | Применимо к |
|---|---|---|
| Уведомление о прекращении поддержки модели GA | По крайней мере 60 дней до выхода на пенсию | Все модели GA. Отправляется владельцам активных развертываний подписок. |
| Уведомление о прекращении использования модели предварительной версии | По крайней мере 30 дней до выхода на пенсию | Предварительные версии моделей. Предварительная версия развертываний может быть автоматически обновлена до замены, если модель замены доступна и применима (например, не требует другого контракта API). |
Как вас уведомляют
| Канал | Детали |
|---|---|
| Отправить по электронной почте | Автоматические уведомления отправляются владельцам подписок с активными развертываниями. |
| Работоспособность служб Azure | Предупреждения о состоянии здоровья появляются для затронутых подписок. Перейдите к Service Health > Уведомления о состоянии, отфильтруйте по Служба Azure OpenAI, и настройте правило оповещения для сообщений электронной почты, текстовых сообщений или уведомлений веб-перехватчика. |
Программные методы для проверки жизненного цикла модели и устаревания
Клиенты могут проверять поля жизненного цикла и устаревания любой модели с помощью API моделей (в рамках подписки, все модели в данном регионе):
GET https://management.azure.com/subscriptions/{sub}/providers/Microsoft.CognitiveServices/locations/{location}/models?api-version=2024-10-01
Ключевые поля: lifecycleStatus, deprecation.inference, deprecation.fineTune, для каждого SKU deprecationDate (в датах ISO).
Важно
API использует различные терминологии, отличные от документации и портала. В приведенной ниже таблице перечислены имена этапов, предназначенных для клиента, используемые в этом документе, и портал Foundry со соответствующими значениями полей API.
| Этап (документы и портал) | Поле состояния API (lifecycleStatus) |
Поле даты API (deprecation.inference) |
Что это означает |
|---|---|---|---|
| Предварительный просмотр | Preview |
Будущая дата или не установлена | Экспериментальный. Может измениться или удалиться. |
| Общедоступная версия | GenerallyAvailable |
Будущая дата (задано при запуске) | Готово к работе. Фиксированные веса и API. |
| Устаревшие | Deprecating |
Дата будущего | По-прежнему служит для интерпретации. Заблокировано для новых клиентов. |
| Отставке | Deprecated |
Прошедшая дата | Полностью отставлен. Возвращает вывод 410 Gone. |
Например, модель, которая в документации указана как "Нерекомендуемая" (по-прежнему работает, заблокирована для новых клиентов), отображается в API как lifecycleStatus: "Deprecating", а не "Deprecated". Значение "Deprecated" API означает, что модель выведена из эксплуатации и больше не обслуживает вычислительные запросы.
Чтобы определить этап модели программным способом, проверьте оба поля вместе:
if lifecycleStatus == "Deprecated" → Retired (410 Gone)
if lifecycleStatus == "Deprecating" → Deprecated (existing customers only)
if deprecation.inference < today → Retired (regardless of lifecycleStatus lag)
if lifecycleStatus == "GenerallyAvailable" → GA
if lifecycleStatus == "Preview" → Preview
Точно настроенные модели
Точно настроенные модели выводятся из эксплуатации в два этапа: обучение и развертывание.
Если явно не указано, обучение перестает поддерживаться не раньше, чем дата прекращения поддержки базовой модели. После выхода модели на обучение она больше не доступна для точной настройки, но все ранее обученные модели остаются доступными для развертывания.
При завершении развертывания вывод и ответы на ошибки развертывания возвращаются.
| Модель | Версия | Дата завершения обучения | Дата выхода на пенсию развертывания |
|---|---|---|---|
| gpt-4o | 2024-08-06 | Не более 2027-04-011 | 01-10-2027 |
| gpt-4o-mini | 18.07.2024 | Не более 2027-04-011 | 01-10-2027 |
| gpt-4.1 | 2025-04-14 | Не более 2027-04-141 | 14.10.2027 |
| gpt-4.1-mini | 2025-04-14 | Не более 2027-04-141 | 14.10.2027 |
| gpt-4.1-nano | 2025-04-14 | Не более 2027-04-141 | 14.10.2027 |
| o4-mini | 2025-04-16 | Прекращение использования базовой модели | Через год после выхода на пенсию |
1 Только для существующих клиентов. В противном случае выход на пенсию обучения происходит одновременно с выходом на пенсию базовой модели.
Часто задаваемые вопросы
| Вопрос | Ответ | Подробнее |
|---|---|---|
| Какова разница между семейством моделей, версией и вариантом? | Семейство моделей — это поколение моделей (например, GPT-4o, GPT-5). Версия модели — это устаревший выпуск в семействе (например, gpt-4o 2024-05-13 и 2024-08-06). Вариант модели — это уровень размера и возможностей в одной семье (например, GPT-5, GPT-5-mini, GPT-5-nano). | Версии модели |
| Могу ли я контролировать процесс автоматического обновления стандартного развертывания? | Да.
versionUpgradeOption Задайте для свойства развертывания одно из трех значений: OnceNewDefaultVersionAvailable (обновление при установке нового по умолчанию), OnceCurrentVersionExpired (обновление только при выходе на пенсию) или NoAutoUpgrade (никогда не выполняется автоматическое обновление— развертывание перестает работать при выходе на пенсию). Этот параметр можно настроить с помощью REST API, Azure PowerShell или портала Foundry. |
Работа с моделями — конфигурация обновления |
| Как перенести подготовленное развертывание? | Подготовленные развертывания не обновляются автоматически. У вас есть два варианта: Интерактивная миграция (Azure обрабатывает миграцию трафика в течение 20–30 минут без простоя) или Параллельная миграция (вы создаете новое развертывание, проводите тестирование, переключаете трафик и удаляете старое развертывание). | Управление моделями для подготовленных типов развертывания |
| Перенесется ли моя квота на замещающую модель? | Что касается стандартных автоматических обновлений, да, квота обрабатывается автоматически. Для развертываний с предварительной подготовкой необходимо убедиться, что квота доступна для целевой модели до начала миграции. Емкость PTU независима от модели и может взаимозаменяемо использоваться в подготовленных управляемых развертываниях. | Подготовленная пропускная способность — квота |
| Можно ли получить исключение для расширения даты выхода модели на пенсию? | Нет. Даты выхода на пенсию не расширяются. Планируйте миграцию, используя временные шкалы, опубликованные в графике вывода моделей из эксплуатации и API моделей. | N/A |
| Какие средства помогут мне оценить модель замены? | Используйте рейтинг моделей на портале Foundry для сравнения эталонов, функцию сравнения моделей при развертывании, и Оценки для тестирования пользовательской рабочей нагрузки. По мере необходимости применяйте инженерию запросов и точную настройку, чтобы соответствовать предыдущей точности. | Подготовка к выходу модели на пенсию |
| Модели внедрения соответствуют одному жизненному циклу? | Модели встраивания (text-embedding-3-large, text-embedding-3-small, text-embedding-ada-002) имеют расширенные временные шкалы и обрабатываются иначе, чем модели вывода. Проверьте расписание выхода на пенсию модели для определенных дат. | Вывод моделей из эксплуатации — эмбеддинги |
| Как происходит обновление приоритетной обработки и пакетных развертываний? | Приоритетная обработка следует тому же процессу обновления, что и Стандартные развертывания (поддерживается автоматическое обновление). Пакетные развертывания следуют подходу параллельной (многократной) миграции: разверните новую модель, повторно отправьте задания, а затем устраните старое развертывание. | Работа с моделями |
| Я не могу найти "Microsoft Foundry" в Работоспособность служб Azure — как настроить оповещения? | Выберите Служба Azure OpenAI в качестве имени службы при настройке оповещений о работоспособности службы. В службе "Работоспособности служб" нет отдельной службы "Microsoft Foundry". |
Настройка оповещений о состоянии служб |
Связанное содержимое
- График снятия с производства моделей для определенных дат для всех текущих, устаревающих и снятых с производства моделей
-
Справочник по API моделей для программного запроса
lifecycleStatus,deprecationи по SKUdeprecationDateдля любой модели - Версии моделей в Microsoft Foundry Models как работают обновления версий
- Начало работы с оценкой модели
- Управление моделями для подготовленных типов развертывания
- Настройка оповещений о состоянии служб