Развертывание точно настроенной модели для тестирования (классической)

Применяется только к:Портал Foundry (классический). Эта статья недоступна для нового портала Foundry. Дополнительные сведения о новом портале.

Примечание

Содержание в новой документации Microsoft Foundry может открываться по ссылкам в этой статье вместо документации Foundry (классической версии), которую вы просматриваете сейчас.

После точной настройки модели вы можете захотеть проверить её качество с помощью Chat Completions API или службы оценки.

Развертывание тарифного плана для разработчиков позволяет развернуть новую модель без почасовой платы за размещение, как это происходит при стандартных или глобальных развертываниях. Единственные расходы связаны с оплатой за токен. Ознакомьтесь с страницей цен, чтобы получить самую актуальную информацию.

Важно

Уровень разработчиков не предоставляет SLA на доступность и не гарантирует резидентство данных. Если требуется соглашение об уровне обслуживания или место размещения данных, выберите альтернативный тип развертывания для тестирования модели.

Развертывания уровня разработчиков имеют фиксированное время существования 24 часов. Дополнительные сведения о жизненном цикле развертывания см. ниже .

Разверните вашу точно настроенную модель

Чтобы развернуть вашу модель, выберите оптимизированную модель для развертывания, а затем нажмите Развернуть.

Откроется диалоговое окно "Развертывание модели ". В диалоговом окне введите имя развертывания и выберите разработчик из раскрывающегося списка типов развертывания. Выберите "Создать ", чтобы начать развертывание пользовательской модели.

Снимок экрана, показывающий выбор развертывания разработчика в Foundry.

Ход выполнения нового развертывания можно отслеживать на панели Deployments на портале Foundry Microsoft.

import json
import os
import requests

token = os.getenv("<TOKEN>") 
subscription = "<YOUR_SUBSCRIPTION_ID>"  
resource_group = "<YOUR_RESOURCE_GROUP_NAME>"
resource_name = "<YOUR_AZURE_OPENAI_RESOURCE_NAME>"
model_deployment_name = "gpt41-mini-candidate-01" # custom deployment name that you will use to reference the model when making inference calls.

deploy_params = {'api-version': "2025-07-01-preview"} 
deploy_headers = {'Authorization': 'Bearer {}'.format(token), 'Content-Type': 'application/json'}

deploy_data = {
    "sku": {"name": "developertier", "capacity": 50},
    "properties": {
        "model": {
            "format": "OpenAI",
            "name": <"fine_tuned_model">, #retrieve this value from the previous call, it will look like gpt41-mini-candidate-01.ft-b044a9d3cf9c4228b5d393567f693b83
            "version": "1"
        }
    }
}
deploy_data = json.dumps(deploy_data)

request_url = f'https://management.azure.com/subscriptions/{subscription}/resourceGroups/{resource_group}/providers/Microsoft.CognitiveServices/accounts/{resource_name}/deployments/{model_deployment_name}'

print('Creating a new deployment...')

r = requests.put(request_url, params=deploy_params, headers=deploy_headers, data=deploy_data)

print(r)
print(r.reason)
print(r.json())

Переменной	Определение
Токен	Существует несколько способов генерации токена авторизации. Самый простой способ начального тестирования — запустить Cloud Shell на портале Azure. Затем выполните команду `az account get-access-token`. Этот маркер можно использовать в качестве временного маркера авторизации для тестирования API. Мы рекомендуем хранить это в новой переменной среды.
Подписка	Идентификатор подписки для связанного Azure ресурса OpenAI.
группа ресурсов	Имя группы ресурсов для ресурса Azure OpenAI.
resource_name	Имя ресурса Azure OpenAI.
model_deployment_name	Настраиваемое имя для нового точно настроенного развертывания модели. Это имя, которое будет использоваться в коде при вызовах завершения сеансов чата.
модель_с_тонкой_настройкой	Извлеките это значение из результатов вашей работы по точной настройке на предыдущем этапе. Он будет выглядеть следующим образом: `gpt41-mini-candidate-01.ft-b044a9d3cf9c4228b5d393567f693b83`. Необходимо добавить это значение в deploy_data json. Кроме того, можно развернуть контрольную точку, передав идентификатор контрольной точки, который будет отображаться в формате `ftchkpt-e559c011ecc04fc68eaa339d8227d02d`

В следующем примере показано, как использовать REST API для создания развертывания модели для настраиваемой модели. REST API создает имя для развертывания вашей настраиваемой модели.

curl -X POST "https://management.azure.com/subscriptions/<SUBSCRIPTION>/resourceGroups/<RESOURCE_GROUP>/providers/Microsoft.CognitiveServices/accounts/<RESOURCE_NAME>/deployments/<MODEL_DEPLOYMENT_NAME>?api-version=2025-07-01-preview" \
  -H "Authorization: Bearer <TOKEN>" \
  -H "Content-Type: application/json" \
  -d '{
    "sku": {"name": "developertier", "capacity": 50},
    "properties": {
        "model": {
            "format": "OpenAI",
            "name": "<FINE_TUNED_MODEL>",
            "version": "1"
        }
    }
}'

Переменной	Определение
Токен	Существует несколько способов генерации токена авторизации. Самый простой способ начального тестирования — запустить Cloud Shell на портале Azure. Затем выполните команду `az account get-access-token`. Этот маркер можно использовать в качестве временного маркера авторизации для тестирования API. Мы рекомендуем хранить это в новой переменной среды.
Подписка	Идентификатор подписки для связанного Azure ресурса OpenAI.
группа ресурсов	Имя группы ресурсов для ресурса Azure OpenAI.
resource_name	Имя ресурса Azure OpenAI.
model_deployment_name	Настраиваемое имя для нового точно настроенного развертывания модели. Это имя, которое будет использоваться в коде при вызовах завершения сеансов чата.
модель_с_тонкой_настройкой	Извлеките это значение из результатов вашей работы по точной настройке на предыдущем этапе. Он будет выглядеть следующим образом: `gpt-4.1-mini-2025-04-14.ft-b044a9d3cf9c4228b5d393567f693b83`. Необходимо добавить данное значение в json deploy_data. Кроме того, можно развернуть контрольную точку, передав идентификатор контрольной точки, который будет отображаться в формате `ftchkpt-e559c011ecc04fc68eaa339d8227d02d`

Развертывание модели с помощью Azure CLI

В следующем примере показано, как использовать Azure CLI для развертывания настраиваемой модели. В Azure CLI необходимо указать имя развертывания настраиваемой модели. Дополнительные сведения об использовании Azure CLI для развертывания настраиваемых моделей см. в разделе az cognitiveservices account deployment.

Чтобы выполнить эту команду Azure CLI в окне консоли, необходимо заменить следующие <placeholders> соответствующими значениями для настраиваемой модели:

плейсхолдер	Значение
<YOUR_AZURE_SUBSCRIPTION>	Имя или идентификатор подписки Azure.
<YOUR_RESOURCE_GROUP>	Имя группы ресурсов Azure.
<YOUR_RESOURCE_NAME>	Имя вашего ресурса Azure OpenAI.
<YOUR_DEPLOYMENT_NAME>	Имя, которое вы хотите использовать для развертывания модели.
<YOUR_FINE_TUNED_MODEL_ID>	Имя настраиваемой модели.

az cognitiveservices account deployment create 
    --resource-group <YOUR_RESOURCE_GROUP>
    --name <YOUR_RESOURCE_NAME>  
    --deployment-name <YOUR_DEPLOYMENT_NAME>
    --model-name <YOUR_FINE_TUNED_MODEL_ID>
    --model-version "1" 
    --model-format OpenAI 
    --sku-capacity "50" 
    --sku-name "Developer"

Используйте развернутую адаптированную модель

После развертывания пользовательской модели, её можно использовать как любую другую развернутую модель. Вы можете использовать игровые площадки на портале Foundry для экспериментов с новым развертыванием. Вы можете продолжать использовать те же параметры для своей пользовательской модели, например temperature и max_tokens, как и с другими развернутыми моделями.

Вы также можете использовать услугу "Оценки" для создания и проведения оценок моделей для кандидата модели, который вы развернули, а также других версий модели.

import os
from openai import OpenAI

client = OpenAI(
  base_url = "https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/", 
  api_key=os.getenv("AZURE_OPENAI_API_KEY"),  
)

response = client.chat.completions.create(
    model="gpt41-mini-candidate-01", # model = "Custom deployment name you chose for your fine-tuning model"
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Does Azure OpenAI support customer managed keys?"},
        {"role": "assistant", "content": "Yes, customer managed keys are supported by Azure OpenAI."},
        {"role": "user", "content": "Do other Foundry Tools support this too?"}
    ]
)

print(response.choices[0].message.content)

curl $AZURE_OPENAI_ENDPOINT/openai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "api-key: $AZURE_OPENAI_API_KEY" \
  -d '"model": "YOUR_MODEL_DEPLOYMENT_NAME", {"messages":[{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": "Does Azure OpenAI support customer managed keys?"},{"role": "assistant", "content": "Yes, customer managed keys are supported by Azure OpenAI."},{"role": "user", "content": "Do other Foundry Tools support this too?"}]}'

Очистите развертывание

Развертывания разработчиков автоматически удаляются независимо от активности. Каждое развертывание имеет фиксированное время существования 24 часа после которого оно подлежит удалению. Удаление развертывания не приводит к удалению или изменению настроенной модели, и её можно повторно развернуть в любое время.

Чтобы удалить развертывание вручную, можно использовать портал Foundry или использовать Azure CLI.

Чтобы использовать Deployments - Delete REST API, отправьте HTTP DELETE в ресурс развертывания. Как и при создании развертываний, необходимо включить следующие параметры:

идентификатор подписки Azure
имя группы ресурсов Azure
имя ресурса Azure OpenAI
Имя развертывания для удаления

Ниже приведен пример REST API для удаления развертывания:

curl -X DELETE "https://management.azure.com/subscriptions/<SUBSCRIPTION>/resourceGroups/<RESOURCE_GROUP>/providers/Microsoft.CognitiveServices/accounts/<RESOURCE_NAME>/deployments/<MODEL_DEPLOYMENT_NAME>?api-version=2025-07-01-preview" \
  -H "Authorization: Bearer <TOKEN>"

Дальнейшие действия

Развертывание на продакшн
Общие сведения о квотах и лимитах службы Azure OpenAI
Дополнительные сведения о других типах развертывания OpenAI Azure OpenAI

Обратная связь

Были ли сведения на этой странице полезными?

Last updated on 2026-05-01