Создание текстовых ответов с помощью моделей Microsoft Foundry

В этой статье объясняется, как создавать текстовые ответы для моделей Foundry, таких как модели Microsoft ИИ, DeepSeek и Grok, используя API для ответов. Полный список моделей Foundry, поддерживающих использование API ответов, см. в разделе "Поддерживаемые модели Foundry".

Необходимые условия

Чтобы использовать API ответов с развернутыми моделями в приложении, вам потребуется:

  • Подписка Azure. Если вы используете модели GitHub, вы можете обновить интерфейс и создать подписку Azure в процессе. Прочитайте Переход с моделей GitHub на модели Microsoft Foundry, если это ваш случай.

  • Проект Foundry. Этот тип проекта управляется ресурсом Foundry. Если у вас нет проекта Foundry, см. раздел Создание проекта для Microsoft Foundry.

  • URL конечной точки проекта Foundry, который имеет формат https://YOUR-RESOURCE-NAME.services.ai.azure.com/api/projects/YOUR_PROJECT_NAME.

  • Развертывание модели Foundry, например модели DeepSeek-R1-0528, используемой в этой статье. Если у вас еще нет развертывания, см. Добавление и настройка моделей Foundry для развертывания модели в вашем ресурсе.

Используйте стартовый комплект модели ИИ

Фрагменты кода, приведенные в этой статье, относятся к начальном набору моделей ИИ. Используйте этот начальный комплект как быстрый способ начать работу с полной облачной инфраструктурой и кодом, необходимыми для вызова Foundry Models, используя стабильную библиотеку OpenAI с API ответов.

Создание текста с помощью API ответов

Используйте код в этом разделе, чтобы выполнять вызовы API для работы с моделями Foundry. В примерах кода вы создаете клиент для использования модели, а затем отправляете его базовый запрос.

Совет

При развертывании модели на портале Foundry вы назначите ему имя развертывания. Используйте это имя развертывания (а не идентификатор каталога моделей) в параметре model вызовов API.

Примечание

Используйте безключевую проверку подлинности с Microsoft Entra ID. Чтобы узнать больше об аутентификации без ключей, см. Что такое аутентификация Microsoft Entra? и DefaultAzureCredential.

  1. Установите библиотеки, включая клиентская библиотека Azure Identity:

    pip install azure-identity
    pip install -U openai
    
  2. Используйте следующий код, чтобы настроить клиентский объект OpenAI в маршруте проекта, указать развертывание и создать ответы.

    from azure.identity import DefaultAzureCredential, get_bearer_token_provider
    from openai import OpenAI
    
    project_endpoint = "https://YOUR-RESOURCE-NAME.services.ai.azure.com/api/projects/YOUR_PROJECT_NAME"
    # Build the base URL: project_endpoint + /openai/v1 (no api-version needed)
    base_url = project_endpoint.rstrip("/") + "/openai/v1"
    
    # get_bearer_token_provider returns a callable; call it to get automatic refresh of the token string
    credential = DefaultAzureCredential()
    token_provider = get_bearer_token_provider(credential, "https://ai.azure.com/.default")
    client = OpenAI(
        base_url=base_url,
        api_key=token_provider(),
    )   
    
    response = client.responses.create(
        model="DeepSeek-R1-0528", # Replace with your deployment name, not the model ID 
        input="What are the top 3 benefits of cloud computing? Be concise.",
        max_output_tokens=500,
    )
    
    print(f"Response: {response.output_text}")
    print(f"Status:   {response.status}")
    print(f"Output tokens: {response.usage.output_tokens}") 
    

Ответ включает созданный текст вместе с метаданными модели и использования.

Поддерживаемые модели Foundry

Несколько моделей Foundry поддерживаются для работы с API Responses.

Просмотр поддерживаемых моделей на портале Foundry

Чтобы просмотреть полный список поддерживаемых моделей на портале Foundry:

  1. Войдите в Microsoft Foundry. Убедитесь, что переключатель New Foundry включен. Эти действия относятся к Foundry (new).
  2. Выберите "Обнаружить " в правой верхней части навигации, а затем " Модели " на левой панели.
  3. Откройте раскрывающийся список "Возможности" и выберите поддерживаемый фильтр агента .

Список поддерживаемых моделей

В этом разделе перечислены некоторые модели Foundry, поддерживаемые для использования с API ответов. Список поддерживаемых моделей Azure OpenAI см. в разделе Доступные модели Azure OpenAI.

Модели продаются непосредственно компанией Azure:

  • MAI-DS-R1: Детерминированное, точностное рассуждение.
  • grok-4: Гранично масштабное рассуждение для решения сложных многошаговых задач.
  • grok-4-fast-reasoning: ускоренное агентивное рассуждение, оптимизированное для автоматизации рабочих процессов.
  • grok-4-fast-non-reasoning: высокая пропускная способность, низкая задержка и системная маршрутизация.
  • grok-3: строгое обоснование сложных рабочих процессов на уровне системы.
  • grok-3-mini: упрощенная модель, оптимизированная для интерактивных вариантов использования с большим объемом.
  • Ллома-3.3-70B-Instruct: универсальная модель для корпоративных вопросов и ответов, поддержки принятия решений и системной оркестрации.
  • Llama-4-Maverick-17B-128E-Instruct-FP8: модель, оптимизированная под FP8, обеспечивающая быстрое и экономичное выполнение вывода.
  • DeepSeek-V3-0324: многомодальное понимание текста и изображений.
  • DeepSeek-V3.1: улучшенное многомодальное рассуждение и прикреплённое извлечение.
  • DeepSeek-R1-0528: расширенные развернутые формы и многошаговые умозаключения.
  • gpt-oss-120b: модель open-ecosystem, которая поддерживает прозрачность и воспроизводимость.

Устранение распространенных ошибок

Ошибка Причина Разрешение
401 Несанкционированный доступ Недействительные или истекшие учетные данные Убедитесь, что для ресурса DefaultAzureCredential назначена роль пользователя Cognitive Services OpenAI.
404 Не найдено Неверное имя конечной точки или развертывания Убедитесь, что URL-адрес конечной точки включает /api/projects/YOUR_PROJECT_NAME и имя развертывания соответствует порталу Foundry.
Модель 400 не поддерживается Модель не поддерживает API ответов Проверьте список поддерживаемых моделей и убедитесь, что развертывание использует совместимую модель.