Развертывание и использование моделей Claude в Microsoft Foundry (предварительная версия) (классическая версия)

В настоящее время просмотр:Версия портала Foundry (классическая версия) - Переключиться на версию для нового портала Foundry

Примечание

Содержание в новой документации Microsoft Foundry может открываться по ссылкам в этой статье вместо документации Foundry (классической версии), которую вы просматриваете сейчас.

Модели Claude от Anthropic предоставляют расширенные возможности разговорного искусственного интеллекта для Microsoft Foundry, что позволяет создавать интеллектуальные приложения с использованием современных технологий понимания и генерации языка. Модели Claude превосходно справляются с сложными рассуждениями, генерацией кода и многомодальными задачами, включая задачи анализа изображений.

В этой статье описано, как:

  • Развертывание моделей Claude в Microsoft Foundry
  • Проверка подлинности с помощью ключей Microsoft Entra ID или API
  • Вызов API Claude Messages из Python, JavaScript или REST
  • Выбор подходящей модели Claude для вашего варианта использования

Модели Claude в Foundry включают:

Семейство моделей Модели
Клод Мифос claude-mythos-preview 1 (предварительная версия для закрытых исследований)
Клод Опус claude-opus-4-7 2 (предварительная версия), claude-opus-4-6 (предварительная версия), claude-opus-4-5 (предварительная версия), claude-opus-4-1 (предварительная версия)
Клод Соннет claude-sonnet-4-6 (предварительная версия), claude-sonnet-4-5 (предварительная версия)
Клод Хайку claude-haiku-4-5 (предварительная версия)

1Клод Мифос Предварительная версия доступна только в качестве закрытого предварительного просмотра исследований. Доступ к модели предоставляется исключительно по усмотрению Anthropic и приоритетно используется для задач оборонительной кибербезопасности. См. системную карточку Claude Mythos Preview для ответственного использования.

2 Следуйте инструкциям по миграции , чтобы перенести код API сообщений из предыдущих версий Claude в Claude Opus 4.7.

Дополнительные сведения о отдельных моделях см. в разделе "Доступные модели Claude".

Необходимые условия

Поддержка типа подписки и региона

Чтобы использовать модели Claude в Microsoft Foundry, необходимо иметь оплачиваемую подписку Azure с учетной записью для выставления счетов в стране или регионе, где Anthropic предлагает модели для покупки. Список распространенных ошибок, связанных с подпиской, см. в разделе "Распространенные сообщения об ошибках и решениях". В настоящее время следующие типы подписок не поддерживаются:

  • Корпоративные учетные записи, расположенные в Южной Корее
  • подписки поставщика облачных решений
  • Azure подписки, которые не имеют активного метода оплаты по принципу 'оплата по факту использования' (например, студенческих, бесплатных пробных версий или учетных записей, основанных на кредитах)
  • Спонсируемые подписки, использующие только кредиты Azure. Примечание: если у вас есть учетная запись с привязанной кредитной картой, кредитная карта будет использована вместо Azure Credits.

Список поддерживаемых регионов см. в поддерживаемых географических расположениях. Обратите внимание, что политика Anthropic в отношении «поддерживаемых регионов» может быть действительна для доступности в вашем регионе. Проверьте поддерживаемые регионы для получения деталей.

Развертывание моделей Claude

Модели Claude в Foundry доступны для глобального стандартного развертывания. Чтобы развернуть модель Claude, следуйте инструкциям в разделе Deploy Microsoft Foundry Models на портале Foundry.

После развертывания используйте игровую площадку Foundry для интерактивного тестирования модели.

Вызовите API Claude Messages

После развертывания модели Claude взаимодействуйте с ней для создания текстовых ответов:

  • Используйте пакеты SDK Anthropic и следующие API Claude:

    • API сообщений: отправка структурированного списка входных сообщений с текстом или содержимым изображения. Модель создает следующее сообщение в беседе.
    • API подсчета токенов: подсчитать количество токенов в сообщении.
    • API файлов: отправка и управление файлами для использования с API Claude без повторной отправки содержимого с каждым запросом.
    • API Skills: создавайте пользовательские навыки для Claude AI.

Отправка сообщений с проверкой подлинности

В следующих примерах показано, как отправлять запросы в Claude Sonnet 4.6 с помощью проверки подлинности Microsoft Entra ID или ключа API. Чтобы работать с развернутой моделью, вам потребуется:

  • Ваш базовый URL-адрес, который имеет форму https://<resource name>.services.ai.azure.com/anthropic.
  • Целевой URI из ваших сведений о развертывании, который имеет вид https://<resource name>.services.ai.azure.com/anthropic/v1/messages.
  • Microsoft Entra ID для аутентификации без ключей или ключ API вашего развертывания для аутентификации API.
  • Имя развертывания, выбранное вами во время создания развертывания. Это имя может отличаться от идентификатора модели.

Примечание

Для Opus 4.6 и Sonnet 4.6 параметр thinking поддерживает типы: enabled, disabledи adaptive. Тип adaptive позволяет модели решать, следует ли думать на основе сложности запросов и уровня усилий.

Для Предварительной версии Mythos параметр thinking поддерживает толькоadaptive и enabled.

Для Opus 4.7 thinking параметр поддерживает толькоadaptive и disabled.

Параметр effort , который управляет компромиссом качества и затрат для ответов, поддерживает уровни усилий: low, mediumи high. Для Opus 4.7, Opus 4.6 и Sonnet 4.6 параметр также поддерживает max уровень нагрузки. Используйте этот параметр с или без включения мышления.

Используйте аутентификацию Microsoft Entra ID

Для конечных точек API Messages используйте базовый URL-адрес с проверкой подлинности Microsoft Entra ID.

  1. Установите клиентскую библиотеку удостоверений Azure: установите эту библиотеку для использования DefaultAzureCredential. Самый простой способ авторизации — использовать DefaultAzureCredential, так как это обеспечивает выбор лучших учетных данных в текущей рабочей среде.

    pip install azure-identity
    

    Задайте значения идентификатора клиента, идентификатора клиента и секрета клиента приложения Microsoft Entra ID в качестве переменных среды: AZURE_CLIENT_ID, AZURE_TENANT_ID, AZURE_CLIENT_SECRET.

    export AZURE_CLIENT_ID="<AZURE_CLIENT_ID>"
    export AZURE_TENANT_ID="<AZURE_TENANT_ID>"
    export AZURE_CLIENT_SECRET="<AZURE_CLIENT_SECRET>"
    
  2. Установите зависимости: Установите SDK Anthropic с помощью pip (требуется Python 3.8 или более поздней версии).

    pip install -U "anthropic"
    
  3. Выполните базовый пример кода , чтобы выполнить следующие задачи:

    1. Создайте клиент с использованием SDK Anthropic и аутентификации Microsoft Entra ID.
    2. Выполните базовый вызов API сообщений. Вызов синхронный.
    from anthropic import AnthropicFoundry
    from azure.identity import DefaultAzureCredential, get_bearer_token_provider
    
    baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name
    deploymentName = "claude-sonnet-4-6" # Replace with your deployment name
    
    # Create token provider for Entra ID authentication
    tokenProvider = get_bearer_token_provider(
        DefaultAzureCredential(), "https://ai.azure.com/.default"
    )
    
    # Create client with Entra ID authentication
    client = AnthropicFoundry(
        azure_ad_token_provider=tokenProvider,
        base_url=baseURL
    )
    
    # Send request
    message = client.messages.create(
        model=deploymentName,
        messages=[
            {"role": "user", "content": "What are 3 things to visit in Seattle?"}
        ],
        max_tokens=1048,
        temperature=1,
        thinking={"type":"adaptive"},
        output_config={"effort": "max"},
        stream=False
    )
    
    print(message.content)
    

    Ожидаемые выходные данные: Ответ JSON, содержащий завершение текста модели с тремя рекомендациями Сиэтла.

    Reference:Anthropic Клиентский пакет SDK, DefaultAzureCredential

Использование проверки подлинности ключа API

Важно

Claude Mythos Preview поддерживает только проверку подлинности Microsoft Entra ID.

Для конечных точек API сообщений используйте базовый URL-адрес и ключ API для аутентификации в службе.

  1. Install dependencies: установите пакет SDK Anthropic с помощью pip (требуется Python 3.8 или более поздней версии):

    pip install -U "anthropic"
    
  2. Выполните базовый пример кода , чтобы выполнить следующие задачи:

    1. Создайте клиент с пакетом SDK Anthropic, передав ключ API в конфигурацию пакета SDK. Этот метод проверки подлинности позволяет легко взаимодействовать со службой.
    2. Выполните базовый вызов API сообщений. Вызов синхронный.
    from anthropic import AnthropicFoundry
    
    baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name
    deploymentName = "claude-sonnet-4-6" # Replace with your deployment name
    apiKey = "YOUR_API_KEY" # Replace YOUR_API_KEY with your API key
    
    # Create client with API key authentication
    client = AnthropicFoundry(
        api_key=apiKey,
        base_url=baseURL
    )
    
    # Send request
    message = client.messages.create(
        model=deploymentName,
        messages=[
            {"role": "user", "content": "What are 3 things to visit in Seattle?"}
        ],
        max_tokens=1048,
        temperature=1,
        thinking={"type":"adaptive"},
        output_config={"effort": "max"},
        stream=False
    )
    
    print(message.content)
    

    Ожидаемые выходные данные: Ответ JSON, содержащий завершение текста модели с тремя рекомендациями Сиэтла.

    Reference:Anthropic Клиентский пакет SDK

Доступные модели Claude

Foundry поддерживает модели Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Opus 4.5, Claude Opus 4.1, Claude Sonnet 4.6, Claude Sonnet 4.5 и Claude Haiku 4.5 через стандартное глобальное развертывание. Эти модели имеют ключевые возможности:

  • Адаптивное мышление: обновление до расширенного мышления, которое дает Клоду свободу думать столько или меньше, сколько необходимо в зависимости от задачи и уровня усилий.
  • Углублённое мышление: улучшенное рассуждение для сложных задач.
  • Входные данные изображения и текста: сильные аналитические способности для анализа диаграмм, технических схем, отчетов и других визуальных элементов.
  • Создание кода: расширенное создание кода, анализ и отладка.

Дополнительные сведения о возможностях модели см. в разделе о возможностях моделей Claude.

Клод Мифос (ограниченный доступ к исследовательскому превью)

Важно

Claude Mythos Preview доступен только в качестве закрытого предварительного просмотра исследований. Доступ к модели предоставляется исключительно по усмотрению Anthropic и приоритетно используется для задач оборонительной кибербезопасности. См. системную карточку Claude Mythos Preview для ответственного использования.

Claude Mythos Preview поддерживает только проверку подлинности Microsoft Entra ID.

Claude Mythos Preview — это новый класс интеллекта, созданный для амбициозных проектов и являющийся лучшей в мире моделью для кибербезопасности, автономного программирования и долгосрочных агентов. Доступно только в качестве гейтированной предварительной версии с приоритетом доступа для оборонительных сценариев использования в кибербезопасности. Для предварительной версии Claude Mythos Preview предусмотрено окно контекста в 1 млн токенов и максимальная выходная величина 128 тыс.

  • Кибербезопасность: лучшая в мире модель для оборонной безопасности. Он может найти и предложить исправления для реальных уязвимостей в рабочих базах кода, а затем помочь подтвердить удержание исправлений.
  • Автономное программирование: обрабатывает полный цикл разработки более эффективно, чем любая из предыдущих моделей— исследование, реализация и тестирование в больших базах кода от цели до отправки.
  • Длительные агенты: устанавливает новый стандарт для агентской работы на длительную перспективу. Он может обеспечивать согласованное выполнение длительных, многочасовых задач, адаптируясь по мере изменения условий и продвигая работу вперед с меньшим количеством вмешательств.

Claude Mythos Preview поддерживает адаптивное мышление, обновление до расширенного мышления, которое дает Клоду свободу думать столько или меньше, сколько необходимо в зависимости от задачи и уровня усилий.

Claude Opus 4.7 (предварительная версия)

Совет

Следуйте инструкциям по миграции , чтобы перенести код API сообщений из предыдущих версий Claude в Claude Opus 4.7.

Клод Opus 4.7 — это самая мощная модель в семействе Claude Opus, улучшая производительность в программировании, рабочих процессах предприятия и длительных агентных задачах. Благодаря контекстному окну на 1M токенов и максимальному выходу 128K, Opus 4.7 идеально подходит для агентного кодирования, работы с корпоративными знаниями, длительных рабочих процессов с несколькими инструментами, многомодального вывода с высоким разрешением (до 2576 пикселей / 3,75 МП), финансового анализа и кибербезопасности. Opus 4.7 поддерживает адаптивное мышление, обновление до расширенного мышления, которое дает Клоду свободу думать столько или меньше, сколько необходимо в зависимости от задачи и уровня усилий.

Клод Опус 4.6 (предварительная версия)

Клод Opus 4.6 — это высокоспособная модель в семействе Claude Opus для написания кода, корпоративных агентов и профессиональной работы. Благодаря контекстному окну размера 1M токенов и максимальному размеру вывода до 128K, Opus 4.6 идеально подходит для производственного кода, сложных агентов, офисных задач, финансового анализа, кибербезопасности и работы с компьютером.

Клод Opus 4.5 (предварительная версия)

Клод Opus 4.5 является лидером отрасли в области программирования, агентов, использования компьютеров и корпоративных рабочих процессов. Благодаря окну контекста маркера 200K и максимальному выводу 64K, Opus 4.5 идеально подходит для промышленного кода, сложных программных агентов, офисных задач, финансового анализа, кибербезопасности и задач по использованию компьютера.

Claude Opus 4.1 (бета-версия)

Claude Opus 4.1 является лидером отрасли в области программирования. Она обеспечивает устойчивую производительность для длительных задач, требующих сосредоточенных усилий и тысяч шагов, значительно расширяя возможности решения агентов ИИ.

Клод Соннет 4.6 (предварительная версия)

Клод Соннет 4.6 обеспечивает масштабируемую аналитику границ, созданную для программирования, агентов и корпоративных рабочих процессов. С контекстным окном на 1M токенов и максимальным выходом 128K, Sonnet 4.6 идеально подходит для написания кода, агентов, офисных задач, финансового анализа, кибербезопасности и работы с компьютером.

Клод Соннет 4.5 (предварительная версия)

Предупреждение

Бета-версия контекста 1M в Claude Sonnet 4.5 будет прекращена после 30 апреля 2026 года.

Начиная с 1 мая 2026 г.:

  • Запросы , превышающие 200K токенов , включающих context-1m-2025-08-07 бета-заголовок в Sonnet 4.5, возвращают ошибку.
  • Запросы 200K токенов или меньше не будут затронуты, даже если заголовок присутствует.

Чтобы мигрировать, удалите context-1m-2025-08-07 бета-заголовок из запросов. Для рабочих нагрузок, требующих контекста 1M, перейдите в Claude Sonnet 4.6 (где общедоступен контекст 1M) или Клод Opus 4.6 или Claude Opus 4.7 для рабочих нагрузок с более высоким уровнем интеллекта.

Клод Соннет 4.5 — это высокопроизводительная модель, предназначенная для создания реальных агентов и обработки сложных, долгосрочных задач. Он обеспечивает сильный баланс скорости и стоимости для вариантов использования с большим объемом. Sonnet 4.5 также обеспечивает расширенную точность использования компьютера, что позволяет разработчикам направлять Клод использовать компьютеры так, как люди делают.

Клод Хайку 4.5 (предварительная версия)

Claude Haiku 4.5 обеспечивает производительность, близкую к передовым рубежам, для широкого спектра сценариев использования. Он выделяется как одна из лучших моделей программирования и агентных моделей, с оптимальной скоростью и стоимостью для поддержки бесплатных продуктов и масштабируемых субагентов.

Расширенные функции и возможности моделей Claude

Claude в модели Foundry поддерживает расширенные функции и возможности. Основные возможности повышают основные возможности Клода для обработки, анализа и создания содержимого в различных форматах и вариантах использования. Средства позволяют Claude взаимодействовать с внешними системами, выполнять код и выполнять автоматизированные задачи с помощью различных интерфейсов инструментов.

Ниже приведены некоторые основные возможности , поддерживаемые Foundry:

  • Большое окно контекста: Расширенное окно контекста, которое обрабатывает более крупные документы и более длинные беседы.

  • Навыки агента: Расширьте возможности Клода с помощью навыков.

  • Цитаты: Основывайте ответы Клода на исходных документах.

  • Редактирование контекста: Автоматическое управление контекстом беседы с помощью настраиваемых стратегий.

  • Расширенное мышление: Расширенные возможности рассудок для сложных задач, доступных со всеми моделями Claude.

    Совет

    Для Opus 4.6 и Sonnet 4.6 параметр thinking поддерживает типы: enabled, disabledи adaptive. Тип adaptive позволяет модели решать, следует ли думать на основе сложности запросов и уровня усилий.

    Для Предварительной версии Mythos параметр thinking поддерживает толькоadaptive и enabled.

    Для Opus 4.7 thinking параметр поддерживает толькоadaptive и disabled.

  • Усилия: Возможность управлять балансом между качеством и затратами в ответах.

    Совет

    Параметр effort поддерживает уровни усилий: low, mediumи high. Для Opus 4.7, Opus 4.6 и Sonnet 4.6 параметр также поддерживает max уровень нагрузки. Используйте этот параметр с или без включения мышления.

  • Поддержка PDF: Обработка и анализ текста и визуального содержимого из pdf-документов.

  • Кэширование запросов: Предоставьте Клоду дополнительные знания о фоновом опыте и примеры выходных данных, чтобы снизить затраты и задержку.

Ниже перечислены некоторые средства , поддерживаемые Foundry:

  • Соединитель MCP: Подключитесь к удаленным серверам MCP непосредственно из API сообщений без отдельного клиента MCP.
  • Память: Храните и извлекайте информацию в различных беседах. Создавайте базы знаний с течением времени, сохраняйте контекст проекта и учитесь на основе прошлых взаимодействий.
  • Веб-получение: Получение полного содержимого из указанных веб-страниц и PDF-документов для подробного анализа.

Полный список поддерживаемых возможностей и инструментов см. в обзоре функций Claude.

Поддержка агента

  • Microsoft Agent Framework поддерживает создание агентов, использующих модели Claude.
  • Создавайте пользовательских ИИ агентов с помощью SDK агента Claude.

Квоты и ограничения API

Важно

В настоящее время только подписки Enterprise и MCA-E имеют право на использование модели Claude в Foundry.

Модели Claude в Foundry имеют следующие ограничения скорости, измеряемые в токенах в минуту (TPM) и запросов в минуту (RPM):

Модель Тип развертывания Rpm по умолчанию TPM по умолчанию Корпоративные решения и MCA-E RPM Корпоративный и MCA-E TPM
claude-opus-4-7 Глобальный стандарт 0 0 2 000 2,000,000
claude-opus-4-6 Глобальный стандарт 0 0 2 000 2,000,000
claude-opus-4-5 Глобальный стандарт 0 0 2 000 2,000,000
claude-opus-4-1 Глобальный стандарт 0 0 2 000 2,000,000
claude-sonnet-4-6 Глобальный стандарт 0 0 2 000 2,000,000
claude-sonnet-4-5 Глобальный стандарт 0 0 4,000 2,000,000
claude-haiku-4-5 Глобальный стандарт 0 0 4,000 4 000 000

Чтобы увеличить квоту за пределами ограничений по умолчанию, отправьте запрос с помощью формы запроса на увеличение квоты.

Рекомендации по ограничению скорости

Чтобы оптимизировать использование и избежать ограничения скорости, выполните приведенные ниже действия.

  • Реализуйте логику повторных попыток: обработка ответов 429 с экспоненциальной задержкой.
  • Пакетные запросы. Объединение нескольких запросов по возможности.
  • Мониторинг использования: отслеживание потребления токенов и шаблонов запросов.
  • Используйте соответствующие модели: выберите подходящую модель Claude для вашего варианта использования.

Рекомендации по ответственному использованию искусственного интеллекта

При использовании моделей Claude в Foundry рассмотрите следующие ответственные методики ИИ:

Лучшие практики

Следуйте приведенным ниже рекомендациям при работе с моделями Claude в Foundry:

Выбор модели

Выберите соответствующую модель Claude на основе конкретных требований:

  • Claude Mythos Preview: для защитной кибербезопасности, автономного кодирования и долгосрочных агентов.
  • Claude Opus 4.7: наиболее способная модель для написания кода, корпоративных рабочих процессов и длительных задач агента.
  • Клод Opus 4.6: высокоспособная модель для создания агентов, программирования и корпоративных рабочих процессов.
  • Claude Opus 4.5: оптимальная производительность в коде, агентах, использовании компьютера и корпоративных рабочих процессах.
  • Клод Opus 4.1: сложные рассуждения и приложения для предприятий.
  • Клод Соннет 4.6. Аналитика границ в масштабе для кодирования, агентов и большинства вариантов использования.
  • Claude Sonnet 4.5: баланс производительности и возможностей, рабочих процессов.
  • Клод Хайку 4.5: оптимизация скорости и затрат, обработка больших объемов.

Конструирование подсказок

  • Четкие инструкции. Укажите конкретные и подробные запросы.
  • Управление контекстом: эффективно используйте доступное окно контекста.
  • Определения ролей: используйте системные сообщения для определения роли и поведения помощника.
  • Структурированные запросы: используйте согласованное форматирование для улучшения результатов.

Оптимизация затрат

  • Управление маркерами: мониторинг и оптимизация использования маркеров.
  • Выбор модели. Используйте наиболее эффективную модель для вашего варианта использования.
  • Кэширование. Реализуйте явное кэширование запросов , если это необходимо.
  • Пакетная обработка запросов: объединение нескольких запросов по возможности.

Устранение неполадок

В следующей таблице перечислены распространенные ошибки при работе с моделями Claude в Foundry и их решениях:

Ошибка Причина Решение
401 Несанкционированный доступ Недопустимый или просроченный ключ API, или неправильная область действия токена Entra ID. Проверьте правильность ключа API. Для Entra ID убедитесь, что вы используете область https://ai.azure.com/.default.
403 Запрещено Недостаточно разрешений на ресурс или подписку. Убедитесь, что у вас есть роль участника или владельца в группе ресурсов. Для Entra ID убедитесь, что назначена роль Cognitive Services User.
404 Не найдено Неверный URL-адрес конечной точки или имя развертывания. Убедитесь, что базовый URL-адрес соответствует шаблону https://<resource-name>.services.ai.azure.com/anthropic , а имя развертывания соответствует конфигурации.
429 слишком много запросов Превышено ограничение скорости для уровня подписки. Реализуйте экспоненциальный отступ с логикой повторных попыток. Рассмотрите возможность уменьшения частоты запросов или запроса увеличения квоты.
Ошибка правомочности подписки Подписка некорпоративная или не относящаяся к MCA-E. Для моделей Claude требуется подписка Enterprise или MCA-E. Дополнительные сведения см. в квотах и ограничениях API .
Регион недоступен Попытка развертывания в неподдерживаемом регионе. Развертывание в восточной части США 2 или Центральной Швеции, поддерживаемые регионы для моделей Claude.