Развертывание и использование моделей MAI в Microsoft Foundry (предварительная версия)

MAI-Image-2 и MAI-Image-2e — это модели создания текста в изображение, которые создают высококачественные визуальные изображения из запросов естественного языка.

В этой статье описано, как:

  • Развертывание моделей создания образов MAI в Microsoft Foundry
  • Проверка подлинности с помощью ключей Microsoft Entra ID или API
  • Создание образов с помощью API создания образов MAI

Необходимые условия

  • Подписка Azure с допустимым методом оплаты. Если у вас нет подписки Azure, создайте учетную запись paid Azure.
  • Доступ к Microsoft Foundry с соответствующими разрешениями для создания ресурсов и управления ими.
  • Проект Microsoft Foundry. MAI-Image-2 и MAI-Image-2e доступны для глобального стандартного развертывания (западная часть США, восточная часть США, западная часть США, Западная Европа, Центральная Швеция и Южная Индия).
  • роль вкладчика Cognitive Services в ресурсе Azure AI Foundry для развертывания моделей. Дополнительные сведения см. в разделе роли Azure RBAC.

Развертывание моделей создания образов MAI

MAI-Image-2 и MAI-Image-2e доступны для глобального стандартного развертывания в западной части США, восточной части США, западной части США, Западной Европы, Центральной Швеции и южной Индии. Чтобы развернуть модель, следуйте инструкциям в статье Deploy Microsoft Foundry Models на портале Foundry.

Кроме того, можно развернуть модель с помощью Azure CLI. В следующем коде показано развертывание MAI-Image-2e. Чтобы развернуть MAI-Image-2, замените --model-name MAI-Image-2e на --model-name MAI-Image-2 и --model-version 2026-04-09 на --model-version 2026-02-20.

az cognitiveservices account deployment create \
  --name <ACCOUNT_NAME> \
  --resource-group <RESOURCE_GROUP> \
  --deployment-name <DEPLOYMENT_NAME> \
  --model-name MAI-Image-2e \
  --model-format Microsoft \
  --model-version 2026-04-09 \
  --sku-name GlobalStandard \
  --sku-capacity 1

Справка:az cognitiveservices account deployment create

После развертывания используйте игровую площадку Foundry для интерактивного тестирования модели с текстовыми запросами.

Доступные модели создания образов MAI

Foundry поддерживает использование MAI-Image-2 (предварительная версия) и MAI-Image-2e (предварительная версия). Каждая из этих моделей имеет ключевые возможности, которые включают:

  • Генерация изображений по тексту: Создавайте высококачественные изображения на основе запросов на естественном языке, позволяя пользователям преобразовывать текстовые описания в визуально последовательные результаты, подходящие для широкого спектра случаев использования в творческих и дизайнерских областях.
  • Синтез фотореалистических изображений: Способен создавать реалистичные изображения с согласованной визуальной структурой, что делает его подходящим для сценариев визуализации концепции и создания контента.
  • Продукт, брендинг и коммерческий дизайн: Хорошо подходит для изображений продуктов, маркетинговых визуальных элементов, активов бренда и коммерческих творческих рабочих процессов.

Дополнительные сведения о возможностях модели см. в разделе о возможностях моделей Microsoft в разделе Foundry Models, продаваемых непосредственно через Azure.

MAI-Image-2 (предварительная версия)

MAI-Image-2 (предварительная версия) — это модель создания текста в изображение, предназначенная для создания высококачественных визуальных изображений из запросов естественного языка. В ней используется диффуционный метод создания для постепенного уточнения изображений, что обеспечивает строгое выравнивание между входным текстом и созданными выходными данными. Модель оптимизирована для создания разнообразных и согласованных изображений в широком спектре творческих и конструкторских сценариев, что позволяет хорошо подходит для таких задач, как визуализация концепции, создание творческого контента и рабочие процессы проектирования изображений.

MAI-Image-2e (предварительная версия)

MAI-Image-2e (предварительная версия) обеспечивает высококачественную генерацию изображений, как и MAI-Image-2, но до 22% быстрее и в четыре раза эффективнее, что делает его самым умным выбором для разработчиков, которые разрабатывают в крупном масштабе. MAI-Image-2e лучше всего подходит для сценариев с большим объёмом и быстрым выполнением — например, масштабных изображений продуктов, маркетинговых вариаций, брендовых материалов или любого рабочего процесса, где ключевую роль играют производительность и стоимость изображения.

Общие сведения о создании изображений с помощью моделей создания образов MAI

После развертывания модели создания образов MAI используйте API создания образов MAI для создания образов. Это конечная точка, управляемая Microsoft, которая принимает текстовый запрос и возвращает изображение PNG.

Конечная точка API

Конечная точка API имеет следующую форму:

https://<resource-name>.services.ai.azure.com/mai/v1/images/generations

Для аутентификации требуется конечная точка ресурса и либо токен Microsoft Entra ID, либо ключ API. Эти значения можно найти в разделе Keys and Endpoint ресурса на портале Azure или на странице сведений о развертывании на портале Foundry portal.

Возможности модели

Обе модели принимают текстовые входные данные (32 000 маркеров) и выводит одно изображение PNG. И width, и height должны быть по крайней мере 768 пикселей каждое. Общее число пикселей (width × height) не должно превышать 1 048 576 (эквивалентно 1024×1024). Поскольку ограничение находится на общих пикселях, а не на каждом измерении по отдельности, одно измерение может превышать 1024, пока общее значение остается в пределах предела. Например, изображение 768×1365 имеет 1048 320 пикселей, что находится в пределах допустимого максимального общего количества пикселей.

В следующей таблице перечислены параметры запроса:

Параметр Тип Описание
model Строка Имя развертывания, назначенное при развертывании модели.
prompt Строка Текстовый запрос, описывающий изображение для создания. Максимальная длина контекста: 32 000 маркеров.
width Целое число Ширина выходного изображения в пикселях. Минимум: 768. Продукт width × height не должен превышать 1048 576.
height Целое число Высота выходного изображения в пикселях. Минимум: 768. Продукт width × height не должен превышать 1048 576.

Примечание

Формат выходных данных всегда имеет формат PNG. Максимальное количество пикселей составляет 1 048 576 (эквивалентно 1024×1024). Оба width и height должны быть по крайней мере 768 пикселей каждый. Любое измерение может превышать 1024, пока общее число пикселей остается в пределах предела.

Создание изображений

В следующих примерах показано, как создать изображение из текстового запроса с помощью моделей создания изображений MAI с ПОМОЩЬЮ API создания образов MAI.

Использование проверки подлинности ключа API

  1. Установите библиотеку requests :

    pip install requests
    
  2. Задайте переменные среды:

    export AZURE_ENDPOINT="https://<resource-name>.services.ai.azure.com"
    export AZURE_API_KEY="<your-api-key>"
    export DEPLOYMENT_NAME="<your-deployment-name>"
    
  3. Выполните следующий код:

    import os
    import base64
    import requests
    
    endpoint = os.environ["AZURE_ENDPOINT"]
    api_key = os.environ["AZURE_API_KEY"]
    deployment_name = os.environ["DEPLOYMENT_NAME"]
    
    width = 1024
    height = 1024
    
    url = f"{endpoint}/mai/v1/images/generations"
    
    payload = {
        "model": deployment_name,
        "prompt": "A photorealistic image of a mountain lake at sunrise",
        "width": width,
        "height": height
    }
    
    response = requests.post(
        url,
        headers={
            "Content-Type": "application/json",
            "api-key": api_key,
        },
        json=payload,
    )
    response.raise_for_status()
    
    result = response.json()
    print(result)
    
    image_data = [
        output
        for output in result.get("data", [])
        if "b64_json" in output
    ]
    
    if image_data:
        image_base64 = image_data[0]["b64_json"]
        output_path = "output.png"
        with open(output_path, "wb") as f:
            f.write(base64.b64decode(image_base64))
        print(f"Image saved to {output_path}")
    else:
        print("Unexpected response format:", result)
    

    Ожидаемые выходные данные: Ответ JSON, содержащий созданные данные изображения в формате base64. Изображение декодируется и сохраняется как output.png в текущем каталоге.

Используйте аутентификацию Microsoft Entra ID

Чтобы использовать Microsoft Entra ID вместо ключа API, замените заголовок api-key маркером носителя, полученным с помощью DefaultAzureCredential:

  1. Установите библиотеку аутентификации Azure:

    pip install azure-identity
    
  2. Обновите заголовки запроса в предыдущем коде:

    from azure.identity import DefaultAzureCredential, get_bearer_token_provider
    
    token_provider = get_bearer_token_provider(
        DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
    )
    token = token_provider()
    
    headers = {
        "Content-Type": "application/json",
        "Authorization": f"Bearer {token}",
    }
    

    Справочник:DefaultAzureCredential

Квоты и ограничения API

Модели создания изображений MAI имеют следующие ограничения скорости, измеряемые в запросах в минуту (RPM). Уровень, доступный для вас, зависит от конфигурации подписки и развертывания.

Тип развертывания Уровень MAI-Image-2e RPM MAI-Image-2 RPM
Глобальный стандарт 1 18 9
Глобальный стандарт 2 30 15
Глобальный стандарт 3 60 30
Глобальный стандарт 4 90 45
Глобальный стандарт 5 120 60
Глобальный стандарт 6 180 90

Чтобы запросить увеличение квоты, отправьте форму запроса на увеличение квоты. Запросы обрабатываются в том порядке, в который они получены, и приоритет отправляется клиентам, которые активно используют существующее распределение квот.

Поиск и устранение неисправностей

Используйте следующую таблицу для устранения распространенных ошибок при работе с моделями создания образов MAI:

Ошибка Причина Исправить
401 Unauthorized Недопустимый ключ API или маркер с истекшим сроком действия Повторно создайте ключ на портале Azure. Для проверки подлинности Entra ID убедитесь, что область токена https://cognitiveservices.azure.com/.default.
404 Not Found Неправильное имя развертывания или URL-адрес конечной точки Проверьте имя развертывания и конечную точку на портале Foundry в разделе "Развертывания".
400 Bad Request width или height ниже минимального, или общее количество пикселей превышает максимальное число пикселей Убедитесь, что width и height каждый не менее 768, и что width × height ≤ 1,048,576.
429 Too Many Requests Превышено ограничение скорости Подождите и повторите попытку или запросите увеличение квоты.

Рекомендации по ответственному использованию искусственного интеллекта

При использовании моделей создания образов MAI в Foundry следует учитывать следующие рекомендации по искусственному интеллекту:

  • Учитывайте известные ограничения: несмотря на технические меры, такие как фильтрация данных и классификаторы контента, применяемые на уровне системы, модели создания изображений могут создавать вредное или неожиданное содержимое на основе запросов пользователей. К общим областям риска относятся насильственные или горькие материалы, сексуальное содержимое или нагота, изображения общественных деятелей, а также репликация товарных знаков или других защищенных материалов.
  • Настройте безопасность содержимого: Примените дополнительные меры, соответствующие вашему варианту использования, так как ни одна генеративная модель не является полностью защищенной от злонамеренных запросов.
  • Соблюдение применимых условий: Убедитесь, что использование созданных изображений соответствует условиям использования Microsoft и применимым законам об авторских правах и интеллектуальной собственности.
  • Будьте прозрачны: раскрывайте, что содержимое создается ИИ при совместном использовании или публикации изображений.
  • Избегайте вредного содержимого: не создавайте содержимое, которое может быть вредным, вводящим в заблуждение или нарушением конфиденциальности.