Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
MAI-Image-2 и MAI-Image-2e — это модели создания текста в изображение, которые создают высококачественные визуальные изображения из запросов естественного языка.
В этой статье описано, как:
- Развертывание моделей создания образов MAI в Microsoft Foundry
- Проверка подлинности с помощью ключей Microsoft Entra ID или API
- Создание образов с помощью API создания образов MAI
Необходимые условия
- Подписка Azure с допустимым методом оплаты. Если у вас нет подписки Azure, создайте учетную запись paid Azure.
- Доступ к Microsoft Foundry с соответствующими разрешениями для создания ресурсов и управления ими.
- Проект Microsoft Foundry. MAI-Image-2 и MAI-Image-2e доступны для глобального стандартного развертывания (западная часть США, восточная часть США, западная часть США, Западная Европа, Центральная Швеция и Южная Индия).
- роль вкладчика Cognitive Services в ресурсе Azure AI Foundry для развертывания моделей. Дополнительные сведения см. в разделе роли Azure RBAC.
Развертывание моделей создания образов MAI
MAI-Image-2 и MAI-Image-2e доступны для глобального стандартного развертывания в западной части США, восточной части США, западной части США, Западной Европы, Центральной Швеции и южной Индии. Чтобы развернуть модель, следуйте инструкциям в статье Deploy Microsoft Foundry Models на портале Foundry.
Кроме того, можно развернуть модель с помощью Azure CLI. В следующем коде показано развертывание MAI-Image-2e. Чтобы развернуть MAI-Image-2, замените --model-name MAI-Image-2e на --model-name MAI-Image-2 и --model-version 2026-04-09 на --model-version 2026-02-20.
az cognitiveservices account deployment create \
--name <ACCOUNT_NAME> \
--resource-group <RESOURCE_GROUP> \
--deployment-name <DEPLOYMENT_NAME> \
--model-name MAI-Image-2e \
--model-format Microsoft \
--model-version 2026-04-09 \
--sku-name GlobalStandard \
--sku-capacity 1
Справка:az cognitiveservices account deployment create
После развертывания используйте игровую площадку Foundry для интерактивного тестирования модели с текстовыми запросами.
Доступные модели создания образов MAI
Foundry поддерживает использование MAI-Image-2 (предварительная версия) и MAI-Image-2e (предварительная версия). Каждая из этих моделей имеет ключевые возможности, которые включают:
- Генерация изображений по тексту: Создавайте высококачественные изображения на основе запросов на естественном языке, позволяя пользователям преобразовывать текстовые описания в визуально последовательные результаты, подходящие для широкого спектра случаев использования в творческих и дизайнерских областях.
- Синтез фотореалистических изображений: Способен создавать реалистичные изображения с согласованной визуальной структурой, что делает его подходящим для сценариев визуализации концепции и создания контента.
- Продукт, брендинг и коммерческий дизайн: Хорошо подходит для изображений продуктов, маркетинговых визуальных элементов, активов бренда и коммерческих творческих рабочих процессов.
Дополнительные сведения о возможностях модели см. в разделе о возможностях моделей Microsoft в разделе Foundry Models, продаваемых непосредственно через Azure.
MAI-Image-2 (предварительная версия)
MAI-Image-2 (предварительная версия) — это модель создания текста в изображение, предназначенная для создания высококачественных визуальных изображений из запросов естественного языка. В ней используется диффуционный метод создания для постепенного уточнения изображений, что обеспечивает строгое выравнивание между входным текстом и созданными выходными данными. Модель оптимизирована для создания разнообразных и согласованных изображений в широком спектре творческих и конструкторских сценариев, что позволяет хорошо подходит для таких задач, как визуализация концепции, создание творческого контента и рабочие процессы проектирования изображений.
MAI-Image-2e (предварительная версия)
MAI-Image-2e (предварительная версия) обеспечивает высококачественную генерацию изображений, как и MAI-Image-2, но до 22% быстрее и в четыре раза эффективнее, что делает его самым умным выбором для разработчиков, которые разрабатывают в крупном масштабе. MAI-Image-2e лучше всего подходит для сценариев с большим объёмом и быстрым выполнением — например, масштабных изображений продуктов, маркетинговых вариаций, брендовых материалов или любого рабочего процесса, где ключевую роль играют производительность и стоимость изображения.
Общие сведения о создании изображений с помощью моделей создания образов MAI
После развертывания модели создания образов MAI используйте API создания образов MAI для создания образов. Это конечная точка, управляемая Microsoft, которая принимает текстовый запрос и возвращает изображение PNG.
Конечная точка API
Конечная точка API имеет следующую форму:
https://<resource-name>.services.ai.azure.com/mai/v1/images/generations
Для аутентификации требуется конечная точка ресурса и либо токен Microsoft Entra ID, либо ключ API. Эти значения можно найти в разделе Keys and Endpoint ресурса на портале Azure или на странице сведений о развертывании на портале Foundry portal.
Возможности модели
Обе модели принимают текстовые входные данные (32 000 маркеров) и выводит одно изображение PNG. И width, и height должны быть по крайней мере 768 пикселей каждое. Общее число пикселей (width × height) не должно превышать 1 048 576 (эквивалентно 1024×1024). Поскольку ограничение находится на общих пикселях, а не на каждом измерении по отдельности, одно измерение может превышать 1024, пока общее значение остается в пределах предела. Например, изображение 768×1365 имеет 1048 320 пикселей, что находится в пределах допустимого максимального общего количества пикселей.
В следующей таблице перечислены параметры запроса:
| Параметр | Тип | Описание |
|---|---|---|
model |
Строка | Имя развертывания, назначенное при развертывании модели. |
prompt |
Строка | Текстовый запрос, описывающий изображение для создания. Максимальная длина контекста: 32 000 маркеров. |
width |
Целое число | Ширина выходного изображения в пикселях. Минимум: 768. Продукт width × height не должен превышать 1048 576. |
height |
Целое число | Высота выходного изображения в пикселях. Минимум: 768. Продукт width × height не должен превышать 1048 576. |
Примечание
Формат выходных данных всегда имеет формат PNG. Максимальное количество пикселей составляет 1 048 576 (эквивалентно 1024×1024). Оба width и height должны быть по крайней мере 768 пикселей каждый. Любое измерение может превышать 1024, пока общее число пикселей остается в пределах предела.
Создание изображений
В следующих примерах показано, как создать изображение из текстового запроса с помощью моделей создания изображений MAI с ПОМОЩЬЮ API создания образов MAI.
Использование проверки подлинности ключа API
Установите библиотеку
requests:pip install requestsЗадайте переменные среды:
export AZURE_ENDPOINT="https://<resource-name>.services.ai.azure.com" export AZURE_API_KEY="<your-api-key>" export DEPLOYMENT_NAME="<your-deployment-name>"Выполните следующий код:
import os import base64 import requests endpoint = os.environ["AZURE_ENDPOINT"] api_key = os.environ["AZURE_API_KEY"] deployment_name = os.environ["DEPLOYMENT_NAME"] width = 1024 height = 1024 url = f"{endpoint}/mai/v1/images/generations" payload = { "model": deployment_name, "prompt": "A photorealistic image of a mountain lake at sunrise", "width": width, "height": height } response = requests.post( url, headers={ "Content-Type": "application/json", "api-key": api_key, }, json=payload, ) response.raise_for_status() result = response.json() print(result) image_data = [ output for output in result.get("data", []) if "b64_json" in output ] if image_data: image_base64 = image_data[0]["b64_json"] output_path = "output.png" with open(output_path, "wb") as f: f.write(base64.b64decode(image_base64)) print(f"Image saved to {output_path}") else: print("Unexpected response format:", result)Ожидаемые выходные данные: Ответ JSON, содержащий созданные данные изображения в формате base64. Изображение декодируется и сохраняется как
output.pngв текущем каталоге.
Используйте аутентификацию Microsoft Entra ID
Чтобы использовать Microsoft Entra ID вместо ключа API, замените заголовок api-key маркером носителя, полученным с помощью DefaultAzureCredential:
Установите библиотеку аутентификации Azure:
pip install azure-identityОбновите заголовки запроса в предыдущем коде:
from azure.identity import DefaultAzureCredential, get_bearer_token_provider token_provider = get_bearer_token_provider( DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default" ) token = token_provider() headers = { "Content-Type": "application/json", "Authorization": f"Bearer {token}", }Справочник:DefaultAzureCredential
Квоты и ограничения API
Модели создания изображений MAI имеют следующие ограничения скорости, измеряемые в запросах в минуту (RPM). Уровень, доступный для вас, зависит от конфигурации подписки и развертывания.
| Тип развертывания | Уровень | MAI-Image-2e RPM | MAI-Image-2 RPM |
|---|---|---|---|
| Глобальный стандарт | 1 | 18 | 9 |
| Глобальный стандарт | 2 | 30 | 15 |
| Глобальный стандарт | 3 | 60 | 30 |
| Глобальный стандарт | 4 | 90 | 45 |
| Глобальный стандарт | 5 | 120 | 60 |
| Глобальный стандарт | 6 | 180 | 90 |
Чтобы запросить увеличение квоты, отправьте форму запроса на увеличение квоты. Запросы обрабатываются в том порядке, в который они получены, и приоритет отправляется клиентам, которые активно используют существующее распределение квот.
Поиск и устранение неисправностей
Используйте следующую таблицу для устранения распространенных ошибок при работе с моделями создания образов MAI:
| Ошибка | Причина | Исправить |
|---|---|---|
401 Unauthorized |
Недопустимый ключ API или маркер с истекшим сроком действия | Повторно создайте ключ на портале Azure. Для проверки подлинности Entra ID убедитесь, что область токена https://cognitiveservices.azure.com/.default. |
404 Not Found |
Неправильное имя развертывания или URL-адрес конечной точки | Проверьте имя развертывания и конечную точку на портале Foundry в разделе "Развертывания". |
400 Bad Request |
width или height ниже минимального, или общее количество пикселей превышает максимальное число пикселей |
Убедитесь, что width и height каждый не менее 768, и что width × height ≤ 1,048,576. |
429 Too Many Requests |
Превышено ограничение скорости | Подождите и повторите попытку или запросите увеличение квоты. |
Рекомендации по ответственному использованию искусственного интеллекта
При использовании моделей создания образов MAI в Foundry следует учитывать следующие рекомендации по искусственному интеллекту:
- Учитывайте известные ограничения: несмотря на технические меры, такие как фильтрация данных и классификаторы контента, применяемые на уровне системы, модели создания изображений могут создавать вредное или неожиданное содержимое на основе запросов пользователей. К общим областям риска относятся насильственные или горькие материалы, сексуальное содержимое или нагота, изображения общественных деятелей, а также репликация товарных знаков или других защищенных материалов.
- Настройте безопасность содержимого: Примените дополнительные меры, соответствующие вашему варианту использования, так как ни одна генеративная модель не является полностью защищенной от злонамеренных запросов.
- Соблюдение применимых условий: Убедитесь, что использование созданных изображений соответствует условиям использования Microsoft и применимым законам об авторских правах и интеллектуальной собственности.
- Будьте прозрачны: раскрывайте, что содержимое создается ИИ при совместном использовании или публикации изображений.
- Избегайте вредного содержимого: не создавайте содержимое, которое может быть вредным, вводящим в заблуждение или нарушением конфиденциальности.