API компьютерного зрения

Извлеките богатые сведения из изображений для классификации и обработки визуальных данных и защиты пользователей от нежелательного содержимого с помощью этой Службы Azure Cognitive Service.

Этот соединитель доступен в следующих продуктах и регионах:

Услуга Class Регионы
Copilot Studio Стандарт Все регионы Power Automate
Логические приложения Стандарт Все регионы Logic Apps
Power Apps Стандарт Все регионы Power Apps
Power Automate Стандарт Все регионы Power Automate
Контакт
Имя Microsoft
URL Поддержка Microsoft LogicApps
Поддержка Microsoft Power Automate
Поддержка Microsoft Power Apps
Метаданные соединителя
Publisher Microsoft
Веб-сайт https://azure.microsoft.com/services/cognitive-services/computer-vision/

Для использования этой интеграции потребуется ресурс Cognitive Service на портале Azure. Вы получите конечную точку и ключ для проверки подлинности приложений. Чтобы сделать подключение, укажите ключ учетной записи, URL-адрес сайта и выберите "Создать подключение". Дополнительные сведения см. в статье об затратах на операции подключения.

Теперь вы готовы начать использовать эту интеграцию.

Известные проблемы и ограничения

Обратите внимание, что результаты операции могут быть неполными из-за базовой природы API Cognitive Service , которая основана на машинном обучении и распознавании шаблонов.

Подключение с помощью идентификатора Microsoft Entra

Чтобы создать подключения с идентификатором Microsoft Entra, необходимо добавить роль пользователя Cognitive Services в учетную запись для доступа. Чтобы использовать это подключение, необходимо ввести уникальный поддомен, связанный с ресурсом Cognitive Services, в вспомогательные операции.

Операции, не поддерживаемые проверкой подлинности идентификатора Microsoft Entra

При использовании проверки подлинности идентификатора Microsoft Entra id поддерживаются только действия версии 3. Устаревшие действия будут продолжать работать с Access Key проверкой подлинности, но при использовании с подключением идентификатора Microsoft Entra ID завершится ошибкой.

Создание подключения

Соединитель поддерживает следующие типы проверки подлинности:

Ключ API Ключ API (ApiKey) Все регионы Доступный для общего пользования
По умолчанию [не рекомендуется] Этот параметр предназначен только для старых подключений без явного типа проверки подлинности и предоставляется только для обратной совместимости. Все регионы Недоступен для совместного использования

Ключ API

Идентификатор проверки подлинности: keyBasedAuth

Применимо: все регионы

Ключ API (ApiKey)

Это совместное подключение. Если приложение power app предоставлено другому пользователю, подключение также предоставляется совместно. Дополнительные сведения см. в обзоре соединителей для приложений на основе холста — Power Apps | Документация Майкрософт

Имя Тип Description Обязательно
Ключ учетной записи securestring Ключ учетной записи Cognitive Services True
URL-адрес сайта струна URL-адрес корневого сайта (пример: https://westus.api.cognitive.microsoft.com)

По умолчанию [не рекомендуется]

Применимо: все регионы

Этот параметр предназначен только для старых подключений без явного типа проверки подлинности и предоставляется только для обратной совместимости.

Это недоступно для общего доступа. Если приложение power предоставляется другому пользователю, пользователю будет предложено явно создать новое подключение.

Имя Тип Description Обязательно
Ключ учетной записи securestring Ключ учетной записи Cognitive Services True
URL-адрес сайта струна URL-адрес корневого сайта (пример: https://westus.api.cognitive.microsoft.com ). Если url-адрес сайта не указан, по умолчанию будет иметь значение "https://westus.api.cognitive.microsoft.com".

Ограничения регулирования

Имя Вызовы Период обновления
Вызовы API для каждого подключения 1200 60 секунд

Действия

Analyze Image

Эта операция извлекает широкий набор визуальных функций на основе содержимого изображения.

Анализ изображения (версия 3) (предварительная версия)

Эта операция извлекает широкий набор визуальных функций на основе содержимого изображения.

Изображение тега (версия 3) (предварительная версия)

Создает список слов или тегов, относящихся к содержимому предоставленного изображения.

Обнаружение объектов

Создает список детекированных объектов в предоставленном изображении.

Обнаружение объектов (версия 3) (предварительная версия)

Создает список детекированных объектов в предоставленном изображении.

Описание URL-адреса изображения

Эта операция создает описание URL-адреса изображения на удобочитаемом языке с полными предложениями.

Описание URL-адреса изображения (версия 3) (предварительная версия)

Эта операция создает описание URL-адреса изображения на удобочитаемом языке с полными предложениями.

Описание образа (версия 3) (предварительная версия)

Эта операция создает описание изображения на удобочитаемом языке с полными предложениями.

Описание содержимого изображения

Эта операция создает описание содержимого изображения на удобочитаемом языке с полными предложениями.

Описание содержимого изображения (версия 3) (предварительная версия)

Эта операция создает описание содержимого изображения на удобочитаемом языке с полными предложениями.

Описать изображение

Эта операция создает описание изображения на удобочитаемом языке с полными предложениями.

Оптическое распознавание символов (OCR) в JSON

Оптическое распознавание символов (OCR) обнаруживает текст на изображении и извлекает распознанные символы в поток JSON, доступный для машинного использования.

Оптическое распознавание символов (OCR) в JSON (V3) (предварительная версия)

Оптическое распознавание символов (OCR) обнаруживает текст на изображении и извлекает распознанные символы в поток JSON, доступный для машинного использования.

Оптическое распознавание символов (OCR) в текст

Оптическое распознавание символов (OCR) обнаруживает текст в изображении и извлекает распознанные символы в текстовый файл.

Оптическое распознавание символов (OCR) в текст (версия 3) (предварительная версия)

Оптическое распознавание символов (OCR) обнаруживает текст в изображении и извлекает распознанные символы в текстовый файл.

Получение интересующей области

Возвращает ограничивающее поле вокруг наиболее важной области изображения.

Получение области интересов (версия 3) (предварительная версия)

Возвращает ограничивающее поле вокруг наиболее важной области изображения.

Распознавание содержимого конкретного домена

Распознать знаменитостей или ориентиров на изображении.

Распознавание содержимого конкретного домена (версия 3) (предварительная версия)

Распознать знаменитостей или ориентиров на изображении.

Создание эскиза (версия 3) (предварительная версия)

Эта операция создает эскиз изображения с указанной пользователем шириной и высотой.

Создать миниатюру

Эта операция создает эскиз изображения с указанной пользователем шириной и высотой.

Тег Изображение

Создает список слов или тегов, относящихся к содержимому предоставленного изображения.

Analyze Image

Эта операция извлекает широкий набор визуальных функций на основе содержимого изображения.

Параметры

Имя Ключ Обязательно Тип Описание
Language
language string

Служба вернет результаты распознавания на указанном языке.

Источник изображения
format True string

Источник изображения — включен или по URL-адресу ссылки.

Изображение
Image True dynamic

Возвращаемое значение

Тело
AnalyzeResponse

Анализ изображения (версия 3) (предварительная версия)

Эта операция извлекает широкий набор визуальных функций на основе содержимого изображения.

Параметры

Имя Ключ Обязательно Тип Описание
Поддомен ресурсов или регион
subdomainName True string

Поддомен Azure или географический регион (например, westus)

Language
language string

Служба вернет результаты распознавания на указанном языке.

Источник изображения
format True string

Источник изображения — включен или по URL-адресу ссылки.

Изображение
Image True dynamic

Возвращаемое значение

Тело
AnalyzeResponse

Изображение тега (версия 3) (предварительная версия)

Создает список слов или тегов, относящихся к содержимому предоставленного изображения.

Параметры

Имя Ключ Обязательно Тип Описание
Поддомен ресурсов или регион
subdomainName True string

Поддомен Azure или географический регион (например, westus)

Источник изображения
format True string

Источник изображения — включен или по URL-адресу ссылки.

Изображение
Image True dynamic

Возвращаемое значение

Тело
TagResponse

Обнаружение объектов

Создает список детекированных объектов в предоставленном изображении.

Параметры

Имя Ключ Обязательно Тип Описание
Источник изображения
format True string

Источник изображения — включен или по URL-адресу ссылки.

Изображение
Image True dynamic

Возвращаемое значение

Тело
DetectResponse

Обнаружение объектов (версия 3) (предварительная версия)

Создает список детекированных объектов в предоставленном изображении.

Параметры

Имя Ключ Обязательно Тип Описание
Поддомен ресурсов или регион
subdomainName True string

Поддомен Azure или географический регион (например, westus)

Источник изображения
format True string

Источник изображения — включен или по URL-адресу ссылки.

Изображение
Image True dynamic

Возвращаемое значение

Тело
DetectResponse

Описание URL-адреса изображения

Эта операция создает описание URL-адреса изображения на удобочитаемом языке с полными предложениями.

Параметры

Имя Ключ Обязательно Тип Описание
Максимальное число кандидатов
maxCandidates number

Максимальное количество возвращаемых описаний кандидатов.

Language
language string

Служба вернет результаты распознавания на указанном языке.

URL-адрес изображения
url url

Источник ссылки на изображение по URL-адресу.

Возвращаемое значение

Тело
DescribeResponse

Описание URL-адреса изображения (версия 3) (предварительная версия)

Эта операция создает описание URL-адреса изображения на удобочитаемом языке с полными предложениями.

Параметры

Имя Ключ Обязательно Тип Описание
Поддомен ресурсов или регион
subdomainName True string

Поддомен Azure или географический регион (например, westus)

Максимальное число кандидатов
maxCandidates number

Максимальное количество возвращаемых описаний кандидатов.

Language
language string

Служба вернет результаты распознавания на указанном языке.

URL-адрес изображения
url url

Источник ссылки на изображение по URL-адресу.

Возвращаемое значение

Тело
DescribeResponse

Описание образа (версия 3) (предварительная версия)

Эта операция создает описание изображения на удобочитаемом языке с полными предложениями.

Параметры

Имя Ключ Обязательно Тип Описание
Поддомен ресурсов или регион
subdomainName True string

Поддомен Azure или географический регион (например, westus)

Максимальное число кандидатов
maxCandidates number

Максимальное количество возвращаемых описаний кандидатов.

Language
language string

Служба вернет результаты распознавания на указанном языке.

Источник изображения
format True string

Источник изображения — включен или по URL-адресу ссылки.

Изображение
Image True dynamic

Возвращаемое значение

Тело
DescribeResponse

Описание содержимого изображения

Эта операция создает описание содержимого изображения на удобочитаемом языке с полными предложениями.

Параметры

Имя Ключ Обязательно Тип Описание
Максимальное число кандидатов
maxCandidates number

Максимальное количество возвращаемых описаний кандидатов.

Language
language string

Служба вернет результаты распознавания на указанном языке.

Содержимое изображения
Image True binary

Источник ссылки на изображение в тексте.

Возвращаемое значение

Тело
DescribeResponse

Описание содержимого изображения (версия 3) (предварительная версия)

Эта операция создает описание содержимого изображения на удобочитаемом языке с полными предложениями.

Параметры

Имя Ключ Обязательно Тип Описание
Поддомен ресурсов или регион
subdomainName True string

Поддомен Azure или географический регион (например, westus)

Максимальное число кандидатов
maxCandidates number

Максимальное количество возвращаемых описаний кандидатов.

Language
language string

Служба вернет результаты распознавания на указанном языке.

Содержимое изображения
Image True binary

Источник ссылки на изображение в тексте.

Возвращаемое значение

Тело
DescribeResponse

Описать изображение

Эта операция создает описание изображения на удобочитаемом языке с полными предложениями.

Параметры

Имя Ключ Обязательно Тип Описание
Максимальное число кандидатов
maxCandidates number

Максимальное количество возвращаемых описаний кандидатов.

Language
language string

Служба вернет результаты распознавания на указанном языке.

Источник изображения
format True string

Источник изображения — включен или по URL-адресу ссылки.

Изображение
Image True dynamic

Возвращаемое значение

Тело
DescribeResponse

Оптическое распознавание символов (OCR) в JSON

Оптическое распознавание символов (OCR) обнаруживает текст на изображении и извлекает распознанные символы в поток JSON, доступный для машинного использования.

Параметры

Имя Ключ Обязательно Тип Описание
Источник изображения
format True string

Источник изображения — включен или по URL-адресу ссылки.

Изображение
Image True dynamic

Возвращаемое значение

Ответ JSON
OCRJsonResponse

Оптическое распознавание символов (OCR) в JSON (V3) (предварительная версия)

Оптическое распознавание символов (OCR) обнаруживает текст на изображении и извлекает распознанные символы в поток JSON, доступный для машинного использования.

Параметры

Имя Ключ Обязательно Тип Описание
Поддомен ресурсов или регион
subdomainName True string

Поддомен Azure или географический регион (например, westus)

Источник изображения
format True string

Источник изображения — включен или по URL-адресу ссылки.

Изображение
Image True dynamic

Возвращаемое значение

Ответ JSON
OCRJsonResponse

Оптическое распознавание символов (OCR) в текст

Оптическое распознавание символов (OCR) обнаруживает текст в изображении и извлекает распознанные символы в текстовый файл.

Параметры

Имя Ключ Обязательно Тип Описание
Источник изображения
format True string

Источник изображения — включен или по URL-адресу ссылки.

Изображение
Image True dynamic

Возвращаемое значение

Тело
OCRTextResponse

Оптическое распознавание символов (OCR) в текст (версия 3) (предварительная версия)

Оптическое распознавание символов (OCR) обнаруживает текст в изображении и извлекает распознанные символы в текстовый файл.

Параметры

Имя Ключ Обязательно Тип Описание
Поддомен ресурсов или регион
subdomainName True string

Поддомен Azure или географический регион (например, westus)

Источник изображения
format True string

Источник изображения — включен или по URL-адресу ссылки.

Изображение
Image True dynamic

Возвращаемое значение

Тело
OCRTextResponse

Получение интересующей области

Возвращает ограничивающее поле вокруг наиболее важной области изображения.

Параметры

Имя Ключ Обязательно Тип Описание
Источник изображения
format True string

Источник изображения — включен или по URL-адресу ссылки.

Изображение
Image True dynamic

Возвращаемое значение

Получение области интересов (версия 3) (предварительная версия)

Возвращает ограничивающее поле вокруг наиболее важной области изображения.

Параметры

Имя Ключ Обязательно Тип Описание
Поддомен ресурсов или регион
subdomainName True string

Поддомен Azure или географический регион (например, westus)

Источник изображения
format True string

Источник изображения — включен или по URL-адресу ссылки.

Изображение
Image True dynamic

Возвращаемое значение

Распознавание содержимого конкретного домена

Распознать знаменитостей или ориентиров на изображении.

Параметры

Имя Ключ Обязательно Тип Описание
Модель домена
model True string

Поддерживаемая модель, предназначенная для конкретного домена для распознавания изображения.

Источник изображения
format True string

Источник изображения — включен или по URL-адресу ссылки.

Изображение
Image True dynamic

Возвращаемое значение

Распознавание содержимого конкретного домена (версия 3) (предварительная версия)

Распознать знаменитостей или ориентиров на изображении.

Параметры

Имя Ключ Обязательно Тип Описание
Поддомен ресурсов или регион
subdomainName True string

Поддомен Azure или географический регион (например, westus)

Модель домена
model True string

Поддерживаемая модель, предназначенная для конкретного домена для распознавания изображения.

Источник изображения
format True string

Источник изображения — включен или по URL-адресу ссылки.

Изображение
Image True dynamic

Возвращаемое значение

Создание эскиза (версия 3) (предварительная версия)

Эта операция создает эскиз изображения с указанной пользователем шириной и высотой.

Параметры

Имя Ключ Обязательно Тип Описание
Поддомен ресурсов или регион
subdomainName True string

Поддомен Azure или географический регион (например, westus)

Ширина эскиза
width True number

Ширина созданного эскиза — рекомендуется 50

Высота эскиза
height True number

Высота созданного эскиза — рекомендуется 50

Интеллектуальное обрезка
smartCropping boolean

Логический флаг для включения интеллектуальной обрезки

Источник изображения
format True string

Источник изображения — включен или по URL-адресу ссылки.

Изображение
Image True dynamic

Возвращаемое значение

Созданное изображение эскиза

Эскиз
binary

Создать миниатюру

Эта операция создает эскиз изображения с указанной пользователем шириной и высотой.

Параметры

Имя Ключ Обязательно Тип Описание
Ширина эскиза
width True number

Ширина созданного эскиза — рекомендуется 50

Высота эскиза
height True number

Высота созданного эскиза — рекомендуется 50

Интеллектуальное обрезка
smartCropping boolean

Логический флаг для включения интеллектуальной обрезки

Источник изображения
format True string

Источник изображения — включен или по URL-адресу ссылки.

Изображение
Image True dynamic

Возвращаемое значение

Созданное изображение эскиза

Эскиз
binary

Тег Изображение

Создает список слов или тегов, относящихся к содержимому предоставленного изображения.

Параметры

Имя Ключ Обязательно Тип Описание
Источник изображения
format True string

Источник изображения — включен или по URL-адресу ссылки.

Изображение
Image True dynamic

Возвращаемое значение

Тело
TagResponse

Определения

DomainModelResponse

Имя Путь Тип Описание
Знаменитости
result.celebrities array of object

Признанные знаменитости на изображении

Уверенность знаменитостей
result.celebrities.confidence float

Оценка достоверности, что изображение знаменитости

Имя знаменитости
result.celebrities.name string

Имя признанной знаменитости

Достопримечательности
result.landmarks array of object

Распознанные ориентиры на изображении

Достоверность ориентиров
result.landmarks.confidence float

Оценка достоверности, что изображение является ориентиром

Имя ориентира
result.landmarks.name string

Имя определенного ориентира

TagResponse

Имя Путь Тип Описание
tags
tags array of object

Набор тегов, возвращаемых из анализа рисунков.

Оценка достоверности тегов
tags.confidence float

Оценка достоверности идентифицированного тега.

Имя тега
tags.name string

Имя тега, определенного.

DetectResponse

Имя Путь Тип Описание
Объектов
objects array of object

Набор объектов, возвращаемых из анализа рисунков.

Оценка достоверности объектов
objects.confidence float

Оценка достоверности идентифицированного объекта.

Имя объекта
objects.object string

Имя идентифицированного объекта.

AreaOfInterestResponse

OCRJsonResponse

Имя Путь Тип Описание
Язык текста
language string

Обнаруженный язык текста изображения.

Массив регионов
regions array of object

Возвращенные текстовые области.

OCRTextResponse

Имя Путь Тип Описание
Обнаруженный текст
text string

Текст, обнаруженный в проанализированном изображении

АнализResponse

Имя Путь Тип Описание
categories
categories array of object

Категории, определенные на изображении

Имя категории
categories.name string

Имя категории, определяемой на изображении

Оценка достоверности категории
categories.score float

Оценка достоверности для категории изображений

Субтитры
description.captions array of object

Список подписей, созданных на основе изображения

Оценка достоверности подписей
description.captions.confidence float

Оценка достоверности заголовка изображения

Текст заголовка
description.captions.text string

Заголовок текста, созданный на основе изображения

Имена тегов
description.tags array of string

Коллекция имен тегов.

tags
tags array of object

Теги, идентифицированные с оценкой достоверности.

Оценка достоверности тегов
tags.confidence float

Оценка достоверности для определенных тегов.

Имя тега
tags.name string

Имя тега, определенного.

ОписаниеResponse

Имя Путь Тип Описание
Субтитры
description.captions array of object

Список подписей, созданных на основе изображения

Оценка достоверности подписей
description.captions.confidence float

Оценка достоверности заголовка изображения

Текст заголовка
description.captions.text string

Заголовок текста, созданный на основе изображения

Имена тегов
description.tags array of string

Коллекция имен тегов.

бинарный

Это базовый тип данных binary.