API компьютерного зрения

Извлеките богатые сведения из изображений для классификации и обработки визуальных данных и защиты пользователей от нежелательного содержимого с помощью этой Службы Azure Cognitive Service.

Этот соединитель доступен в следующих продуктах и регионах:

Услуга	Class	Регионы
Copilot Studio	Стандарт	Все регионы Power Automate
Логические приложения	Стандарт	Все регионы Logic Apps
Power Apps	Стандарт	Все регионы Power Apps
Power Automate	Стандарт	Все регионы Power Automate

Контакт
Имя	Microsoft
URL	Поддержка Microsoft LogicApps Поддержка Microsoft Power Automate Поддержка Microsoft Power Apps

Метаданные соединителя
Publisher	Microsoft
Веб-сайт	https://azure.microsoft.com/services/cognitive-services/computer-vision/

Для использования этой интеграции потребуется ресурс Cognitive Service на портале Azure. Вы получите конечную точку и ключ для проверки подлинности приложений. Чтобы сделать подключение, укажите ключ учетной записи, URL-адрес сайта и выберите "Создать подключение". Дополнительные сведения см. в статье об затратах на операции подключения.

Теперь вы готовы начать использовать эту интеграцию.

Известные проблемы и ограничения

Обратите внимание, что результаты операции могут быть неполными из-за базовой природы API Cognitive Service , которая основана на машинном обучении и распознавании шаблонов.

Подключение с помощью идентификатора Microsoft Entra

Чтобы создать подключения с идентификатором Microsoft Entra, необходимо добавить роль пользователя Cognitive Services в учетную запись для доступа. Чтобы использовать это подключение, необходимо ввести уникальный поддомен, связанный с ресурсом Cognitive Services, в вспомогательные операции.

Операции, не поддерживаемые проверкой подлинности идентификатора Microsoft Entra

При использовании проверки подлинности идентификатора Microsoft Entra id поддерживаются только действия версии 3. Устаревшие действия будут продолжать работать с Access Key проверкой подлинности, но при использовании с подключением идентификатора Microsoft Entra ID завершится ошибкой.

Создание подключения

Соединитель поддерживает следующие типы проверки подлинности:


Ключ API	Ключ API (ApiKey)	Все регионы	Доступный для общего пользования
По умолчанию [не рекомендуется]	Этот параметр предназначен только для старых подключений без явного типа проверки подлинности и предоставляется только для обратной совместимости.	Все регионы	Недоступен для совместного использования

Ключ API

Идентификатор проверки подлинности: keyBasedAuth

Применимо: все регионы

Ключ API (ApiKey)

Это совместное подключение. Если приложение power app предоставлено другому пользователю, подключение также предоставляется совместно. Дополнительные сведения см. в обзоре соединителей для приложений на основе холста — Power Apps | Документация Майкрософт

Имя	Тип	Description	Обязательно
Ключ учетной записи	securestring	Ключ учетной записи Cognitive Services	True
URL-адрес сайта	струна	URL-адрес корневого сайта (пример: https://westus.api.cognitive.microsoft.com)

По умолчанию [не рекомендуется]

Применимо: все регионы

Этот параметр предназначен только для старых подключений без явного типа проверки подлинности и предоставляется только для обратной совместимости.

Это недоступно для общего доступа. Если приложение power предоставляется другому пользователю, пользователю будет предложено явно создать новое подключение.

Имя	Тип	Description	Обязательно
Ключ учетной записи	securestring	Ключ учетной записи Cognitive Services	True
URL-адрес сайта	струна	URL-адрес корневого сайта (пример: https://westus.api.cognitive.microsoft.com ). Если url-адрес сайта не указан, по умолчанию будет иметь значение "https://westus.api.cognitive.microsoft.com".

Ограничения регулирования

Имя	Вызовы	Период обновления
Вызовы API для каждого подключения	1200	60 секунд

Действия

Analyze Image	Эта операция извлекает широкий набор визуальных функций на основе содержимого изображения.
Анализ изображения (версия 3) (предварительная версия)	Эта операция извлекает широкий набор визуальных функций на основе содержимого изображения.
Изображение тега (версия 3) (предварительная версия)	Создает список слов или тегов, относящихся к содержимому предоставленного изображения.
Обнаружение объектов	Создает список детекированных объектов в предоставленном изображении.
Обнаружение объектов (версия 3) (предварительная версия)	Создает список детекированных объектов в предоставленном изображении.
Описание URL-адреса изображения	Эта операция создает описание URL-адреса изображения на удобочитаемом языке с полными предложениями.
Описание URL-адреса изображения (версия 3) (предварительная версия)	Эта операция создает описание URL-адреса изображения на удобочитаемом языке с полными предложениями.
Описание образа (версия 3) (предварительная версия)	Эта операция создает описание изображения на удобочитаемом языке с полными предложениями.
Описание содержимого изображения	Эта операция создает описание содержимого изображения на удобочитаемом языке с полными предложениями.
Описание содержимого изображения (версия 3) (предварительная версия)	Эта операция создает описание содержимого изображения на удобочитаемом языке с полными предложениями.
Описать изображение	Эта операция создает описание изображения на удобочитаемом языке с полными предложениями.
Оптическое распознавание символов (OCR) в JSON	Оптическое распознавание символов (OCR) обнаруживает текст на изображении и извлекает распознанные символы в поток JSON, доступный для машинного использования.
Оптическое распознавание символов (OCR) в JSON (V3) (предварительная версия)	Оптическое распознавание символов (OCR) обнаруживает текст на изображении и извлекает распознанные символы в поток JSON, доступный для машинного использования.
Оптическое распознавание символов (OCR) в текст	Оптическое распознавание символов (OCR) обнаруживает текст в изображении и извлекает распознанные символы в текстовый файл.
Оптическое распознавание символов (OCR) в текст (версия 3) (предварительная версия)	Оптическое распознавание символов (OCR) обнаруживает текст в изображении и извлекает распознанные символы в текстовый файл.
Получение интересующей области	Возвращает ограничивающее поле вокруг наиболее важной области изображения.
Получение области интересов (версия 3) (предварительная версия)	Возвращает ограничивающее поле вокруг наиболее важной области изображения.
Распознавание содержимого конкретного домена	Распознать знаменитостей или ориентиров на изображении.
Распознавание содержимого конкретного домена (версия 3) (предварительная версия)	Распознать знаменитостей или ориентиров на изображении.
Создание эскиза (версия 3) (предварительная версия)	Эта операция создает эскиз изображения с указанной пользователем шириной и высотой.
Создать миниатюру	Эта операция создает эскиз изображения с указанной пользователем шириной и высотой.
Тег Изображение	Создает список слов или тегов, относящихся к содержимому предоставленного изображения.

Analyze Image

Идентификатор операции:: AnalyzeImageV2

Эта операция извлекает широкий набор визуальных функций на основе содержимого изображения.

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Language	language		string	Служба вернет результаты распознавания на указанном языке.
Источник изображения	format	True	string	Источник изображения — включен или по URL-адресу ссылки.
Изображение	Image	True	dynamic

Возвращаемое значение

Тело: AnalyzeResponse

Анализ изображения (версия 3) (предварительная версия)

Идентификатор операции:: AnalyzeImageV3

Эта операция извлекает широкий набор визуальных функций на основе содержимого изображения.

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Поддомен ресурсов или регион	subdomainName	True	string	Поддомен Azure или географический регион (например, westus)
Language	language		string	Служба вернет результаты распознавания на указанном языке.
Источник изображения	format	True	string	Источник изображения — включен или по URL-адресу ссылки.
Изображение	Image	True	dynamic

Возвращаемое значение

Тело: AnalyzeResponse

Изображение тега (версия 3) (предварительная версия)

Идентификатор операции:: TagImageV3

Создает список слов или тегов, относящихся к содержимому предоставленного изображения.

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Поддомен ресурсов или регион	subdomainName	True	string	Поддомен Azure или географический регион (например, westus)
Источник изображения	format	True	string	Источник изображения — включен или по URL-адресу ссылки.
Изображение	Image	True	dynamic

Возвращаемое значение

Тело: TagResponse

Обнаружение объектов

Идентификатор операции:: DetectObjects

Создает список детекированных объектов в предоставленном изображении.

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Источник изображения	format	True	string	Источник изображения — включен или по URL-адресу ссылки.
Изображение	Image	True	dynamic

Возвращаемое значение

Тело: DetectResponse

Обнаружение объектов (версия 3) (предварительная версия)

Идентификатор операции:: DetectObjectsV3

Создает список детекированных объектов в предоставленном изображении.

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Поддомен ресурсов или регион	subdomainName	True	string	Поддомен Azure или географический регион (например, westus)
Источник изображения	format	True	string	Источник изображения — включен или по URL-адресу ссылки.
Изображение	Image	True	dynamic

Возвращаемое значение

Тело: DetectResponse

Описание URL-адреса изображения

Идентификатор операции:: DescribeImageURLV2

Эта операция создает описание URL-адреса изображения на удобочитаемом языке с полными предложениями.

Параметры

Имя	Ключ	Тип	Описание
Максимальное число кандидатов	maxCandidates	number	Максимальное количество возвращаемых описаний кандидатов.
Language	language	string	Служба вернет результаты распознавания на указанном языке.
URL-адрес изображения	url	url	Источник ссылки на изображение по URL-адресу.

Возвращаемое значение

Тело: DescribeResponse

Описание URL-адреса изображения (версия 3) (предварительная версия)

Идентификатор операции:: DescribeImageURLV3

Эта операция создает описание URL-адреса изображения на удобочитаемом языке с полными предложениями.

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Поддомен ресурсов или регион	subdomainName	True	string	Поддомен Azure или географический регион (например, westus)
Максимальное число кандидатов	maxCandidates		number	Максимальное количество возвращаемых описаний кандидатов.
Language	language		string	Служба вернет результаты распознавания на указанном языке.
URL-адрес изображения	url		url	Источник ссылки на изображение по URL-адресу.

Возвращаемое значение

Тело: DescribeResponse

Описание образа (версия 3) (предварительная версия)

Идентификатор операции:: DescribeImageV3

Эта операция создает описание изображения на удобочитаемом языке с полными предложениями.

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Поддомен ресурсов или регион	subdomainName	True	string	Поддомен Azure или географический регион (например, westus)
Максимальное число кандидатов	maxCandidates		number	Максимальное количество возвращаемых описаний кандидатов.
Language	language		string	Служба вернет результаты распознавания на указанном языке.
Источник изображения	format	True	string	Источник изображения — включен или по URL-адресу ссылки.
Изображение	Image	True	dynamic

Возвращаемое значение

Тело: DescribeResponse

Описание содержимого изображения

Идентификатор операции:: DescribeImageContentV2

Эта операция создает описание содержимого изображения на удобочитаемом языке с полными предложениями.

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Максимальное число кандидатов	maxCandidates		number	Максимальное количество возвращаемых описаний кандидатов.
Language	language		string	Служба вернет результаты распознавания на указанном языке.
Содержимое изображения	Image	True	binary	Источник ссылки на изображение в тексте.

Возвращаемое значение

Тело: DescribeResponse

Описание содержимого изображения (версия 3) (предварительная версия)

Идентификатор операции:: DescribeImageContentV3

Эта операция создает описание содержимого изображения на удобочитаемом языке с полными предложениями.

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Поддомен ресурсов или регион	subdomainName	True	string	Поддомен Azure или географический регион (например, westus)
Максимальное число кандидатов	maxCandidates		number	Максимальное количество возвращаемых описаний кандидатов.
Language	language		string	Служба вернет результаты распознавания на указанном языке.
Содержимое изображения	Image	True	binary	Источник ссылки на изображение в тексте.

Возвращаемое значение

Тело: DescribeResponse

Описать изображение

Идентификатор операции:: DescribeImageV2

Эта операция создает описание изображения на удобочитаемом языке с полными предложениями.

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Максимальное число кандидатов	maxCandidates		number	Максимальное количество возвращаемых описаний кандидатов.
Language	language		string	Служба вернет результаты распознавания на указанном языке.
Источник изображения	format	True	string	Источник изображения — включен или по URL-адресу ссылки.
Изображение	Image	True	dynamic

Возвращаемое значение

Тело: DescribeResponse

Оптическое распознавание символов (OCR) в JSON

Идентификатор операции:: OCRV2

Оптическое распознавание символов (OCR) обнаруживает текст на изображении и извлекает распознанные символы в поток JSON, доступный для машинного использования.

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Источник изображения	format	True	string	Источник изображения — включен или по URL-адресу ссылки.
Изображение	Image	True	dynamic

Возвращаемое значение

Ответ JSON: OCRJsonResponse

Оптическое распознавание символов (OCR) в JSON (V3) (предварительная версия)

Идентификатор операции:: OCRV3

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Поддомен ресурсов или регион	subdomainName	True	string	Поддомен Azure или географический регион (например, westus)
Источник изображения	format	True	string	Источник изображения — включен или по URL-адресу ссылки.
Изображение	Image	True	dynamic

Возвращаемое значение

Ответ JSON: OCRJsonResponse

Оптическое распознавание символов (OCR) в текст

Идентификатор операции:: OCRTextV2

Оптическое распознавание символов (OCR) обнаруживает текст в изображении и извлекает распознанные символы в текстовый файл.

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Источник изображения	format	True	string	Источник изображения — включен или по URL-адресу ссылки.
Изображение	Image	True	dynamic

Возвращаемое значение

Тело: OCRTextResponse

Оптическое распознавание символов (OCR) в текст (версия 3) (предварительная версия)

Идентификатор операции:: OCRTextV3

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Поддомен ресурсов или регион	subdomainName	True	string	Поддомен Azure или географический регион (например, westus)
Источник изображения	format	True	string	Источник изображения — включен или по URL-адресу ссылки.
Изображение	Image	True	dynamic

Возвращаемое значение

Тело: OCRTextResponse

Получение интересующей области

Идентификатор операции:: GetAreaOfInterest

Возвращает ограничивающее поле вокруг наиболее важной области изображения.

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Источник изображения	format	True	string	Источник изображения — включен или по URL-адресу ссылки.
Изображение	Image	True	dynamic

Возвращаемое значение

Тело: AreaOfInterestResponse

Получение области интересов (версия 3) (предварительная версия)

Идентификатор операции:: GetAreaOfInterestV3

Возвращает ограничивающее поле вокруг наиболее важной области изображения.

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Поддомен ресурсов или регион	subdomainName	True	string	Поддомен Azure или географический регион (например, westus)
Источник изображения	format	True	string	Источник изображения — включен или по URL-адресу ссылки.
Изображение	Image	True	dynamic

Возвращаемое значение

Тело: AreaOfInterestResponse

Распознавание содержимого конкретного домена

Идентификатор операции:: RecognizeDomainSpecificContentV2

Распознать знаменитостей или ориентиров на изображении.

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Модель домена	model	True	string	Поддерживаемая модель, предназначенная для конкретного домена для распознавания изображения.
Источник изображения	format	True	string	Источник изображения — включен или по URL-адресу ссылки.
Изображение	Image	True	dynamic

Возвращаемое значение

Тело: DomainModelResponse

Распознавание содержимого конкретного домена (версия 3) (предварительная версия)

Идентификатор операции:: RecognizeDomainSpecificContentV3

Распознать знаменитостей или ориентиров на изображении.

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Поддомен ресурсов или регион	subdomainName	True	string	Поддомен Azure или географический регион (например, westus)
Модель домена	model	True	string	Поддерживаемая модель, предназначенная для конкретного домена для распознавания изображения.
Источник изображения	format	True	string	Источник изображения — включен или по URL-адресу ссылки.
Изображение	Image	True	dynamic

Возвращаемое значение

Тело: DomainModelResponse

Создание эскиза (версия 3) (предварительная версия)

Идентификатор операции:: GetThumbnailV3

Эта операция создает эскиз изображения с указанной пользователем шириной и высотой.

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Поддомен ресурсов или регион	subdomainName	True	string	Поддомен Azure или географический регион (например, westus)
Ширина эскиза	width	True	number	Ширина созданного эскиза — рекомендуется 50
Высота эскиза	height	True	number	Высота созданного эскиза — рекомендуется 50
Интеллектуальное обрезка	smartCropping		boolean	Логический флаг для включения интеллектуальной обрезки
Источник изображения	format	True	string	Источник изображения — включен или по URL-адресу ссылки.
Изображение	Image	True	dynamic

Возвращаемое значение

Созданное изображение эскиза

Эскиз: binary

Создать миниатюру

Идентификатор операции:: GetThumbnailV2

Эта операция создает эскиз изображения с указанной пользователем шириной и высотой.

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Ширина эскиза	width	True	number	Ширина созданного эскиза — рекомендуется 50
Высота эскиза	height	True	number	Высота созданного эскиза — рекомендуется 50
Интеллектуальное обрезка	smartCropping		boolean	Логический флаг для включения интеллектуальной обрезки
Источник изображения	format	True	string	Источник изображения — включен или по URL-адресу ссылки.
Изображение	Image	True	dynamic

Возвращаемое значение

Созданное изображение эскиза

Эскиз: binary

Тег Изображение

Идентификатор операции:: TagImageV2

Создает список слов или тегов, относящихся к содержимому предоставленного изображения.

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Источник изображения	format	True	string	Источник изображения — включен или по URL-адресу ссылки.
Изображение	Image	True	dynamic

Возвращаемое значение

Тело: TagResponse

Определения

DomainModelResponse

Имя	Путь	Тип	Описание
Знаменитости	result.celebrities	array of object	Признанные знаменитости на изображении
Уверенность знаменитостей	result.celebrities.confidence	float	Оценка достоверности, что изображение знаменитости
Имя знаменитости	result.celebrities.name	string	Имя признанной знаменитости
Достопримечательности	result.landmarks	array of object	Распознанные ориентиры на изображении
Достоверность ориентиров	result.landmarks.confidence	float	Оценка достоверности, что изображение является ориентиром
Имя ориентира	result.landmarks.name	string	Имя определенного ориентира

TagResponse

Имя	Путь	Тип	Описание
tags	tags	array of object	Набор тегов, возвращаемых из анализа рисунков.
Оценка достоверности тегов	tags.confidence	float	Оценка достоверности идентифицированного тега.
Имя тега	tags.name	string	Имя тега, определенного.

DetectResponse

Имя	Путь	Тип	Описание
Объектов	objects	array of object	Набор объектов, возвращаемых из анализа рисунков.
Оценка достоверности объектов	objects.confidence	float	Оценка достоверности идентифицированного объекта.
Имя объекта	objects.object	string	Имя идентифицированного объекта.

AreaOfInterestResponse

OCRJsonResponse

Имя	Путь	Тип	Описание
Язык текста	language	string	Обнаруженный язык текста изображения.
Массив регионов	regions	array of object	Возвращенные текстовые области.

OCRTextResponse

Имя	Путь	Тип	Описание
Обнаруженный текст	text	string	Текст, обнаруженный в проанализированном изображении

АнализResponse

Имя	Путь	Тип	Описание
categories	categories	array of object	Категории, определенные на изображении
Имя категории	categories.name	string	Имя категории, определяемой на изображении
Оценка достоверности категории	categories.score	float	Оценка достоверности для категории изображений
Субтитры	description.captions	array of object	Список подписей, созданных на основе изображения
Оценка достоверности подписей	description.captions.confidence	float	Оценка достоверности заголовка изображения
Текст заголовка	description.captions.text	string	Заголовок текста, созданный на основе изображения
Имена тегов	description.tags	array of string	Коллекция имен тегов.
tags	tags	array of object	Теги, идентифицированные с оценкой достоверности.
Оценка достоверности тегов	tags.confidence	float	Оценка достоверности для определенных тегов.
Имя тега	tags.name	string	Имя тега, определенного.

ОписаниеResponse

Имя	Путь	Тип	Описание
Субтитры	description.captions	array of object	Список подписей, созданных на основе изображения
Оценка достоверности подписей	description.captions.confidence	float	Оценка достоверности заголовка изображения
Текст заголовка	description.captions.text	string	Заголовок текста, созданный на основе изображения
Имена тегов	description.tags	array of string	Коллекция имен тегов.

бинарный

Это базовый тип данных binary.