API компьютерного зрения
Извлеките богатые сведения из изображений для классификации и обработки визуальных данных и защиты пользователей от нежелательного содержимого с помощью этой Службы Azure Cognitive Service.
Этот соединитель доступен в следующих продуктах и регионах:
| Услуга | Class | Регионы |
|---|---|---|
| Copilot Studio | Стандарт | Все регионы Power Automate |
| Логические приложения | Стандарт | Все регионы Logic Apps |
| Power Apps | Стандарт | Все регионы Power Apps |
| Power Automate | Стандарт | Все регионы Power Automate |
| Контакт | |
|---|---|
| Имя | Microsoft |
| URL |
Поддержка Microsoft LogicApps Поддержка Microsoft Power Automate Поддержка Microsoft Power Apps |
| Метаданные соединителя | |
|---|---|
| Publisher | Microsoft |
| Веб-сайт | https://azure.microsoft.com/services/cognitive-services/computer-vision/ |
Для использования этой интеграции потребуется ресурс Cognitive Service на портале Azure. Вы получите конечную точку и ключ для проверки подлинности приложений. Чтобы сделать подключение, укажите ключ учетной записи, URL-адрес сайта и выберите "Создать подключение". Дополнительные сведения см. в статье об затратах на операции подключения.
Теперь вы готовы начать использовать эту интеграцию.
Известные проблемы и ограничения
Обратите внимание, что результаты операции могут быть неполными из-за базовой природы API Cognitive Service , которая основана на машинном обучении и распознавании шаблонов.
Подключение с помощью идентификатора Microsoft Entra
Чтобы создать подключения с идентификатором Microsoft Entra, необходимо добавить роль пользователя Cognitive Services в учетную запись для доступа. Чтобы использовать это подключение, необходимо ввести уникальный поддомен, связанный с ресурсом Cognitive Services, в вспомогательные операции.
Операции, не поддерживаемые проверкой подлинности идентификатора Microsoft Entra
При использовании проверки подлинности идентификатора Microsoft Entra id поддерживаются только действия версии 3. Устаревшие действия будут продолжать работать с Access Key проверкой подлинности, но при использовании с подключением идентификатора Microsoft Entra ID завершится ошибкой.
Создание подключения
Соединитель поддерживает следующие типы проверки подлинности:
| Ключ API | Ключ API (ApiKey) | Все регионы | Доступный для общего пользования |
| По умолчанию [не рекомендуется] | Этот параметр предназначен только для старых подключений без явного типа проверки подлинности и предоставляется только для обратной совместимости. | Все регионы | Недоступен для совместного использования |
Ключ API
Идентификатор проверки подлинности: keyBasedAuth
Применимо: все регионы
Ключ API (ApiKey)
Это совместное подключение. Если приложение power app предоставлено другому пользователю, подключение также предоставляется совместно. Дополнительные сведения см. в обзоре соединителей для приложений на основе холста — Power Apps | Документация Майкрософт
| Имя | Тип | Description | Обязательно |
|---|---|---|---|
| Ключ учетной записи | securestring | Ключ учетной записи Cognitive Services | True |
| URL-адрес сайта | струна | URL-адрес корневого сайта (пример: https://westus.api.cognitive.microsoft.com) |
По умолчанию [не рекомендуется]
Применимо: все регионы
Этот параметр предназначен только для старых подключений без явного типа проверки подлинности и предоставляется только для обратной совместимости.
Это недоступно для общего доступа. Если приложение power предоставляется другому пользователю, пользователю будет предложено явно создать новое подключение.
| Имя | Тип | Description | Обязательно |
|---|---|---|---|
| Ключ учетной записи | securestring | Ключ учетной записи Cognitive Services | True |
| URL-адрес сайта | струна | URL-адрес корневого сайта (пример: https://westus.api.cognitive.microsoft.com ). Если url-адрес сайта не указан, по умолчанию будет иметь значение "https://westus.api.cognitive.microsoft.com". |
Ограничения регулирования
| Имя | Вызовы | Период обновления |
|---|---|---|
| Вызовы API для каждого подключения | 1200 | 60 секунд |
Действия
| Analyze Image |
Эта операция извлекает широкий набор визуальных функций на основе содержимого изображения. |
| Анализ изображения (версия 3) (предварительная версия) |
Эта операция извлекает широкий набор визуальных функций на основе содержимого изображения. |
| Изображение тега (версия 3) (предварительная версия) |
Создает список слов или тегов, относящихся к содержимому предоставленного изображения. |
| Обнаружение объектов |
Создает список детекированных объектов в предоставленном изображении. |
| Обнаружение объектов (версия 3) (предварительная версия) |
Создает список детекированных объектов в предоставленном изображении. |
| Описание URL-адреса изображения |
Эта операция создает описание URL-адреса изображения на удобочитаемом языке с полными предложениями. |
| Описание URL-адреса изображения (версия 3) (предварительная версия) |
Эта операция создает описание URL-адреса изображения на удобочитаемом языке с полными предложениями. |
| Описание образа (версия 3) (предварительная версия) |
Эта операция создает описание изображения на удобочитаемом языке с полными предложениями. |
| Описание содержимого изображения |
Эта операция создает описание содержимого изображения на удобочитаемом языке с полными предложениями. |
| Описание содержимого изображения (версия 3) (предварительная версия) |
Эта операция создает описание содержимого изображения на удобочитаемом языке с полными предложениями. |
| Описать изображение |
Эта операция создает описание изображения на удобочитаемом языке с полными предложениями. |
| Оптическое распознавание символов (OCR) в JSON |
Оптическое распознавание символов (OCR) обнаруживает текст на изображении и извлекает распознанные символы в поток JSON, доступный для машинного использования. |
| Оптическое распознавание символов (OCR) в JSON (V3) (предварительная версия) |
Оптическое распознавание символов (OCR) обнаруживает текст на изображении и извлекает распознанные символы в поток JSON, доступный для машинного использования. |
| Оптическое распознавание символов (OCR) в текст |
Оптическое распознавание символов (OCR) обнаруживает текст в изображении и извлекает распознанные символы в текстовый файл. |
| Оптическое распознавание символов (OCR) в текст (версия 3) (предварительная версия) |
Оптическое распознавание символов (OCR) обнаруживает текст в изображении и извлекает распознанные символы в текстовый файл. |
| Получение интересующей области |
Возвращает ограничивающее поле вокруг наиболее важной области изображения. |
| Получение области интересов (версия 3) (предварительная версия) |
Возвращает ограничивающее поле вокруг наиболее важной области изображения. |
| Распознавание содержимого конкретного домена |
Распознать знаменитостей или ориентиров на изображении. |
| Распознавание содержимого конкретного домена (версия 3) (предварительная версия) |
Распознать знаменитостей или ориентиров на изображении. |
| Создание эскиза (версия 3) (предварительная версия) |
Эта операция создает эскиз изображения с указанной пользователем шириной и высотой. |
| Создать миниатюру |
Эта операция создает эскиз изображения с указанной пользователем шириной и высотой. |
| Тег Изображение |
Создает список слов или тегов, относящихся к содержимому предоставленного изображения. |
Analyze Image
Эта операция извлекает широкий набор визуальных функций на основе содержимого изображения.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Language
|
language | string |
Служба вернет результаты распознавания на указанном языке. |
|
|
Источник изображения
|
format | True | string |
Источник изображения — включен или по URL-адресу ссылки. |
|
Изображение
|
Image | True | dynamic |
Возвращаемое значение
- Тело
- AnalyzeResponse
Анализ изображения (версия 3) (предварительная версия)
Эта операция извлекает широкий набор визуальных функций на основе содержимого изображения.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Поддомен ресурсов или регион
|
subdomainName | True | string |
Поддомен Azure или географический регион (например, westus) |
|
Language
|
language | string |
Служба вернет результаты распознавания на указанном языке. |
|
|
Источник изображения
|
format | True | string |
Источник изображения — включен или по URL-адресу ссылки. |
|
Изображение
|
Image | True | dynamic |
Возвращаемое значение
- Тело
- AnalyzeResponse
Изображение тега (версия 3) (предварительная версия)
Создает список слов или тегов, относящихся к содержимому предоставленного изображения.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Поддомен ресурсов или регион
|
subdomainName | True | string |
Поддомен Azure или географический регион (например, westus) |
|
Источник изображения
|
format | True | string |
Источник изображения — включен или по URL-адресу ссылки. |
|
Изображение
|
Image | True | dynamic |
Возвращаемое значение
- Тело
- TagResponse
Обнаружение объектов
Создает список детекированных объектов в предоставленном изображении.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Источник изображения
|
format | True | string |
Источник изображения — включен или по URL-адресу ссылки. |
|
Изображение
|
Image | True | dynamic |
Возвращаемое значение
- Тело
- DetectResponse
Обнаружение объектов (версия 3) (предварительная версия)
Создает список детекированных объектов в предоставленном изображении.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Поддомен ресурсов или регион
|
subdomainName | True | string |
Поддомен Azure или географический регион (например, westus) |
|
Источник изображения
|
format | True | string |
Источник изображения — включен или по URL-адресу ссылки. |
|
Изображение
|
Image | True | dynamic |
Возвращаемое значение
- Тело
- DetectResponse
Описание URL-адреса изображения
Эта операция создает описание URL-адреса изображения на удобочитаемом языке с полными предложениями.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Максимальное число кандидатов
|
maxCandidates | number |
Максимальное количество возвращаемых описаний кандидатов. |
|
|
Language
|
language | string |
Служба вернет результаты распознавания на указанном языке. |
|
|
URL-адрес изображения
|
url | url |
Источник ссылки на изображение по URL-адресу. |
Возвращаемое значение
- Тело
- DescribeResponse
Описание URL-адреса изображения (версия 3) (предварительная версия)
Эта операция создает описание URL-адреса изображения на удобочитаемом языке с полными предложениями.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Поддомен ресурсов или регион
|
subdomainName | True | string |
Поддомен Azure или географический регион (например, westus) |
|
Максимальное число кандидатов
|
maxCandidates | number |
Максимальное количество возвращаемых описаний кандидатов. |
|
|
Language
|
language | string |
Служба вернет результаты распознавания на указанном языке. |
|
|
URL-адрес изображения
|
url | url |
Источник ссылки на изображение по URL-адресу. |
Возвращаемое значение
- Тело
- DescribeResponse
Описание образа (версия 3) (предварительная версия)
Эта операция создает описание изображения на удобочитаемом языке с полными предложениями.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Поддомен ресурсов или регион
|
subdomainName | True | string |
Поддомен Azure или географический регион (например, westus) |
|
Максимальное число кандидатов
|
maxCandidates | number |
Максимальное количество возвращаемых описаний кандидатов. |
|
|
Language
|
language | string |
Служба вернет результаты распознавания на указанном языке. |
|
|
Источник изображения
|
format | True | string |
Источник изображения — включен или по URL-адресу ссылки. |
|
Изображение
|
Image | True | dynamic |
Возвращаемое значение
- Тело
- DescribeResponse
Описание содержимого изображения
Эта операция создает описание содержимого изображения на удобочитаемом языке с полными предложениями.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Максимальное число кандидатов
|
maxCandidates | number |
Максимальное количество возвращаемых описаний кандидатов. |
|
|
Language
|
language | string |
Служба вернет результаты распознавания на указанном языке. |
|
|
Содержимое изображения
|
Image | True | binary |
Источник ссылки на изображение в тексте. |
Возвращаемое значение
- Тело
- DescribeResponse
Описание содержимого изображения (версия 3) (предварительная версия)
Эта операция создает описание содержимого изображения на удобочитаемом языке с полными предложениями.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Поддомен ресурсов или регион
|
subdomainName | True | string |
Поддомен Azure или географический регион (например, westus) |
|
Максимальное число кандидатов
|
maxCandidates | number |
Максимальное количество возвращаемых описаний кандидатов. |
|
|
Language
|
language | string |
Служба вернет результаты распознавания на указанном языке. |
|
|
Содержимое изображения
|
Image | True | binary |
Источник ссылки на изображение в тексте. |
Возвращаемое значение
- Тело
- DescribeResponse
Описать изображение
Эта операция создает описание изображения на удобочитаемом языке с полными предложениями.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Максимальное число кандидатов
|
maxCandidates | number |
Максимальное количество возвращаемых описаний кандидатов. |
|
|
Language
|
language | string |
Служба вернет результаты распознавания на указанном языке. |
|
|
Источник изображения
|
format | True | string |
Источник изображения — включен или по URL-адресу ссылки. |
|
Изображение
|
Image | True | dynamic |
Возвращаемое значение
- Тело
- DescribeResponse
Оптическое распознавание символов (OCR) в JSON
Оптическое распознавание символов (OCR) обнаруживает текст на изображении и извлекает распознанные символы в поток JSON, доступный для машинного использования.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Источник изображения
|
format | True | string |
Источник изображения — включен или по URL-адресу ссылки. |
|
Изображение
|
Image | True | dynamic |
Возвращаемое значение
- Ответ JSON
- OCRJsonResponse
Оптическое распознавание символов (OCR) в JSON (V3) (предварительная версия)
Оптическое распознавание символов (OCR) обнаруживает текст на изображении и извлекает распознанные символы в поток JSON, доступный для машинного использования.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Поддомен ресурсов или регион
|
subdomainName | True | string |
Поддомен Azure или географический регион (например, westus) |
|
Источник изображения
|
format | True | string |
Источник изображения — включен или по URL-адресу ссылки. |
|
Изображение
|
Image | True | dynamic |
Возвращаемое значение
- Ответ JSON
- OCRJsonResponse
Оптическое распознавание символов (OCR) в текст
Оптическое распознавание символов (OCR) обнаруживает текст в изображении и извлекает распознанные символы в текстовый файл.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Источник изображения
|
format | True | string |
Источник изображения — включен или по URL-адресу ссылки. |
|
Изображение
|
Image | True | dynamic |
Возвращаемое значение
- Тело
- OCRTextResponse
Оптическое распознавание символов (OCR) в текст (версия 3) (предварительная версия)
Оптическое распознавание символов (OCR) обнаруживает текст в изображении и извлекает распознанные символы в текстовый файл.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Поддомен ресурсов или регион
|
subdomainName | True | string |
Поддомен Azure или географический регион (например, westus) |
|
Источник изображения
|
format | True | string |
Источник изображения — включен или по URL-адресу ссылки. |
|
Изображение
|
Image | True | dynamic |
Возвращаемое значение
- Тело
- OCRTextResponse
Получение интересующей области
Возвращает ограничивающее поле вокруг наиболее важной области изображения.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Источник изображения
|
format | True | string |
Источник изображения — включен или по URL-адресу ссылки. |
|
Изображение
|
Image | True | dynamic |
Возвращаемое значение
Получение области интересов (версия 3) (предварительная версия)
Возвращает ограничивающее поле вокруг наиболее важной области изображения.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Поддомен ресурсов или регион
|
subdomainName | True | string |
Поддомен Azure или географический регион (например, westus) |
|
Источник изображения
|
format | True | string |
Источник изображения — включен или по URL-адресу ссылки. |
|
Изображение
|
Image | True | dynamic |
Возвращаемое значение
Распознавание содержимого конкретного домена
Распознать знаменитостей или ориентиров на изображении.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Модель домена
|
model | True | string |
Поддерживаемая модель, предназначенная для конкретного домена для распознавания изображения. |
|
Источник изображения
|
format | True | string |
Источник изображения — включен или по URL-адресу ссылки. |
|
Изображение
|
Image | True | dynamic |
Возвращаемое значение
- Тело
- DomainModelResponse
Распознавание содержимого конкретного домена (версия 3) (предварительная версия)
Распознать знаменитостей или ориентиров на изображении.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Поддомен ресурсов или регион
|
subdomainName | True | string |
Поддомен Azure или географический регион (например, westus) |
|
Модель домена
|
model | True | string |
Поддерживаемая модель, предназначенная для конкретного домена для распознавания изображения. |
|
Источник изображения
|
format | True | string |
Источник изображения — включен или по URL-адресу ссылки. |
|
Изображение
|
Image | True | dynamic |
Возвращаемое значение
- Тело
- DomainModelResponse
Создание эскиза (версия 3) (предварительная версия)
Эта операция создает эскиз изображения с указанной пользователем шириной и высотой.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Поддомен ресурсов или регион
|
subdomainName | True | string |
Поддомен Azure или географический регион (например, westus) |
|
Ширина эскиза
|
width | True | number |
Ширина созданного эскиза — рекомендуется 50 |
|
Высота эскиза
|
height | True | number |
Высота созданного эскиза — рекомендуется 50 |
|
Интеллектуальное обрезка
|
smartCropping | boolean |
Логический флаг для включения интеллектуальной обрезки |
|
|
Источник изображения
|
format | True | string |
Источник изображения — включен или по URL-адресу ссылки. |
|
Изображение
|
Image | True | dynamic |
Возвращаемое значение
Созданное изображение эскиза
- Эскиз
- binary
Создать миниатюру
Эта операция создает эскиз изображения с указанной пользователем шириной и высотой.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Ширина эскиза
|
width | True | number |
Ширина созданного эскиза — рекомендуется 50 |
|
Высота эскиза
|
height | True | number |
Высота созданного эскиза — рекомендуется 50 |
|
Интеллектуальное обрезка
|
smartCropping | boolean |
Логический флаг для включения интеллектуальной обрезки |
|
|
Источник изображения
|
format | True | string |
Источник изображения — включен или по URL-адресу ссылки. |
|
Изображение
|
Image | True | dynamic |
Возвращаемое значение
Созданное изображение эскиза
- Эскиз
- binary
Тег Изображение
Создает список слов или тегов, относящихся к содержимому предоставленного изображения.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Источник изображения
|
format | True | string |
Источник изображения — включен или по URL-адресу ссылки. |
|
Изображение
|
Image | True | dynamic |
Возвращаемое значение
- Тело
- TagResponse
Определения
DomainModelResponse
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
Знаменитости
|
result.celebrities | array of object |
Признанные знаменитости на изображении |
|
Уверенность знаменитостей
|
result.celebrities.confidence | float |
Оценка достоверности, что изображение знаменитости |
|
Имя знаменитости
|
result.celebrities.name | string |
Имя признанной знаменитости |
|
Достопримечательности
|
result.landmarks | array of object |
Распознанные ориентиры на изображении |
|
Достоверность ориентиров
|
result.landmarks.confidence | float |
Оценка достоверности, что изображение является ориентиром |
|
Имя ориентира
|
result.landmarks.name | string |
Имя определенного ориентира |
TagResponse
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
tags
|
tags | array of object |
Набор тегов, возвращаемых из анализа рисунков. |
|
Оценка достоверности тегов
|
tags.confidence | float |
Оценка достоверности идентифицированного тега. |
|
Имя тега
|
tags.name | string |
Имя тега, определенного. |
DetectResponse
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
Объектов
|
objects | array of object |
Набор объектов, возвращаемых из анализа рисунков. |
|
Оценка достоверности объектов
|
objects.confidence | float |
Оценка достоверности идентифицированного объекта. |
|
Имя объекта
|
objects.object | string |
Имя идентифицированного объекта. |
AreaOfInterestResponse
OCRJsonResponse
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
Язык текста
|
language | string |
Обнаруженный язык текста изображения. |
|
Массив регионов
|
regions | array of object |
Возвращенные текстовые области. |
OCRTextResponse
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
Обнаруженный текст
|
text | string |
Текст, обнаруженный в проанализированном изображении |
АнализResponse
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
categories
|
categories | array of object |
Категории, определенные на изображении |
|
Имя категории
|
categories.name | string |
Имя категории, определяемой на изображении |
|
Оценка достоверности категории
|
categories.score | float |
Оценка достоверности для категории изображений |
|
Субтитры
|
description.captions | array of object |
Список подписей, созданных на основе изображения |
|
Оценка достоверности подписей
|
description.captions.confidence | float |
Оценка достоверности заголовка изображения |
|
Текст заголовка
|
description.captions.text | string |
Заголовок текста, созданный на основе изображения |
|
Имена тегов
|
description.tags | array of string |
Коллекция имен тегов. |
|
tags
|
tags | array of object |
Теги, идентифицированные с оценкой достоверности. |
|
Оценка достоверности тегов
|
tags.confidence | float |
Оценка достоверности для определенных тегов. |
|
Имя тега
|
tags.name | string |
Имя тега, определенного. |
ОписаниеResponse
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
Субтитры
|
description.captions | array of object |
Список подписей, созданных на основе изображения |
|
Оценка достоверности подписей
|
description.captions.confidence | float |
Оценка достоверности заголовка изображения |
|
Текст заголовка
|
description.captions.text | string |
Заголовок текста, созданный на основе изображения |
|
Имена тегов
|
description.tags | array of string |
Коллекция имен тегов. |
бинарный
Это базовый тип данных binary.