Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Узнайте, что нового в Azure Vision. Проверьте эту страницу, чтобы оставаться в курсе новых функций, улучшений, исправлений и обновлений документации.
Август 2025 г.
Устаревание предварительной версии API анализа изображений 4.0
31 марта 2025 г. API-интерфейсы предварительной версии анализа изображений 4.0 будут сняты. До этой даты необходимо перенести рабочие нагрузки анализа изображений Azure в API Анализа Изображений 4.0 GA.
Мы рекомендуем вам сделать переход быстрее, чтобы получить доступ к улучшениям, таким как многомодальное встраивание, синхронное оптическое распознавание символов (OCR), обнаружение людей, тегирование изображений, умное обрезание, подпись, плотная подпись и обнаружение объектов на изображениях. Эти API-интерфейсы предварительной версии анализа изображений 4.0 будут прекращены 31 марта 2025 г.
2022-07-31-preview2022-10-12-preview2023-02-01-preview2023-04-01-preview2023-07-01-previewv4.0-preview.1
Следующие функции больше не будут доступны после выхода на пенсию версий API предварительной версии, и они удаляются из интерфейса Студии с 10 января 2025 г.
- Настройка модели
- Удаление фона
- Распознавание продуктов
Чтобы обеспечить плавную работу моделей, перейдите к Пользовательское визуальное распознавание ИИ Azure, которое теперь общедоступно. Сервис Custom Vision предлагает аналогичные функциональные возможности таким устаревающим функциям.
Февраль 2024 г.
Многомодальные встраивания общедоступной версии: новая многоязычная модель
API многомодальных эмбедингов обновлено и теперь доступно для всех. Новый 2024-02-01 API включает новую модель, которая поддерживает поиск текста на 102 языках. Исходная модель только на английском языке по-прежнему доступна, но ее нельзя объединить с новой моделью в том же индексе поиска. Если вы векторизовали текст и изображения с помощью модели, работающей только на английском языке, эти векторы несовместимы с многоязычным текстом и векторами изображений.
См. страницу поддержки языка для списка поддерживаемых языков.
январь 2024
Новый пакет SDK для анализа изображений 1.0.0-beta.1 (критические изменения)
Пакет SDK для анализа изображений был перезаписан в версии 1.0.0-beta.1, чтобы лучше соответствовать другим пакетам SDK Azure. Все API изменились. Дополнительные сведения об использовании нового пакета SDK см. в обновленных кратких руководствах, примерах и руководствах по использованию нового пакета SDK.
Основные изменения:
- Пакет SDK теперь вызывает общедоступную версию сервиса Компьютерного зрения REST API (2023-10-01) вместо предварительной версии REST API (2023-04-01-preview).
- Добавлена поддержка JavaScript.
- C++ больше не поддерживается.
- Анализ изображений с пользовательской моделью и сегментирование изображений (удаление фона) больше не поддерживается в пакете SDK, так как Компьютерное зрение REST API (2023-10-01) их пока не поддерживает. Чтобы использовать любую функцию, вызовите REST API Компьютерное зрение (2023-04-01-preview) напрямую (используя
AnalyzeиSegmentоперации соответственно).
Ноябрь 2023 г.
Анализ изображения 4.0 GA
REST API анализа образа 4.0 теперь находится в общедоступной доступности. Чтобы приступить к работе, следуйте краткому руководству по анализу образа 4.0.
Другие функции анализа изображений, такие как настройка модели, удаление фона и многомодальные внедрения, остаются в общедоступной предварительной версии.
Сентябрь 2023
Устаревание устаревших версий API для компьютерного зрения
API для компьютерного зрения версии 1.0, 2.0, 3.0 и 3.1 будут прекращены к использованию 13 сентября 2026 г. Разработчики не смогут делать вызовы к этим API после этой даты. Мы рекомендуем всем пострадавшим клиентам перенести свои задачи в общедоступный API Компьютерное зрение 3.2, воспользовавшись этим руководством быстрого старта. Клиенты также должны рассмотреть возможность миграции на API анализа изображений 4.0 (предварительная версия), который обладает нашими новейшими и наибольшими возможностями анализа изображений.
Ознакомьтесь с нашими вопросами и ответами.
Май 2023 г.
Анализ изображений 4.0 Распознавание продуктов (общедоступная предварительная версия)
API распознавания продуктов позволяют анализировать фотографии полков в розничном магазине. Вы можете обнаружить наличие или отсутствие продуктов и получить их координаты ограничивающей рамки. Используйте его в сочетании с настройкой модели для обучения модели для идентификации конкретных продуктов. Вы также можете сравнить результаты распознавания продуктов с документом планограммы магазина. Распознавание продуктов.
Март 2023 г.
Общедоступная предварительная версия пакета SDK для анализа изображений Визуального распознавания Azure 4.0
Модель основы Флоренции теперь интегрирована в Azure Vision. Улучшенные службы визуального зрения позволяют разработчикам создавать готовые к рынкам приложения Azure Vision в различных отраслях. Теперь клиенты могут легко оцифровывать, анализировать и подключать свои данные к взаимодействиям на естественном языке, получая мощные инсайты из своего изображения и видеоконтента, что способствует обеспечению доступности, привлечению клиентов через продвижение SEO, защите пользователей от вредного контента, повышению безопасности и улучшению времени реагирования на инциденты. Дополнительные сведения см. в Объявлении модели Флоренция от Майкрософт.
Пакет SDK для анализа изображений 4.0 (общедоступная предварительная версия)
Анализ изображений 4.0 теперь доступен через пакеты SDK клиентской библиотеки в C#, C++и Python. Это обновление также включает в себя подписи к изображениям на базе Florence и подробные подписи с производительностью на уровне человека.
Анализ изображений версии 4.0 Субтитры и плотное субтитры (общедоступная предварительная версия):
"Заголовок" заменяет "Описание" в версии 4.0 в качестве улучшенной функции подписи изображений, богатой подробными сведениями и семантической пониманием. Подробные пояснения предоставляют более подробную информацию, создавая одно предложение, описывающее до 10 областей изображения, в дополнение к описанию всего изображения. Также плотные подписи возвращают координаты ограничивающих прямоугольников для описанных областей изображения. Существует также новый гендерно-нейтральный параметр, позволяющий клиентам выбирать, следует ли включить вероятностное определение пола для замещающего текста и приложений Seeing AI. Автоматически предоставляйте информативные подписи, доступный альтернативный текст, SEO-оптимизацию и интеллектуальный подбор фотографий для поддержки цифрового контента. Текстовые надписи изображений.
Сводка видео и указатель кадров (общедоступная предварительная версия):
Поиск и взаимодействие с видеоконтентом так же естественно, точно как вы думаете и пишете. Найдите соответствующее содержимое без необходимости в дополнительных метаданных. Доступно только в Visual Studio.
Настройка модели анализа изображений 4.0 (общедоступная предварительная версия)
Теперь вы можете создавать и обучать собственные пользовательские модели классификации изображений и моделей обнаружения объектов с помощью Visual Studio или REST API версии 4.0.
API многомодальных встраиваний (общедоступный предварительный просмотр)
API-интерфейсы многомодальных эмбеддингов, часть API анализа изображений 4.0, позволяют векторизацию изображений и текстовых запросов. Они позволяют преобразовать изображения и текст в координаты в многомерном векторном пространстве. Теперь вы можете выполнять поиск по естественному языку и находить соответствующие изображения с помощью векторного поиска сходства.
Интерфейсы API удаления фона (открытая предварительная версия)
В рамках API анализа изображений 4.0 API фонового удаления позволяет удалить фон изображения. Эта операция может выводить изображение обнаруженного объекта переднего плана с прозрачным фоном или альфа-матовое изображение в градациях серого, показывающее степень непрозрачности обнаруженного объекта.
Устаревание предварительных версий Azure Vision 3.0 и 3.1
Запланировано, что предварительные версии API Azure Vision 3.0 и 3.1 будут выведены из эксплуатации 30 сентября 2023 г. Клиенты не смогут совершать вызовы к этим API-интерфейсам после этой даты. Клиентам рекомендуется перенести рабочие нагрузки в общедоступный API версии 3.2. При миграции с предварительных версий на API версии 3.2 следует учитывать следующие изменения:
- Вызовы API анализа изображений и чтения принимают необязательный параметр версии модели, который можно использовать для указания используемой модели ИИ. По умолчанию они используют последнюю модель.
- Вызовы API Analyze Image и Read также возвращают поле
model-versionв случае успешных ответов API. В этом поле сообщается, какая модель использовалась. - API Azure Vision 3.2 использует другой формат отчетов об ошибках. Сведения о корректировке кода обработки ошибок см. в справочной документации по API.
Октябрь 2022
Анализ изображений Azure Vision 4.0 (общедоступная предварительная версия)
Анализ изображений 4.0 выпущен в общедоступной предварительной версии. Новый API включает подписи к изображениям, теги изображений, обнаружение объектов, интеллектуальную обрезку, обнаружение людей и функции OCR, доступные через одну операцию анализа изображения. OCR оптимизирован для неконкретных изображений, не относящихся к документам, в синхронном API с улучшенной производительностью, что облегчает интеграцию возможностей OCR в рабочие процессы.
Сентябрь 2022
Прекращение поддержки предварительных версий Azure Vision 3.0/3.1 для функции распознавания текста
Предварительные версии Azure Vision 3.0 и 3.1 API чтения запланировано на прекращение 31 января 2023 г. Клиентам рекомендуется ознакомиться с руководствами и краткими руководствами, чтобы приступить к работе с общедоступной версией API чтения. Последние версии общедоступной версии предоставляют следующие преимущества:
- Последняя общедоступная модель OCR 2022
- Значительное расширение охвата языка OCR, включая поддержку рукописного текста
- Улучшено качество OCR
Июнь 2022 г.
Запуск Vision Studio
Vision Studio — это средство пользовательского интерфейса, которое позволяет изучать, создавать и интегрировать функции из Azure Vision в приложения.
Vision Studio предоставляет платформу для пробного ознакомления с некоторыми функциями службы и позволяет наглядно увидеть, какие данные они возвращают. С помощью Studio можно приступить к работе без написания кода, а затем использовать доступные клиентские библиотеки и REST API в приложении.
Отмена предварительной версии Azure Vision 3.2
Предварительные версии API 3.2 планируется вывести из эксплуатации в декабре 2022 года. Клиентам рекомендуется использовать общедоступную версию API. Учитывайте указанные ниже изменения при переходе с версий 3.2-preview.
- Вызовы API анализа изображений и чтения теперь принимают необязательный параметр model-version, который можно использовать для указания используемой модели ИИ. По умолчанию они используют последнюю модель.
- Вызовы API Analyze Image и Read также возвращают поле
model-versionв случае успешных ответов API. В этом поле сообщается, какая модель использовалась. - API анализа изображений теперь используют другой формат отчетов об ошибках. Сведения о корректировке кода обработки ошибок см. в справочной документации по API.
Май 2022 г.
Общедоступная версия модели API распознавания текста (чтение)
Последняя модель API OCR (чтение) Azure Vision с 164 поддерживаемыми языками теперь общедоступна как облачная служба и контейнер.
- Распознавание текста (OCR) теперь поддерживает печатный текст на 164 языках, включая русский, арабский, хинди и другие языки на основе кириллицы, письменности деванагари и арабской письменности.
- Поддержка OCR для рукописного текста теперь охватывает девять языков: английский, испанский, итальянский, китайский (упрощенное письмо), корейский, немецкий, португальский, французский и японский.
- Улучшена поддержка распознавания отдельных символов, рукописных дат, сумм, имен и других элементов, часто встречающихся в счетах и накладных.
- Улучшена обработка цифровых PDF-документов.
- Максимальный размер входного файла увеличен в 10 раз — до 500 МБ.
- Улучшена производительность и уменьшена задержка.
- Решение доступно в виде облачной службы и контейнера Docker.
См. руководство по OCR, чтобы узнать, как использовать общедоступную модель GA.
2022 февраля
Общедоступная предварительная версия API OCR (чтение) поддерживает 164 языка
Azure Vision расширяет поддерживаемые языкиAPI OCR (чтение) до 164 в последней предварительной версии:
- Поддержка OCR для печатного текста расширяется до 42 новых языков, включая арабский, хинди и другие языки, использующие арабское и деванагари письмо.
- Поддержка рукописного ввода для оптического распознавания символов (OCR) расширяется за счет японского и корейского языков в дополнение к английскому, китайскому (упрощенное письмо), французскому, немецкому, итальянскому, португальскому и испанскому.
- Среди улучшений была оптимизирована поддержка извлечения рукописных дат, сумм, имен и полей с одним символом.
- Общие улучшения производительности и качества искусственного интеллекта
Ознакомьтесь с руководством по OCR, чтобы узнать, как использовать новые функции предварительной версии.
Сентябрь 2021 года
Общедоступная предварительная версия API OCR (чтение) поддерживает 122 языка
API OCR (чтение) Azure Vision расширяет поддерживаемые языки до 122 с помощью последней предварительной версии:
- OCR поддерживает печатный текст на 49 новых языках, включая русский, болгарский и другие языки на основе кириллицы и латиницы.
- OCR поддерживает рукописный текст на 6 новых языках, включая английский, китайский упрощенный, французский, немецкий, итальянский, португальский и испанский.
- Усовершенствования обработки цифровых документов PDF и текста машиночитаемой зоны (MRZ) в удостоверениях личности.
- Общие улучшения производительности и качества искусственного интеллекта
Ознакомьтесь с руководством по OCR, чтобы узнать, как использовать новые функции предварительной версии.
Август 2021 г.
Расширение языка тегирования изображений
Последняя версия (3.2) для средства тегирования изображений теперь поддерживает теги на 50 языках. Дополнительные сведения см. на странице Поддержка языков.
Июль 2021
Оптимизированные атрибуты HeadPose и ориентиры для Detection_03
- Модель Detection_03 была обновлена и теперь поддерживает ориентиры лица.
- Ориентиры в Detection_03 гораздо точнее, особенно в ориентирах глаз, которые имеют решающее значение для отслеживания взгляда.
май 2021
Обновление контейнера пространственного анализа
Выпущена новая версия контейнера для пространственного анализа с новым набором возможностей. Этот контейнер Docker позволяет анализировать потоковую передачу видео в реальном времени для распознавания пространственных связей между людьми и их перемещения в физических средах.
Теперь операции пространственного анализа можно настраивать для определения направления, в котором смотрит человек.
- Для операций
personcrossinglineиpersoncrossingpolygonможно включить классификатор ориентации, настроив параметрenable_orientation. По умолчанию он имеет значение OFF.
- Для операций
Операции пространственного анализа теперь также предлагают конфигурацию для определения скорости человека во время ходьбы или бега.
- Скорость можно определить для операций
personcrossinglineиpersoncrossingpolygon, включив классификаторenable_speed, который по умолчанию отключен. Выходные данные отражаются в параметрахspeed,avgSpeedиminSpeed.
- Скорость можно определить для операций
Апрель 2021 г.
Общедоступная версия Azure Vision версии 3.2
API визуального распознавания Azure версии 3.2 теперь общедоступен со следующими обновлениями:
- Улучшенная модель для назначения тегов изображениям: анализирует визуальное содержимое и создает соответствующие теги на основе объектов, действий и содержимого, присутствующих на изображении. Эта модель доступна через API назначения тегов изображениям. Дополнительные сведения см. в руководстве и обзоре по Анализу изображений.
- Обновленная модель модерации контента: обнаруживает наличие содержимого для взрослых и предоставляет флаги для фильтрации изображений с содержимым для взрослых, содержимым непристойного характера или сценами насилия. Эта модель доступна через API анализа. Дополнительные сведения см. в руководстве и обзоре по Анализу изображений.
- OCR (чтение) доступен для 73 языков, включая упрощенный и традиционный китайский, японский, корейский и латинский языки.
- OCR (чтение) также доступен в виде контейнера без дистрибутива для локального развертывания.
Март 2021 г.
Обновление общедоступной предварительной версии Azure Vision 3.2
Обновлена общедоступная предварительная версия API Визуального распознавания Azure версии 3.2. В предварительной версии есть все функции Azure Vision, а также обновленные API чтения и анализа.
2021 февраля
В API чтения версии 3.2 (общедоступная предварительная версия) включена функция OCR для 73 языков
Общедоступная предварительная версия API чтения Визуального распознавания Azure версии 3.2, доступная как облачная служба и контейнер Docker, включает следующие обновления:
- OCR для 73 языков, включая упрощенный и традиционный китайский, японский, корейский и латинский языки;
- Естественный порядок чтения для результатов строки текста (только для латинских языков)
- классификация стилей рукописного ввода для строк текста и оценка достоверности (только для латинских языков);
- извлечение текста только для выбранных страниц многостраничного документа;
- доступность в качестве контейнера без дистрибутива для локального развертывания.
Чтобы узнать больше, ознакомьтесь с пособием по использованию API чтения.
Январь 2021
Обновление контейнера пространственного анализа
Выпущена новая версия контейнера для пространственного анализа с новым набором возможностей. Этот контейнер Docker позволяет анализировать потоковую передачу видео в реальном времени для распознавания пространственных связей между людьми и их перемещения в физических средах.
- Теперь можно настроить операции пространственного анализа для определения того, надето ли на лице человека что-либо, например защитная маска.
- Для операций
personcount,personcrossinglineиpersoncrossingpolygonможно включить классификатор масок, настроив параметрENABLE_FACE_MASK_CLASSIFIER. - Для каждого человека, обнаруженного в видеопотоке, будут возвращаться атрибуты
face_maskиface_noMaskкак метаданные с оценкой достоверности.
- Для операций
- Операция personcrossingpolygon была расширена, чтобы позволить вычисление времени пребывания человека в зоне. В конфигурации зоны для операции можно задать параметру
typeзначениеzonedwelltime, и новое событие типа personZoneDwellTimeEvent будет содержать полеdurationMsс числом миллисекунд, в течение которых пользователь был в определенной зоне. - Критическое изменение: событие personZoneEvent было переименовано в personZoneEnterExitEvent. Это событие инициируется операцией personcrossingpolygon, когда человек входит в зону или выходит из нее, и предоставляет информацию о направлении, связанного с пронумерованной стороной зоны, которую пересекли.
- URL-адрес можно указать как частный параметр (замаскированный) во всех операциях. Обфускация является необязательной. Она будет работать, только если
KEYиIVпредоставляются в виде переменных среды. - Калибровка по умолчанию включена для всех операций. Чтобы отключить ее, укажите
do_calibration: false. - Включена поддержка автоматической рекалибровки (по умолчанию отключена) с помощью параметра
enable_recalibration. Дополнительные сведения см. в статье Операции пространственного анализа. - В
DETECTOR_NODE_CONFIGдобавлены параметры калибровки камеры. Дополнительные сведения см. в статье Операции пространственного анализа.
октябрь 2020
API визуального распознавания Azure версии 3.1 общедоступная версия
API распознавания Azure в общедоступной доступности обновлен до версии 3.1.
Сентябрь 2020 г.
Контейнер для пространственного анализа (предварительная версия)
Контейнер для пространственного анализа предоставляется в предварительной версии. Функция пространственного анализа Azure Vision позволяет анализировать потоковое видео в режиме реального времени, чтобы понять пространственные связи между людьми и их перемещением через физические среды. Пространственный анализ — это контейнер Docker, который можно использовать в локальной среде.
В API чтения версии 3.1 (общедоступная предварительная версия) включена функция OCR для японского языка
API для чтения в Azure Vision версии 3.1 в публичной предварительной версии добавляет следующие возможности:
OCR для японского языка
Для каждой строки текста выберите стиль написания (рукописный или печатный текст) и оценку достоверности (только для латинских языков).
В многостраничных документах извлекать текст можно только для выбранных страниц или диапазона страниц.
Эта предварительная версия API чтения поддерживает английский, голландский, испанский, итальянский, упрощенный китайский, немецкий, португальский, французский и японский языки.
Чтобы узнать больше, ознакомьтесь с пособием по использованию API чтения.
Июль 2020
Общедоступная предварительная версия API для чтения v3.1 включает функцию OCR для упрощенного китайского языка.
Общедоступная предварительная версия API чтения в Azure Vision in Foundry Tools версии 3.1 добавляет поддержку упрощенного китайского языка.
- Эта предварительная версия API чтения поддерживает английский, голландский, французский, немецкий, итальянский, португальский, упрощенный китайский и испанский языки.
Чтобы узнать больше, ознакомьтесь с пособием по использованию API чтения.
Май 2020 г.
API зрительного восприятия Azure версии 3.0 перешел в стадию общего доступа, с обновлениями для Read API.
- поддержкой английского, голландского, французского, немецкого, итальянского, португальского и испанского языков.
- Повышенная точность
- Оценка достоверности каждого извлеченного слова.
- Новый формат вывода.
Чтобы узнать больше, см. Общие сведения об OCR.
Март 2020 г.
- TLS 1.2 теперь применяется для всех HTTP-запросов к этой службе. Дополнительные сведения см. в разделе "Безопасность средств Foundry".
Январь 2020 г.
Общедоступная предварительная версия API чтения 3.0
Теперь вы можете использовать API чтения (версия 3.0), чтобы извлекать печатный или рукописный текст из изображений. По сравнению с предыдущими версия 3.0 предоставляет:
- Повышенная точность
- Новый формат вывода.
- Оценка достоверности каждого извлеченного слова.
- Поддержка испанского и английского языков с языковым параметром.
Выполните указания Краткого руководства по извлечению текста, чтобы начать использовать API 3.0.