Распознавание продуктов (предварительная версия 4.0)

Статья
2025-04-01

Внимание

Эта функция теперь устарела. 31 марта 2025 г. API предварительной версии анализа изображений Azure AI 4.0 для классификации пользовательских изображений, обнаружения пользовательских объектов и распознавания продуктов будет выведен из эксплуатации. После этой даты вызовы API к этим службам завершаются сбоем.

Чтобы обеспечить плавную работу ваших моделей, перейдите на Azure AI Custom Vision, который теперь общедоступен. Система настраиваемого визуального распознавания предлагает аналогичные функциональные возможности для этих устаревающих функций.

API распознавания продуктов позволяют анализировать фотографии полков в розничном магазине. Вы можете определить наличие продуктов и получить координаты ограничивающей рамки. Используйте его в сочетании с настройкой модели для обучения модели для идентификации конкретных продуктов. Вы также можете сравнить результаты распознавания продуктов с документом планограммы магазина.

Попробуйте возможности распознавания продуктов быстро и легко в браузере с помощью Vision Studio.

Попробовать Vision Studio

Фотография полки с товарами и пробелами, обозначенными в прямоугольниках.

Примечание.

Бренды, отображаемые на изображениях, не связаны с корпорацией Майкрософт и не указывают ни одну форму подтверждения продуктов Майкрософт или Майкрософт владельцами бренда, или одобрение владельцев бренда или их продуктов корпорацией Майкрософт.

Внимание

Вы можете обучить пользовательскую модель для распознавания продуктов с помощью служба Custom Vision или API для распознавания продуктов в версии 4.0. В следующей таблице сравниваются две службы.

Области

Продукты на полках — Индивидуальное визуальное распознавание

Распознавание продуктов — API анализа изображений и настройка

Компоненты

Индивидуальное понимание продукта

Сшивание изображений и исправление,
предварительно обученное понимание продукта,
пользовательское понимание продуктов,
сопоставление планограммы

Базовая модель

CNN

Модель преобразователя Флоренции

Добавление меток

Customvision.ai

AML Studio

Веб-портал

Customvision.ai

Vision Studio

Библиотеки

REST, SDK

REST, пример Python

Минимальные необходимые данные для обучения

15 изображений на категорию

2–5 изображений на категорию

Хранилище данных обучения

Отправлено в службу

Учетная запись клиента для хранения BLOB-объекта

Размещение моделей

Облако и периферия

Только облачное размещение, размещение контейнеров на периферийных узлах будет доступно позже.

Качество ИИ

контекст	Точность топ-1, 14 наборов данных
1 снимок (каталог)	29,4
2 выстрела	57,1
3 выстрела	66,7
5 выстрелов	80.8
10 выстрелов	86.4
полный	94.9

контекст	Максимальная точность 1, 14 наборов данных
1 снимок (каталог)	86.9
2 выстрела	88.8
3 выстрела	89.8
5 выстрелов	90,3 %
10 выстрелов	91.0
полный	95,4

Цены

Цены на настраиваемую систему компьютерного зрения

Цены на анализ изображений

Функции распознавания продуктов

Композиция полочного изображения

API сшивания и исправления позволяют изменять изображения, чтобы повысить точность результатов понимания продуктов. Эти API можно использовать для:

Объедините несколько изображений полки в одно изображение.
Исправление изображения для удаления искажений перспективы.

Распознавание товаров на полке (предварительно обученная модель)

API понимания продуктов позволяет анализировать изображение на полке с помощью предварительно обученной модели. Эта операция обнаруживает продукты и зазоры на изображении полки и возвращает координаты ограничивающих прямоугольников для каждого продукта и зазора, а также коэффициент уверенности для каждого из них.

В следующем ответе JSON показано, что возвращает API распознавания продуктов.

{
  "imageMetadata": {
    "width": 2000,
    "height": 1500
  },
  "products": [
    {
      "id": "string",
      "boundingBox": {
        "x": 1234,
        "y": 1234,
        "w": 12,
        "h": 12
      },
      "classifications": [
        {
          "confidence": 0.9,
          "label": "string"
        }
      ]
    }
  ],
  "gaps": [
    {
      "id": "string",
      "boundingBox": {
        "x": 1234,
        "y": 1234,
        "w": 123,
        "h": 123
      },
      "classifications": [
        {
          "confidence": 0.8,
          "label": "string"
        }
      ]
    }
  ]
}

Распознавание продуктов по полке (настраиваемая модель)

API распознавания продуктов также можно использовать с пользовательской обученной моделью для обнаружения конкретных продуктов. Эта операция возвращает координаты ограничивающего прямоугольника каждого продукта и пробела вместе с меткой каждого продукта.

В следующем ответе JSON иллюстрируется, что возвращает API понимания продуктов при использовании с пользовательской моделью.

"detectedProducts": {
  "imageMetadata": {
    "width": 21,
    "height": 25
  },
  "products": [
    {
      "id": "01",
      "boundingBox": {
        "x": 123,
        "y": 234,
        "w": 34,
        "h": 45
      },
      "classifications": [
        {
          "confidence": 0.8,
          "label": "Product1"
        }
      ]
    }
  ],
  "gaps": [
    {
      "id": "02",
      "boundingBox": {
        "x": 12,
        "y": 123,
        "w": 1234,
        "h": 123
      },
      "classifications": [
        {
          "confidence": 0.9,
          "label": "Product1"
        }
      ]
    }
  ]
}

Соответствие полки планограмме

API сопоставления планограмм позволяет сравнить результаты API распознавания продуктов с документом планограммы. Эта операция сопоставляет каждое обнаруженное изделие и пробел с его соответствующим положением в документе планограммы.

Он возвращает ответ в формате JSON, который описывает каждую позицию в документе планограммы, занятую продуктом или свободную.

{
  "matchedResultsPerPosition": [
    {
      "positionId": "01",
      "detectedObject": {
        "id": "01",
        "boundingBox": {
          "x": 12,
          "y": 1234,
          "w": 123,
          "h": 12345
        },
        "classifications": [
          {
            "confidence": 0.9,
            "label": "Product1"
          }
        ]
      }
    }
  ]
}

Ограничения

Распознавание продуктов доступно только в определенных регионах Azure.
Размер изображений полки может быть до 20 МБ. Рекомендуемый размер составляет 4 МБ.
Перед отправкой их для анализа рекомендуется выполнять сшивание и исправление на изображениях полок.
Использование пользовательской модели является необязательным в распознавании продуктов, но оно требуется для функции сопоставления планограммы.

Следующие шаги

Начните работать с распознаванием продуктов, попробовав API для стыковки и коррекции. Затем выполните базовый анализ с помощью API распознавания продуктов.