Поделиться через


Обнаружение объектов (версия 4.0)

Обнаружение объектов похоже на тегирование, но API возвращает координаты ограничивающего прямоугольника (в пикселях) для каждого найденного на изображении объекта. Например, если изображение содержит собаку, кота и человека, операция обнаружения объектов перечисляет эти объекты с их координатами на изображении. Эту функциональность можно использовать, чтобы обрабатывать отношения между объектами на изображении. Кроме того, она позволяет определить, присутствуют ли на изображении несколько экземпляров одного объекта.

Функция обнаружения объектов применяет теги на основе объектов или живых объектов, определенных на изображении. Между таксономией тегов и таксономией обнаружения объектов не существует формальных связей. На концептуальном уровне функция обнаружения объектов находит только объекты и живые существа, в то время как функция тегирования также может включать контекстные обозначения, такие как помещение, которые нельзя локализовать при помощи ограничивающих рамок.

Попробуйте возможности обнаружения объектов быстро и легко в браузере с помощью Azure AI Vision Studio.

Пример обнаружения объектов

В следующем ответе JSON показано, что API анализа изображений 4.0 возвращает при обнаружении объектов на изображении примера.

Фотография женщины, использующей устройство Microsoft Surface на кухне.

{
    "metadata":
    {
        "width": 1260,
        "height": 473
    },
    "objectsResult":
    {
        "values":
        [
            {
                "name": "kitchen appliance",
                "confidence": 0.501,
                "boundingBox": {"x":730,"y":66,"w":135,"h":85}
            },
            {
                "name": "computer keyboard",
                "confidence": 0.51,
                "boundingBox": {"x":523,"y":377,"w":185,"h":46}
            },
            {
                "name": "Laptop",
                "confidence": 0.85,
                "boundingBox": {"x":471,"y":218,"w":289,"h":226}
            },
            {
                "name": "person",
                "confidence": 0.855,
                "boundingBox": {"x":654,"y":0,"w":584,"h":473}
            }
        ]
    }
}

Ограничения

Важно учесть ограничения функции обнаружения объектов, чтобы избежать влияния (или уменьшить его) ложных отрицательных результатов (пропущенных объектов) и ограниченных сведений.

  • Объекты обычно не распознаются, если они являются маленькими (составляют менее 5 % изображения).
  • Объекты обычно не распознаются, если они располагаются очень близко друг к другу (например, стопка тарелок).
  • Объекты не отличаются по брендам или продуктам (например, различные типы сода на полке магазина). Тем не менее можно получить сведения о торговых марках на изображении с помощью функции обнаружения торговых марок.

Использование API

Функция обнаружения объектов является частью API анализа изображений. Этот API можно вызвать с помощью REST. Включите Objects в features параметр запроса. Затем, когда вы получите полный ответ JSON, анализируйте строку, чтобы извлечь содержимое раздела "objects".

Следующий шаг