Создайте и улучшите ваш пользовательский анализатор в Content Understanding Studio

Content Understanding Studio позволяет создавать анализаторы содержимого, которые извлекают содержимое и поля, адаптированные к вашим потребностям. Выполните следующие действия, чтобы создать пользовательский анализатор в Content Understanding Studio.

Предпосылки

Чтобы приступить к работе, убедитесь, что у вас есть следующие ресурсы и разрешения:

Подписка Azure. Если у вас нет подписки Azure, создайте бесплатную учетную запись.
Ресурс Microsoft Foundry на портале Azure, созданный в поддерживаемом регионе.
- Этот ресурс указан в разделе Foundry>Foundry на портале.
Настройте модели развертывания по умолчанию для ресурса Content Understanding. Задав значения по умолчанию, вы создаете подключение к моделям Microsoft Foundry, используемым для запросов на понимание содержимого. Выберите для этого один из следующих методов:
- Портал
- REST API
1. Перейдите на страницу параметров распознавания содержимого.
2. Нажмите кнопку +Добавить ресурс в левом верхнем углу.
3. Выберите ресурс Foundry, который вы хотите использовать, и нажмите кнопку "Далее>сохранить".
  
  Убедитесь, что установлен флажок Включить автоматическое развертывание для обязательных моделей, если доступных значений по умолчанию нет. Этот выбор гарантирует, что ресурс полностью настроен с необходимыми моделями GPT-4.1, GPT-4.1-mini и text-embedding-3-large. Для различных предварительно созданных анализаторов требуются разные модели.
Выполнив эти действия, вы настроите подключение между моделями Content Understanding и Foundry в ресурсе Foundry.
1. В вашем ресурсе Foundry создайте развертывания моделей Foundry для моделей GPT-4.1, GPT-4.1-mini и text-embedding-3-large. Инструкции по созданию развертывания моделей см. в разделе Create model deployments in Microsoft Foundry portal. Для разных предварительно созданных анализаторов требуются разные модели, поэтому необходимо развернуть все три модели.
2. Определите развертывания модели по умолчанию на уровне ресурсов. Перед выполнением следующей cURL команды внесите следующие изменения в HTTP-запрос:
  1. Замените {endpoint} и {key} на соответствующие значения из вашего экземпляра Foundry в портале Azure.
  2. Замените {myGPT41Deployment}, {myGPT41MiniDeployment} и {myEmbeddingDeployment} вашими фактическими именами развертывания модели из вашего ресурса Foundry.
```
curl -i -X PATCH "{endpoint}/contentunderstanding/defaults?api-version=2025-11-01" \
  -H "Ocp-Apim-Subscription-Key: {key}" \
  -H "Content-Type: application/json" \
  -d '{
        "modelDeployments": {
          "gpt-4.1": "{myGPT41Deployment}",
          "gpt-4.1-mini": "{myGPT41MiniDeployment}",
          "text-embedding-3-large": "{myEmbeddingDeployment}"
        }
      }'
```

Вход в Студию распознавания содержимого

Перейдите на портал Content Understanding Studio и войдите с помощью учетных данных для начала работы. Если вы знакомы с классической функцией Анализ документов Azure в Студии инструментов Foundry, функция "Понимание содержимого" расширяет тот же контент и извлечение полей для всех модальностей — документ, изображение, видео и звук. Выберите вариант, чтобы попробовать новый интерфейс "Распознавание содержимого" для доступа к мультимодальным возможностям.

Создание пользовательского анализатора

Начните с нового проекта: чтобы приступить к созданию пользовательского анализатора, выберите Create project на домашней странице.
Выберите тип проекта: в этом руководстве выберите параметр Extract content and fields with a custom schema. Дополнительные сведения о классификации и маршрутизации данных см. в руководстве по классификации и маршрутизации данных с помощью Content Understanding.
Создайте проект: присвойте проекту понятное имя и выберите Create.
Отправка примеров данных. Теперь, когда проект настроен, вы можете приступить к созданию пользовательского анализатора. Отправьте пример данных в инструмент, а content Understanding классифицирует данные и рекомендует шаблоны анализаторов, чтобы дать вам отправную точку.

Выберите шаблон сценария: выберите шаблон, который лучше всего подходит для вашего сценария. Все поля схемы можно настроить в соответствии с конкретными потребностями на следующем шаге.
Используйте предлагаемые поля: Если для вашего сценария требуются настраиваемые поля, используйте функцию предложений ИИ для анализа ваших данных и получения полной схемы с полями, которые вас могут заинтересовать для извлечения. Это средство позволяет сохранить предложения, которые подходят и отменить те, которые не нужны.

Определите схему: просмотрите предложенные поля схемы или те, которые являются частью шаблона. Если есть дополнительные поля, которые нужно добавить или изменить, используйте функции редактирования для уточнения полей схемы. Вы можете легко вернуться к уточнению схемы после тестирования и после сборки исходного анализатора. После завершения изменений выберите Save.
Проверьте схему: когда схема готова к тестированию, выберите run analysis , чтобы просмотреть выходные данные схемы в данных. При необходимости можно отправить дополнительные фрагменты примеров данных для тестирования, чтобы узнать, как выполняется схема.
Выполните итерацию схемы: повторите шаги 6–8, чтобы улучшить выходные данные схемы.
Необязательный шаг: Контекстное обучение (только для документов): Для дальнейшего улучшения качества выходных данных вашей схемы можно включить контекстное обучение. Этот шаг позволяет использовать базу данных знаний, на которую модель будет ссылаться и из которой учиться.

Чтобы приступить к работе, отправьте данные обучения в учетную запись облачного хранилища объектов BLOB. Перейдите на вкладку "Знания" и выберите контейнер хранилища BLOB-объектов, содержащий набор обучающих данных примеров документов. На основе только что определенного анализатора модель назначает метки документу. Подтвердите правильность обучающих данных, проверяя и исправляя метки, которые дали неправильный результат, или добавляя отсутствующие результаты.

Создайте анализатор: когда вы удовлетворены выходными данными анализатора, нажмите Build analyzer кнопку в верхней части страницы. Присвойте анализатору имя и выберите Build.
Используйте анализатор. После успешного создания анализатора выберите Jump to analyzer list, чтобы просмотреть полный список всех созданных анализаторов. Выберите только что созданный анализатор, и вы увидите пример кода с ключом и конечной точкой, готовыми к началу работы. Теперь у вас есть конечная точка анализатора, которую можно использовать в собственном приложении с помощью REST API. В этой статье представлена инструкция по использованию Content Understanding Studio для создания пользовательского анализатора.

Дальнейшие шаги

Узнайте, как классифицировать и направлять данные с помощью Studio Content Understanding.
Дополнительные сведения о рекомендациях по пониманию содержимого Azure.

Обратная связь

Были ли сведения на этой странице полезными?

Last updated on 2026-02-01