Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Эта статья поможет вам разобраться в определениях и терминах, с которыми вы можете столкнуться при работе с настраиваемыми системами NER.
Объект
Сущность — это область текста, указывающая на определенный тип информации. Текстовая область может состоять из одного или нескольких слов. В области настраиваемого NER сущности представляют сведения, которые пользователь хочет извлечь из текста. Разработчики помечают сущности в своих данных с необходимыми сущностями, прежде чем передавать их в модель для обучения. Например, "Номер счета", "Дата начала", "Номер отгрузки", "Место рождения", "Город происхождения", "Имя поставщика" или "Адрес клиента".
Например, в предложении "Джон занял у Фреда 25 000 долларов США" сущности могут быть:
| Имя/тип сущности | Объект |
|---|---|
| Имя заемщика | John |
| Имя кредитора | Фред |
| Сумма займа | 25 000 долларов США |
Оценка F1
Оценка F1 необходима, когда вы ищете баланс между точностью и отзывом.
Модель
Модель — это объект, обученный для выполнения определенной задачи, в данном случае, для пользовательского распознавания сущностей. Для обучения модели используются данные с метками, чтобы их затем можно было использовать для задач распознавания.
- Обучение модели — это процесс обучения модели извлекать информацию из данных с метками.
- Оценка модели — это процесс, который выполняется сразу после обучения для определения уровня производительности модели.
- Развертывание — это процесс назначения модели развертыванию, чтобы сделать ее доступной для использования с помощью API прогнозирования.
Точность
Измеряет, насколько точна модель. Представляет собой соотношение между правильно определенными положительными (истинноположительными) результатами и всеми определенными положительными результатами. Метрика точности показывает, сколько из спрогнозированных классов правильно помечено метками.
Проект
Проект — это рабочая область для создания настраиваемых моделей машинного обучения на основе данных. Проект доступен только вам и другим пользователям, имеющим доступ к используемому ресурсу Azure.
В качестве предварительного условия для создания проекта по извлечению пользовательских сущностей необходимо подключить ваш ресурс к учетной записи хранения, содержащей набор данных, когда вы создаёте новый проект. Проект автоматически включает все файлы .txt, доступные в вашем контейнере.
Ниже приведен список действий, которые можно выполнить:
- Добавление меток к данным. Процесс добавления меток к данным, чтобы при обучении модель знала, что именно нужно извлекать.
- Создание и обучение модели. Основной этап проекта, в котором модель начинает обучаться по размеченным данным.
- Просмотр сведений об оценке модели: проверьте производительность модели, чтобы определить, есть ли место для улучшения или вы удовлетворены результатами.
- Развертывание. После просмотра производительности модели и принятия решения о возможности ее использования в вашей среде необходимо назначить ее для развертывания, чтобы ее можно было использовать. Назначаемая развертыванию модель становится доступной для использования с помощью API прогнозирования.
- Тестовая модель. После развертывания модели проверьте развертывание в Microsoft Foundry , чтобы узнать, как она будет выполняться в рабочей среде.
Отзыв
Измеряет способность модели прогнозировать фактические положительные классы. Это соотношение между прогнозируемыми истинными положительными результатами и тем, что было помечено. Метрика полноты показывает, сколько из прогнозируемых классов являются правильными.