Общие сведения об обработке неструктурированных документов

Примечание.

До июня 2026 г. вы можете опробовать ограниченный объем неструктурированной обработки документов и других выбранных служб содержимого бесплатно, если настроено выставление счетов с оплатой по мере использования . Сведения и ограничения см. в статье Опробовать службы с оплатой по мере использования.

Используйте неструктурированную модель обработки документов (метод обучения) для автоматической классификации файлов и извлечения информации. Он лучше всего подходит для неструктурированных документов, таких как письма или контракты.

Примечание.

Корпорация Майкрософт уважает конфиденциальность и право владения данными, используемыми для обучения и обработки моделей. Ни одна из данных вашей организации не используется или не передается корпорацией Майкрософт для обучения моделей ИИ, моделей с большим языком или любых других моделей. Данные остаются в безопасном состоянии в клиенте вашей организации. Дополнительные сведения см. в статье Защита и конфиденциальность данных Майкрософт.

Общие сведения о неструктурированных моделях

Неструктурированные модели обработки документов используют искусственный интеллект (ИИ) для анализа и извлечения информации из документов. Эти модели используют идентифицируемый текст на основе фраз или шаблонов для определения классификации документа и извлекаемых данных.

Примечание.

Дополнительные сведения об использовании служб обработки документов и примеров сценариев см. в разделах Внедрение обработки документов и Сценарии и варианты использования для обработки документов.

Вы создаете неструктурированные модели обработки документов и управляете ими в центре содержимого SharePoint. При применении модели к библиотеке документов SharePoint она связана с типом контента, который включает столбцы для хранения извлеченных сведений. Вы можете создать новый тип контента или использовать существующий из коллекции типов контента SharePoint.

Примечание.

Типы контента, доступные только для чтения или запечатанные, не могут быть обновлены, поэтому их нельзя использовать в модели.

Добавьте классификаторы и средства извлечения в неструктурированные модели обработки документов, чтобы выполнить следующие действия:

  • Классификаторы используются для поиска и классификации документов, загружаемых в библиотеку документов. Например, классификатор может быть "обучен", чтобы определять все загруженные в библиотеку документы, относящиеся к продлению контракта. Тип контента "продление контракта" определяется вами при создании классификатора.

  • Экстракторы извлекают данные из этих документов. Например, для каждого документа о продлении контракта, определенного в библиотеке документов, отображаются столбцы с датой запуска службы и клиентом для каждого документа.

Используйте примеры файлов для обучения и тестирования классификаторов и средств извлечения. Эти файлы помогают модели узнать, что следует искать при идентификации и извлечении данных. Например, обучите модель продления контракта с помощью реальных документов о продлении контракта из вашей организации. Эти файлы также можно использовать для проверки точности модели.

После публикации своей модели используйте центр управления контентом, чтобы применить ее к любой библиотеке документов SharePoint, к которой у вас есть доступ.

Требования и ограничения

Сведения о требованиях, которые следует учитывать при выборе этой модели, см. в разделе Требования и ограничения для обработки неструктурированных документов.