Поделиться через


Сведения об анализе ИИ в Исследования по безопасности данных (предварительная версия)

Важно!

Исследования по безопасности данных использует генеративный искусственный интеллект (ИИ), большие языковые модели и оркестрацию при анализе данных в организации. Результаты, созданные искусственным интеллектом, не всегда могут быть точными или полными. Хотя мы стремимся предоставлять достоверную и полезную информацию, системы ИИ могут давать неверные или ложные результаты. Важно проверить информацию и использовать ее с осторожностью. Корпорация Майкрософт не предоставляет никаких гарантий, явных, подразумеваемых или установленных законом, в отношении информации, предоставляемой системами ИИ.

Исследования по безопасности данных (предварительная версия) использует службы и средства ИИ, чтобы помочь вам быстро просматривать и выполнять действия по элементам, связанным с инцидентами безопасности. Службы, связанные с ИИ, включают следующие средства:

  • Поиск векторов
  • Категоризация
  • Экзамен

Поиск векторов в Исследования по безопасности данных (предварительная версия) позволяет выполнять контекстный поиск по данным, добавляемым в область исследования, с помощью расширенной оркестрации и внедрения. Поиск векторов — это технология поисковой системы, которая фокусируется на понимании смысла и контекста слов и фраз в запросе, а не только на сопоставлении ключевых слов.

Вот некоторые ключевые аспекты поиска векторов:

  • Контекстное понимание. Векторный поиск интерпретирует контекст условий поиска с учетом таких факторов, как организация, журнал поиска и общее значение запроса.
  • Распознавание намерений. Поиск в векторов позволяет понять ваше намерение, независимо от того, ищете ли вы информацию, пытаетесь выполнить действие или ищете определенный тип контента, связанного с поиском.
  • Релевантность и точность. Фокусируясь на семантике (значении и намерении слов в запросе), поиск векторов обеспечивает более точные и релевантные результаты и улучшает общий интерфейс поиска.

Когда следователи в вашей организации исследуют скомпрометированные наборы данных, поиск векторов в Исследования по безопасности данных (предварительная версия) может значительно улучшить ваше исследование, решая несколько ключевых проблем:

  • Определение релевантной информации. Поиск в вектора понимает контекст и намерение запросов. Это помогает быстро находить нужные документы, сообщения электронной почты или записи, даже если они не содержат точных ключевых слов, которые вы использовали.
  • Обработка неоднозначности. Поиск векторов вызывает неоднозначность терминов, имеющих несколько значений, гарантируя получение результатов, которые контекстно соответствуют вашему исследованию.
  • Уменьшение шума. Векторный поиск отфильтровывает неуместную информацию, позволяя сосредоточиться на наиболее релевантных данных и сократить время, затрачиваемое на просеивание несвязанных результатов.
  • Повышение эффективности. Векторный поиск упрощает процесс поиска, делая исследование более эффективным и эффективным за счет быстрого поиска наиболее релевантной информации.

Принципы действия

После создания исследования, определения область и подготовки данных для ИИ можно выполнять поиск векторов по набору данных. В то время как предыдущие этапы процесса позволяют выполнять простые ключевое слово, метаданные и поиск по диапазону дат. Поиск векторов использует внедрение ИИ для контекстного поиска данных. Этот процесс позволяет следователям находить элементы, не зная их точного содержимого.

Поиск векторов работает путем запуска всех данных с заданной областью в исследовании с помощью модели внедрения ИИ. Эта модель извлекает семантические значения из каждого элемента набора данных и разбивает их на более мелкие части. Это называется внедрением и позволяет Исследования по безопасности данных (предварительная версия) использовать значения измерений для контекстного понимания данных. Индекс семантического поиска создается на основе этих значений, которые можно запрашивать.

При создании векторного поискового запроса в исследовании ИИ автоматически расширяет и расширяет запрос и выполняет запрос через семантический поисковый индекс. Исследования по безопасности данных (предварительная версия) затем сопоставляет семантическое значение запроса с семантическим значением содержимого и возвращает все контекстно релевантные элементы.

Например, при поиске по запросу "Конфиденциальные данные, включенные в проект Безопасности Contoso", векторная поисковая система понимает, что вы ищете конфиденциальные данные в этом конкретном проекте, а не просто совпадающие ключевые слова (конфиденциальные, данные, Contoso и т. д.), содержащиеся в поисковом запросе. С помощью поиска векторов вы можете запросить затронутые, чтобы найти все элементы данных, связанные с определенной темой, даже если ключевые слова отсутствуют.

Дополнительные сведения об основных понятиях поиска векторов см. в разделе Основные понятия статьи Векторы в поиске иИ Azure .

Категоризация

При нарушении безопасности вашей организации и обнаружении затронутых данных следователи должны приступить к определению приоритетов данных для выявления рисков безопасности. Категории в Исследования по безопасности данных (предварительная версия) устраняют необходимость вручную назначать категории элементам в больших и сложных областях исследования.

Вы можете использовать классификацию на основе ИИ в Исследования по безопасности данных (предварительная версия), чтобы быстрее провести анализ и определить приоритеты потенциально затронутых данных. Чтобы классифицировать данные, можно выбрать все или некоторые параметры категорий по умолчанию, использовать категории, предлагаемые ИИ на основе их исследования, или создать собственные пользовательские категории.

Категории, созданные ИИ, дополнены дополнительными сведениями для содержимого на уровне темы в область:

  • Имя: имя категории или области на основе содержимого.
  • Сводка: краткое описание базового содержимого

В каждой категории можно использовать средства поиска и анализа векторов для любого содержимого.

Категории по умолчанию

Исследования по безопасности данных (предварительная версия) включает категории по умолчанию для классификации элементов в область исследования. При выполнении классификации можно выбрать все категории по умолчанию или только категории по умолчанию, применимые к область проверки. Невыбранные категории по умолчанию игнорируются в анализе, а результаты для этих категорий недоступны при просмотре элементов.

Начальные категории по умолчанию, определяемые обработкой ИИ для элементов контента:

  • Бизнес-информация: общие бизнес-сведения. Эта категория обычно содержит большое количество элементов. Некоторые примеры областей в этой категории могут включать цифровое взаимодействие и анализ, пользовательские и человеческие ресурсы, рутинное административное взаимодействие, взаимодействие с клиентами и многое другое.
  • Записи о взаимодействии: общие сведения о коммуникации. Эта категория также обычно содержит большое количество элементов. Пользователи могут использовать эту категорию для просмотра своих исследований на основе областей коммуникации. Некоторые примеры областей в этой категории могут включать жалобы клиентов, приветствия с праздником, внутренние памятки, обновления проекта и многое другое.
  • Учетные данные и сведения о доступе Основное внимание уделяется информации, связанной с доступом к ресурсам в ходе расследований. Эти сведения помогают выявлять потенциально опасные данные и сообщения в организации. Некоторые примеры областей в этой категории могут включать учетные данные пользователя, несанкционированный доступ к базе данных, подверженность данным и многое другое.
  • Сведения о клиентах. Основное внимание уделяется сведениям, предоставленным клиентам. Эту категорию можно использовать, чтобы понять, какие данные клиентов могут быть подвержены риску. Некоторые примеры областей в этой категории могут включать подтверждения оплаты, улучшение качества обслуживания клиентов, сведения о доставке и многое другое.
  • Сведения о пользователях. Основное внимание уделяется сведениям, связанным с пользователями в вашей организации. Эта категория также обычно содержит большое количество элементов. Некоторые примеры областей в этой категории могут включать сведения о занятости пользователей, стратегии удержания пользователей, членство в специализированных группах и многое другое.
  • Финансовая информация. В ходе расследования основное внимание уделяется финансовой информации. Некоторые примеры областей в этой категории могут включать финансовое планирование, возможности предоставления грантов, бюджеты, финансовую отчетность и многое другое.
  • Сведения о здоровье: в ходе исследования основное внимание уделяется вопросам, связанным со здоровьем и медицинскими вопросами. Некоторые примеры областей в этой категории могут включать в себя велнес-записи и медицинские записи, обновления протокола безопасности COVID-19, утверждения о работоспособности и отчеты об инцидентах и многое другое.
  • Сведения об инцидентах и расследованиях. Основное внимание уделяется вопросам, посвященным инцидентам и расследованиям в ходе расследования. К этой категории относятся инциденты безопасности и расследования в организации. Некоторые примеры областей в этой категории могут включать утечку данных, инциденты с записями работоспособности, мониторинг учетных записей клиентов с высоким риском и многое другое.
  • Интеллектуальная собственность: основное внимание уделяется данным интеллектуальной собственности (IP) в ходе исследования. Некоторые примеры областей в этой категории могут включать будущие патентные заявки, исследования и разработки, метрики результатов экспериментов и многое другое.
  • Маркетинговая информация В исследовании основное внимание уделяется маркетинговым данным. Некоторые примеры областей в этой категории могут включать пресс-релизы, рекламные кампании, планы маркетинга и продаж, стратегии и многое другое.
  • Операционная информация. Основное внимание уделяется операционным данным вашей организации. Некоторые примеры областей в этой категории могут включать логистику, доставку, инвентаризацию, соответствие требованиям, налоговые записи и многое другое.
  • Личная информация. В ходе исследования основное внимание уделяется персональным данным группы и связанным с ними элементам. Некоторые примеры областей в этой категории могут включать списки гостей событий, сотрудники и учебные сеансы, личную информацию сотрудников и многое другое.
  • Регулируемые данные. Основное внимание уделяется регулируемым данным в ходе исследования. Некоторые примеры областей в этой категории могут включать регулирование, защиту данных, нормативные записи и многое другое.

Рекомендуемые категории

Исследования по безопасности данных (предварительная версия) также предоставляет предлагаемые категории, созданные искусственным интеллектом, на основе содержимого, проанализированного в область исследования. Эти предлагаемые категории создаются автоматически, чтобы помочь исследованиям проверять элементы, сгруппированные в непредвиденных или неизвестных областях. В зависимости от типа включенного содержимого предлагаемые категории различаются.

Если анализируемое содержимое в основном сосредоточено на определенной предметной области за пределами областей категорий по умолчанию, предлагаемые категории настраиваются для этой конкретной области содержимого. Например, если анализируемое содержимое сосредоточено на строго конфиденциальной теме с терминами и понятиями, характерными исключительно для вашей организации, предлагаемые категории автоматически создаются для этих областей. Эти категории уникальны для вашей организации и анализируемого содержимого.

Пользовательские категории

Исследования по безопасности данных (предварительная версия) позволяет вручную создавать пользовательские категории для процесса создания ИИ, который будет использоваться при анализе содержимого. Определив категории, наиболее применимые к потребностям исследования, вы можете сэкономить время и позволить процессу ИИ автоматически классифицировать элементы на основе этих пользовательских категорий.

Пользовательские категории могут быть конкретными словами или фразами, которые фиксируют конкретный характер содержимого, интересующего исследование. Например, пользовательские категории могут включать уязвимость безопасности, исправление ошибок, конкретные имена кодов проектов или настраиваемую интеллектуальную собственность, например R&D, связанную с конкретными лекарствами или лекарствами-кандидатами.

Экзамен

При определении элементов, требующих более глубокого анализа, Исследования по безопасности данных (предварительная версия) предоставляет возможности проверки на основе ИИ, помогающие сосредоточиться на ключевых рисках безопасности и конфиденциальных данных.

  • Учетные данные. Используйте эту область проверки для сканирования и извлечения учетных данных из всех выбранных элементов в область исследования. Эта информация позволяет следователям быстро понять, какие учетные записи и учетные данные связаны с инцидентом безопасности, а какие могут быть потенциально эксфильтрованы.

  • Риск. Используйте эту область исследования для оценки всех областей риска в выбранных файлах, чтобы помочь следователям сосредоточиться и приоритизировать расследования. Это средство обеспечивает общий риск для каждого элемента, если элемент является привилегированным содержимым, и другие конкретные риски для элемента.

    Типы областей риска:

    • Идентификаторы ресурсов
    • Учетные данные и секреты
    • Доказательства того, что обсуждения субъектов угроз нарушают обсуждения
    • Срочные инциденты безопасности
    • Гигиена уязвимостей и безопасности
    • Личное и конфиденциальное содержимое
    • Сведения о сети и доступе
    • Соответствие политике и защита данных
    • Сведения об инфраструктуре
    • Сведения о клиенте
    • Информация для государственных организаций
    • Привилегированные сведения
    • Торговые секреты
  • Устранение рисков. Используйте эту область проверки, чтобы оценить риск для выбранных файлов и включить Исследования по безопасности данных (предварительная версия), чтобы предоставить вам инструкции по устранению рисков для дальнейших действий. Выбранные файлы получают оценку риска, сводку по рискам и подробные рекомендации по устранению рисков, чтобы предотвратить дополнительный ущерб от нарушения контента.

Рекомендации по анализу ИИ

В следующей таблице приведены рекомендации, примеры сценариев и рекомендации по использованию средств анализа ИИ в Исследования по безопасности данных (предварительная версия).

Рекомендации Поиск векторов Категоризация Экзамен
Когда использовать Найдите примеры конкретных элементов в векторизованном наборе данных (счета, исправления ошибок и т. д.), чтобы подтвердить гипотезы и продолжить исследование.

Используйте поиск векторов для быстрого интерактивного анализа, результаты быстро заполняются.
Быстро сортируйте большие объемы данных по категориям по умолчанию, пользовательским или созданным ИИ, чтобы определить приоритет фокуса исследования по конфиденциальности и серьезности.

В зависимости от размера набора данных классификация может занять некоторое время.
Целевой анализ на уровне элемента для набора данных с заданной областью помогает извлекать аналитические сведения из подтвержденного ресурса данных для дальнейших действий.

Используйте проверку для выявления элементов для устранения рисков.
Пример сценария Оценка потенциально мошеннических действий. Определение приоритетов элементов для анализа после большого нарушения. Извлечение учетных данных из проверенного набора данных и рекомендуемые шаги по устранению рисков.
Лучшие методики Выполните поиск по всему векторизованному содержимому по интересующим элементам, чтобы создать более значимые категории, предлагаемые ИИ. Выберите одну или несколько категорий и используйте поиск векторов для поиска в категории.

Просмотрите области, созданные ИИ, в каждой категории, чтобы понять определенное содержимое в наборе данных.
Используйте обследование для детализации определенных элементов с высокой чувствительностью, чтобы получить индивидуальные оценки и результаты.

Готовы приступить к работе?