Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Это важно
Уведомление о признании устаревшим: Сценарий Cloud-Scale Analytics устарел и больше не поддерживается и не обслуживается. Чтобы гарантировать, что будет представлено только лучшее руководство, это руководство будет удалено в апреле 2026 года.
Сведения о текущем руководстве по данным CAF см. в разделе "Унифицировать платформу данных".
Аналитика в масштабе облака рекомендует учитывать следующие требования для управления данными:
- Определение сущности данных для создания общего бизнес-словаря в бизнес-глоссарии. Сущности данных в этом контексте означают такие понятия, как клиент, поставщик, материалы, сотрудники и другие.
- Идентификация и обнаружение сущностей данных.
- Классификация данных для управления безопасностью доступа к данным, конфиденциальностью данных и хранением данных.
- Люди, такие как владельцы данных с подотчетностью управления и сотрудниками по управлению данными, ответственными за защиту и качество данных.
- Процессы управления данными.
- Управление жизненным циклом данных для управления сроком хранения данных.
- Определение политик и правил управления конкретными данными в течение всего жизненного цикла.
- Применение политик к разным хранилищам данных в распределенной системе данных.
- Управление главными данными для обеспечения согласованности данных в операционных и аналитических системах, таких как клиент, продукт и поставщик.
- Происхождение метаданных для понимания трансформации и взаимосвязи сущностей данных.
- Технология позволяет управлять структурированными, многоструктурированными и неструктурированными данными. Управление может охватывать центр обработки данных, несколько облаков и периферийные вычисления.
Одна из проблем заключается в том, что данные собираются и хранятся в нескольких местах в разных местах предприятия. Кроме того, это могут быть данные, собираемые и хранящиеся в разных географических регионах и юрисдикциях. В результате для управления одними и теми же данными в разных юрисдикциях применяются разные законы. Обнаруживайте данные, распределенные по нескольким облакам и географическим расположениях, чтобы:
- Понять, какие существуют атрибуты данных, сущности данных и связи данных в распределённой среде данных.
- Классифицируйте данные, чтобы узнать, как управлять им.
- Определите политики, чтобы указать способ управления данными для каждого типа классификации данных и управления жизненным циклом.
- Обеспечение качества данных, безопасности доступа к данным, конфиденциальности данных и политики управления жизненным циклом в распределенной среде данных.
Классификация данных
Классификация данных — это способ классификации ресурсов данных путем назначения уникальных логических тегов или классов ресурсам данных. В основе классификации лежит бизнес-контекст данных.
Для понимания уровня конфиденциальности и срока хранения данных необходимо определить способ их классификации. Требуется для классификации:
- Схема классификации конфиденциальности данных.
- Схема классификации хранения данных.
Схема классификации конфиденциальности данных
| Классификация | Описание |
|---|---|
| Общедоступный | Любой пользователь может получить доступ к данным, и его можно отправить любому пользователю. Например, открытые государственные данные. |
| Только для внутреннего применения | Доступ к данным может получить только сотрудники, и его нельзя отправлять за пределы компании. |
| Конфиденциальная | Данные можно совместно использовать только в том случае, если это необходимо для конкретной задачи. Данные не могут быть отправлены за пределы компании без соглашения о неразглашении. |
| Конфиденциальные (персональные) данные | Данные содержат частную информацию, которая должна быть замаскирована и предоставляться только тем, кому это необходимо знать, и только на ограниченное время. Данные не могут быть отправлены несанкционированным сотрудникам или за пределами компании. |
| С ограниченным доступом | Эти данные могут предоставляться только именованным лицам, которые отвечают за защиту. Например, юридические документы или торговые секреты. |
Схема классификации жизненного цикла данных
| Хранение | Описание |
|---|---|
| Нет | Данные можно удалять в любое время. |
| Временные | Храните данные в течение короткого периода времени. Например, сохраняйте данные Twitter в течение недели. |
| Фиксированный период | Храните данные в течение заданного количества лет, после чего его можно удалить. Например, сохраняйте налоговые записи в течение семи лет, чтобы соответствовать законам правительства. |
| Постоянный | Никогда не удалять данные. Например, юридическая корреспонденция. |
Автоматизация процесса классификации конфиденциальности данных и хранения жизненного цикла данных с помощью классов, определенных в каждой схеме, необходима для последовательной маркировки данных в распределенном ландшафте данных. Автоматизация обеспечивает согласованное и правильное управление. Для управления данными в соответствии с классификацией определите правила и политики для каждого класса, указанного в схеме классификации.
Роли и обязанности по системе управления данными
Еще одним требованием является обеспечение подотчетности. В противном случае путаница заключается в том, кто отвечает за управление данными. Как ответить на следующие вопросы в отсутствие подотчетности?
- Кто задает метрики успешности и следит, насколько хорошо работает программа управления данными?
- Кто является владельцем данных?
- Кто составляет и обеспечивает ведение бизнес-глоссария?
- Кто формирует и утверждает политику безопасности доступа к данным?
- Кто несет ответственность за соблюдение требований при защите конфиденциальности персональных данных?
- Кто следит за качеством данных о продукте во всех брошюрах и на партнерских веб-сайтах?
- Кто обеспечивает согласованность данных клиента во всех системах?
- Кто контролирует использование данных внешней подписки в соответствии с лицензией?
- Кто контролирует привилегированных пользователей, таких как администраторы баз данных и специалисты по обработке данных?
- Это руководитель уровня C? Это руководитель отдела?
- Это руководитель отдела управления, рисков и соответствия требованиям?
- Что насчет юридического отдела?
- Несет ли ИТ ответственность?
Определение ролей и обязанностей позволит избежать путаницы и заложит основу для формирования культуры работы с данными.
Процессы управления данными
Необходимы процессы, роли и обязанности, чтобы:
- Управление определением и обслуживанием общего бизнес-словаря.
- Узнайте и определите, какие данные у вас есть, что это означает, и где он хранится.
- Классифицируйте данные, чтобы узнать, как управлять им.
- Управление определением и обслуживанием политик безопасности доступа к данным.
- Управление определением и обслуживанием политик конфиденциальности данных.
- Определите проблемы с качеством данных и исправьте их.
- Примените политики для обеспечения соответствия требованиям.
- Управление обслуживанием основных данных.
Политики и правила управления данными
Определите политики и правила для управления:
- Правила целостности данных
- Политики и правила приема данных
- Политики и правила управления безопасностью доступа к данным
- Политики и правила управления конфиденциальностью данных
- Политики и правила качества данных
- Политики и правила обслуживания данных
- Политики и правила хранения данных
Полученные политики и правила необходимо сопоставить с каждым классом в схемах классификации управления данными.
Управление основными данными
Другим требованием для управления данными является управление главными данными. Основные данные — это наиболее распространенные общие данные, хранящиеся в организации и включающие основные сущности данных. К основным сущностям данных относятся клиент, поставщик, материалы, сотрудник и актив. Она также включает данные плана финансовых счетов, которые находятся в разных финансовых приложениях. Так как основные данные настолько широко распространены, это не зависит от приложения. Они необходимы для работы приложений по обработке транзакций и аналитических систем. Сохранение синхронизации этих данных может устранить множество ошибок данных и ошибок обработки. Таким образом, поддержание его централизованно с помощью общего процесса и синхронизации каждой системы, которая нуждается в ней, является идеальной ситуацией. Кроме того, необходимо управление тем, кто допускается к его обслуживанию и где это обслуживание должно происходить.
То же самое относится и к эталонным данным, таким как наборы кода и данные финансовых рынков. В этом случае стандартизация и синхронизация наборов кода называются эталонным управлением данными, что также является обязательным требованием.
происхождение метаданных
Наконец, необходимо обеспечивать родословную метаданных. Вы можете использовать следы аудита, чтобы узнать, откуда исходит данные и как они преобразуются по пути к отчету или хранилищу данных. Метаданные можно использовать для отслеживания того, кто или что управляет данными, включая время и место.
Краткие сведения о комплексном управлении данными
Для управления данными на протяжении всего их жизненного цикла в хранилищах на пограничных устройствах, в нескольких облаках и центрах обработки данных требуется сквозное решение.
Решение по управлению данными должно содержать несколько компонентов:
- Концепция и стратегия управления данными.
- Сами данные, такие как данные клиента, данные поставщика, данные заказа и другие
- Жизненный цикл данных от создания до уничтожения, в рамках которого необходимо управлять данными
- Роли и обязанности управления данными (люди)
- Процессы и действия по управлению данными и их применение к жизненному циклу данных
- Политики и правила для управления данными в различных точках жизненного цикла
- Технологии управления данными, помогающие обеспечить управление данными