Поделиться через


Таблицы фактов и измерений

Переключение служб с помощью раскрывающегося списка версий . Дополнительные сведения о навигации.
Область применения: ✅ Microsoft Fabric ✅ Azure Data Explorer

При проектировании схемы для базы данных думайте о таблицах как о широкой принадлежности к одной из двух категорий.

Таблицы фактов

Таблицы фактов — это таблицы, записи которых являются неизменяемыми "фактами", такими как журналы служб и сведения об измерениях. Записи постепенно добавляются в таблицу в потоковом режиме или в больших блоках. Записи остаются там, пока они не будут удалены из-за стоимости или потому, что они потеряли свое значение. Записи в противном случае никогда не обновляются.

Данные сущности иногда хранятся в таблицах фактов, где данные сущности изменяются медленно. Например, данные о какой-либо физической сущности, например о офисном оборудовании, которое редко изменяет расположение. Так как данные в Kusto неизменяемы, обычно каждая таблица содержит два столбца:

  • Столбец удостоверений,string определяющий сущность
  • Столбец метки времени последнего изменения (datetime)

Затем извлекается только последняя запись для каждого удостоверения сущности.

Таблицы измерений

Таблицы измерений:

  • Хранение ссылочных данных, таких как таблицы подстановки из идентификатора сущности к его свойствам
  • Хранение данных, таких как моментальные снимки в таблицах, все содержимое которых изменяется в одной транзакции

Таблицы измерений не регулярно приемируются с новыми данными. Вместо этого все содержимое данных обновляется одновременно с помощью таких операций, как set-or-replace, .move extents или .rename tables.

Иногда таблицы измерений могут быть производными от таблиц фактов. Этот процесс можно выполнить с помощью материализованного представления таблицы фактов с запросом к таблице, которая принимает последнюю запись для каждой сущности.

Дифференцировать таблицы фактов и измерений

Существуют процессы в Kusto, которые различают таблицы фактов и таблицы измерений. Одним из них является непрерывный экспорт.

Эти механизмы гарантированно обрабатывают данные в фактических таблицах точно один раз. Они полагаются на механизм курсора базы данных .

Например, каждое выполнение задания непрерывного экспорта экспортирует все записи, которые были приема с момента последнего обновления курсора базы данных. Задания непрерывного экспорта должны различать таблицы фактов и таблицы измерений. Таблицы фактов обрабатывают только недавно обработанные данные, а таблицы измерений используются в качестве подстановок. Таким образом, необходимо учитывать всю таблицу.

Нет способа пометить таблицу как "таблицу фактов" или "таблицу измерений". Способ приема данных в таблицу и способ использования таблицы — это то, что определяет его тип.