Запрос представлений метрик из средств бизнес-аналитики

Это важно

Эта функция доступна в бета-версии.

Режим совместимости бизнес-аналитики позволяет запрашивать представления метрик каталога Unity из внешних средств бизнес-аналитики. При включении Azure Databricks перезаписывает запросы, созданные средством бизнес-аналитики, чтобы правильно оценить меры представления метрик.

На этой странице описывается, как включить режим совместимости бизнес-аналитики, его работу, поддерживаемые сценарии и известные ограничения.

Требования

Предупреждение

Microsoft удалил режим совместимости BI, который позволяет запрашивать представления метрик каталога Unity в Power BI из соединителя Power BI на Azure Databricks. Отчеты, использующие этот параметр соединителя, больше не работают. Чтобы запросить восстановление поддержки представлений метрик Azure Databricks в Power BI, проголосуйте и оставьте отзыв о посту сообщества Fabric "Идеи". В качестве альтернативы Power BI рассмотрим панели мониторинга Azure Databricks AI/BI, которые изначально работают с представлениями метрик.

  • Кластер, работающий под управлением Databricks Runtime 18.0 или более поздней версии.
  • Средство бизнес-аналитики, которое поддерживает сквозные подключения SQL или DirectQuery к Azure Databricks.
  • Возможность запуска конфигурации SQL на уровне сеанса в средстве бизнес-аналитики (например, с помощью начального скрипта SQL или команды запуска).

Включение режима совместимости бизнес-аналитики

Включите режим совместимости бизнес-аналитики, выполнив следующую команду конфигурации SQL в начале сеанса:

SET spark.databricks.sql.metricView.bi.compatibilityMode.enabled = true;

Настройка конфигурации зависит от средства бизнес-аналитики. Например, в Tableau можно использовать поле Initial SQL в диалоговом окне подключения.

Режим совместимости бизнес-аналитики применяется только к сеансу, в котором он задан. Каждое новое подключение должно снова задать конфигурацию.

Режим DirectQuery

Для режима совместимости бизнес-аналитики требуется, чтобы запросы выполнялись в подсистеме SQL Azure Databricks. Если средство бизнес-аналитики предлагает режимы импорта и прямого запроса, используйте прямой запрос (или динамическое подключение), чтобы запросы проходили в Azure Databricks где может применяться механизм перезаписи.

Как работает режим совместимости бизнес-аналитики

Представления метрик отображаются как обычные таблицы в средствах бизнес-аналитики. Если включен режим совместимости бизнес-аналитики, Azure Databricks перезаписывает запросы, созданные средством бизнес-аналитики, чтобы правильно запрашивать представление метрик.

Режим совместимости бизнес-аналитики автоматически обрабатывает два типа запросов:

  • Запросы агрегирования: когда средство бизнес-аналитики создает запрос со стандартными функциями агрегирования (например SUM, для мер), режим совместимости бизнес-аналитики перезаписывает эти агрегаты, чтобы соответствовать определениям мер в представлении метрик. Всегда используйте SUM в качестве типа агрегирования для столбцов мер. Подсистема SQL всегда применяет правильную логику базовой меры.
  • Предварительный просмотр данных и обнаружение схемы. Если средство бизнес-аналитики запрашивает не агрегированные данные (например, предварительные просмотры столбцов или примеры данных), столбцы мер возвращают значения NULL вместо ошибки. Столбцы измерения обычно возвращают значения.

Поддерживаемые сценарии

Следующие функции средства бизнес-аналитики работают для большинства средств бизнес-аналитики при включении режима совместимости бизнес-аналитики.

Сценарий Описание
Базовая визуализация измерений Используйте меру в поле диаграммы или табличного значения для отображения агрегированных результатов.
Фильтры Примените фильтры к столбцам измерения или меры в ваших визуализациях.
Срезы измерений Используйте столбцы измерения в качестве элементов управления срезом или фильтром.
Перекрестная фильтрация Щелкните значение в одном визуальном элементе, чтобы отфильтровать связанные визуальные элементы на одной странице.
Детализация Переход на страницу с подробностями, отфильтрованную по определённому значению.
Фильтрация TopN Отображение верхних или нижних значений N, ранжированных по столбцу.
Предварительный просмотр данных Используйте предварительную версию данных и обнаружение схем. Меры отображаются как null в предварительных версиях.
Визуальные вычисления Клиентские вычисления применяются к уже агрегированным результатам (например, нарастающие итоги и ранжирование).

Измерения и меры

Представления метрик содержат два типа столбцов: меры и измерения. Понимание разницы важно при создании отчетов.

  • Меры: логика агрегирования меры определяется в представлении метрик (например, SUM(price * quantity) или COUNT(DISTINCT customer_id)). В средстве бизнес-аналитики всегда оставьте агрегирование для SUM столбцов мер. Подсистема SQL автоматически применяет правильную логику измерения. Если вам нужно другое агрегирование, измените определение метрики в самом представлении метрик. Не изменяйте агрегирование на стороне средства бизнес-аналитики.
  • Измерения: измерения ведут себя как обычные столбцы таблицы. Вы можете применять любые стандартные операции бизнес-аналитики к измерениям, включая агрегирование, группировку, фильтрацию, сортировку и сегментирование. Если числовое поле выступает в качестве измерения (а не мера), все стандартные типы агрегирования работают обычно в этом поле.

Лучшие практики

  • Всегда включать одно представление метрик в набор данных. Метрическое представление — это ваше семантическое определение.
  • Создайте папки для упорядочения столбцов измерений (например, папка Date для каждого столбца измерения из измерения Date).
  • Переименуйте размеры, чтобы они получили понятные имена.
  • Измените числовые столбцы измерения на тип суммирования без агрегирования.
  • Создайте обертки для мер, с использованием SUM() для каждого столбца измерений, и скройте исходные столбцы измерений (например, Total Sales = SUM('Store Sales'[total_sales])).
  • Упорядочьте меры в выделенной папке.
  • Используйте только вспомогательные меры в визуальных элементах.

Ограничения

Режим совместимости бизнес-аналитики имеет ограниченный контроль над тем, как средства бизнес-аналитики создают и обрабатывают запросы. Применяются следующие ограничения.

Используйте только СУММ для агрегирования мер

Всегда оставляйте тип агрегирования для SUM столбцов измерения. Все функции агрегирования (SUM, , COUNTMIN, MAX) перезаписываются в определение базовой меры, поэтому все они возвращают один и тот же результат. Выбор другого типа агрегирования может привести к неожиданному поведению:

  • AVG показывает 1.0, потому что некоторые средства бизнес-аналитики вычисляют AVG как SUM / COUNT внутренним образом, и оба возвращают одно и то же значение меры.
  • Count (Distinct), Standard Deviation, Variance и Median создают шаблоны запросов, несовместимые с механизмом перезаписи и создают ошибки или неверные результаты.

Если вам нужна другая агрегация, измените определение этой меры в метрическом представлении. Все типы агрегирования полностью поддерживаются в определениях представления метрик.

Общие итоги для не-аддитивных мер

Некоторые средства бизнес-аналитики вычисляют большие итоги путем повторного объединения значений на стороне клиента, а не выдачи отдельного запроса. Это дает правильные результаты для аддитивных мер (например, SUM(revenue)), так как повторная агрегация локально дает правильный ответ.

Однако для недитивных мер (например, SUM(revenue) / COUNT(DISTINCT customer)или любого соотношения, процента или выражения DISTINCT), общие итоги могут отображать неправильные значения, так как суммирование предварительно группированных коэффициентов не эквивалентно вычислению соотношения по полному набору данных.

Количественные фильтры по измеряемым столбцам

Срез числового диапазона в столбце показателей может не функционировать как ожидалось. Некоторые средства бизнес-аналитики могут запрашивать как MIN, так и MAX измерения, чтобы определить диапазон ползунка, но оба значения переписываются на одно и то же базовое значение меры, что сокращает диапазон до одной точки. Фильтры для показателей по-прежнему работают. Затронуты только срезы диапазона.

Меры нельзя использовать в качестве категориальных или мерных значений

Если столбец мер используется в качестве категориального значения (например, как ось, условные обозначения или срез), запрос завершается сбоем и возвращает следующую ошибку:

Measure columns cannot be used in GROUP BY clause or as categorical values. We recommend wrapping them with an aggregate function such as SUM() for the expected behavior.

Вычисляемые поля с несколькими измерениями

Вычисляемые поля, ссылающиеся на одну меру, работают правильно. Некоторые средства бизнес-аналитики сначала извлекает агрегированный результат, а затем выполняют вычисление на стороне клиента (например, сегментирование доходов в низких, средних и высоких категориях).

Однако выражения, которые объединяют несколько столбцов мер внутри одной статистической суммы (например, SUM(m1 + m2)) не перезаписываются режимом совместимости бизнес-аналитики и создают ошибки или непредвиденные результаты.

Присоединение представлений метрик к другим таблицам

Невозможно объединить представления метрик с другими таблицами в средстве бизнес-аналитики. Если необходимо объединить данные из представления метрик с другой таблицей, включите соединение в само определение представления метрик.

Материализованные представления метрик

Режим совместимости бизнес-аналитики не поддерживает представления метрик с материализациями, и они могут привести к непредвиденным результатам.

Дополнительные ресурсы