Поделиться через


Ссылка на таблицу учёта системы платного использования

В этой статье представлен обзор системной таблицы биллингового использования, включая структуру и примеры запросов. В системных таблицах данные о выставляемом по счету использовании вашей учетной записи централизованы и перенаправлены во все регионы, чтобы вы могли просматривать общую активность вашей учетной записи из любого региона, где находится ваша рабочая область.

Сведения об использовании этой таблицы для мониторинга затрат и примеров запросов см. в статье "Мониторинг затрат с помощью системных таблиц".

Путь к таблице: эта системная таблица расположена по адресу system.billing.usage.

Схема таблицы использования с выставлением счетов

В таблице системы использования с выставлением счетов используется следующая схема:

Имя столбца Тип данных Описание Пример
record_id строка Уникальный идентификатор для этой записи о использовании 11e22ba4-87b9-4cc2-9770-d10b894b7118
account_id строка Идентификатор учетной записи, для который был создан отчет 23e22ba4-87b9-4cc2-9770-d10b894b7118
workspace_id строка Идентификатор рабочей области, с которым было связано это использование 1234567890123456
sku_name строка Название SKU STANDARD_ALL_PURPOSE_COMPUTE
cloud строка Облако, связанное с этим использованием. Возможные значения: AWS, AZUREи GCP. AWS, AZURE или GCP
usage_start_time отметка времени Время начала, соответствующее этой записи использования. Сведения о часовом поясе записываются в конце значения с +00:00, представляющей часовой пояс UTC. 2023-01-09 10:00:00.000+00:00
usage_end_time отметка времени Время окончания, соответствующее этой записи об использовании. Сведения о часовом поясе записываются в конце значения с +00:00, представляющей часовой пояс UTC. 2023-01-09 11:00:00.000+00:00
usage_date Дата Дата записи об использовании, это поле можно использовать для ускорения агрегирования по дате. 2023-01-01
custom_tags карта Пользовательские теги, связанные с записью об использовании { “env”: “production” }
usage_unit строка Единица, в которой измеряется это использование DBU
usage_quantity десятичное число Количество единиц, потребляемых для этой записи 259.2958
usage_metadata Структура Предоставленные системой метаданные об использовании, включая идентификаторы для вычислительных ресурсов и заданий (если применимо). См. метаданные об использовании. См. метаданные об использовании
identity_metadata Структура Предоставленные системой метаданные об идентичностях, участвующих в процессе использования. См. сведения о метаданных удостоверений. См. метаданные удостоверений
record_type строка Указывает, является ли запись исходной, отменой или повтором. Значение равно ORIGINAL , если запись не связана с исправлением. См. раздел "Тип записи". ORIGINAL
ingestion_date Дата Дата приема записи в таблицу usage 2024-01-01
billing_origin_product строка Продукт, инициировавший использование. За некоторые продукты можно выставлять счета по разным номерам SKU. Возможные значения см. в разделе Product. JOBS
product_features Структура Сведения о конкретных возможностях продукта, используемых. См. сведения о функциях продукта. См . сведения о функциях продукта
usage_type строка Тип использования, который относится к продукту или рабочей нагрузке для целей выставления счетов. Возможные значения: COMPUTE_TIME, STORAGE_SPACE, NETWORK_BYTE, NETWORK_HOUR, API_OPERATION, TOKENили GPU_TIME. STORAGE_SPACE

Справочник по метаданным об использовании

Значения в usage_metadata представляют собой строки, которые сообщают вам об объектах и ресурсах рабочей области, участвующих в записи об использовании.

Только подмножество этих значений заполняется в любой заданной записи использования в зависимости от типа вычислений и используемых функций. Третий столбец в таблице показывает, какие типы использования вызывают заполнение каждого значения.

Значение Описание Заполнено для (в противном случае null)
cluster_id Идентификатор кластера, связанного с записью об использовании Несерверное использование вычислительных ресурсов, включая записные книжки, задания, Декларативные конвейеры Lakeflow и устаревшую модель обслуживания
job_id Идентификатор задания, связанного с записью об использовании Бессерверные задания и задания, выполняемые на вычислительных ресурсах для выполнения заданий (не заполняется для заданий, запускаемых на универсальных вычислительных ресурсах)
warehouse_id Идентификатор хранилища SQL, связанного с записью об использовании Рабочие нагрузки выполняются в хранилище SQL
instance_pool_id Идентификатор пула экземпляров, связанного с записью об использовании Использование бессерверных вычислений из пулов, включая записные книжки, задания, декларативные конвейеры Lakeflow и устаревшую модель обслуживания
node_type Тип экземпляра вычислительного ресурса Несерверное использование вычислительных ресурсов, включая записные книжки, задания, декларативные конвейеры Lakeflow и все хранилища SQL
job_run_id Идентификатор задания, выполнение которого связано с записью об использовании Бессерверные задания и задания, выполняемые на вычислительных ресурсах для выполнения заданий (не заполняется для заданий, запускаемых на универсальных вычислительных ресурсах)
notebook_id Идентификатор записной книжки, которая используется Бессерверные записные книжки
dlt_pipeline_id Идентификатор конвейера, связанного с записью об использовании Декларативные конвейеры Lakeflow и функции, использующие эти же деклараторные конвейеры, такие как материализованные представления, онлайн-таблицы, индексирование векторного поиска и Lakeflow Connect.
endpoint_name Имя конечной точки обслуживания модели или конечной точки поиска векторов, связанной с записью об использовании. Обслуживание моделей и векторный поиск
endpoint_id Идентификатор конечной точки обслуживания модели или конечной точки поиска по векторам, связанных с записью об использовании. Обслуживание моделей и векторный поиск
dlt_update_id Идентификатор обновления конвейера, связанного с записью об использовании Декларативные конвейеры Lakeflow и функции, использующие эти же деклараторные конвейеры, такие как материализованные представления, онлайн-таблицы, индексирование векторного поиска и Lakeflow Connect.
dlt_maintenance_id Идентификатор задач обслуживания конвейера, связанных с записью об использовании Декларативные конвейеры Lakeflow и функции, использующие эти же деклараторные конвейеры, такие как материализованные представления, онлайн-таблицы, индексирование векторного поиска и Lakeflow Connect.
metastore_id Это значение не заполняется в Azure Databricks Всегда null
run_name Уникальное пользовательское имя запуска дообучения базовой модели, связанного с записью об использовании Тонкая настройка модели Foundation
job_name Имя задания, связанного с записью об использовании Задания выполняются на бессерверных вычислениях
notebook_path Путь хранения в рабочем пространстве записной книжки, связанной с использованием Блокноты работают на бессерверных вычислениях
central_clean_room_id Идентификатор центрального чистого помещения, связанного с записью об использовании Чистые комнаты
source_region Регион рабочей области, связанный с её использованием. Возвращает значение только для бессерверного сетевого использования. Бессерверные сети
destination_region Область доступа к ресурсу. Возвращает значение только для бессерверного сетевого использования. Бессерверные сети
app_id Идентификатор приложения, связанного с записью об использовании Приложения Databricks
app_name Введенное пользователем имя приложения, связанного с записью об использовании Приложения Databricks
private_endpoint_name Имя применимой частной конечной точки, развернутой с бессерверным вычислением Бессерверные сети
budget_policy_id Идентификатор бессерверной политики бюджета, подключенной к рабочей нагрузке Бессерверное использование вычислительных ресурсов, включая записные книжки, задания, декларативные конвейеры Lakeflow и конечные точки обслуживания моделей

Справочник по метаданным идентичности

В столбце identity_metadata содержатся дополнительные сведения об идентификаторах, задействованных в использовании.

  • Поле run_as фиксирует, кто выполнял рабочую нагрузку. Эти значения заполняются только для определенных типов рабочих нагрузок, перечисленных в таблице ниже.
  • Поле owned_by применяется только к использованию хранилища SQL и регистрирует пользователя или субъекта-службы, который владеет хранилищем SQL, ответственным за использование.
  • Поле identity_metadata.created_by относится к Databricks Apps и регистрирует сообщение электронной почты пользователя, создавшего приложение.

идентификации для запуска от имени

Запись идентификатора в identity_metadata.run_as зависит от продукта, связанного с использованием. См. следующую таблицу поведения identity_metadata.run_as:

Тип рабочей нагрузки Идентичность run_as
Вычисления заданий Пользователь или субъект-служба, определенный в параметре run_as . По умолчанию задания выполняются от имени владельца задания, но администраторы могут изменить это на другого пользователя или учетную запись службы.
Бессерверные вычисления для заданий Пользователь или субъект-служба, определенный в параметре run_as . По умолчанию задания выполняются от имени владельца задания, но администраторы могут изменить это на другого пользователя или учетную запись службы.
Бессерверные вычисления для записных книжек Пользователь, выполняющий команды записной книжки (в частности, пользователь, создавший сеанс записной книжки). Для общих записных книжек это включает использование другими пользователями в рамках одного сеанса записной книжки.
Декларативные конвейеры Lakeflow Пользователь, разрешения которого используются для запуска конвейера. Это можно изменить, передав владение конвейером.
Тонкая настройка модели Foundation Пользователь или служебный принципал, инициировавший запуск обучения для тонкой настройки.
Прогнозная оптимизация Служебный объект, принадлежащий Databricks, который выполняет операции прогнозной оптимизации.
Мониторинг озерохранилища Пользователь, создавший монитор.

Ссылка на тип записи

Таблица billing.usage поддерживает исправления. Исправления возникают, когда любое поле записи об использовании неправильно и должно быть исправлено.

При исправлении Azure Databricks добавляет две новые записи в таблицу. Запись отзыва отрицает исходную неправильную запись, а затем запись перепрописи содержит исправленную информацию. Записи исправления определяются по полю record_type.

  • RETRACTION: используется для отмены исходного неправильного использования. Все поля идентичны ORIGINAL записи, кроме usage_quantity, отрицательного значения, которое отменяет исходное количество потребления. Например, если количество использования исходной записи было 259.4356, то запись аннулирования будет иметь количество использования -259.4356.
  • RESTATEMENT: запись, содержащая правильные поля и количество использования.

Например, следующий запрос возвращает правильное количество почасового использования, связанное с job_id, даже если были внесены исправления. Агрегируя количество использования, резервная запись устраняет исходную запись, и возвращаются только значения повторной записи.

SELECT
  usage_metadata.job_id, usage_start_time, usage_end_time,
  SUM(usage_quantity) as usage_quantity
FROM system.billing.usage
GROUP BY ALL
HAVING usage_quantity != 0

Примечание.

Для исправлений, где исходная запись об использовании не должна была быть сделана, исправление может добавлять только запись отзыва и не добавлять запись о повторной формулировке.

Справочник по ссылке на продукт-источник выставления счетов

Некоторые продукты Databricks оплачиваются по одному общему номенклатурному номеру SKU. Например, мониторинг Lakehouse, прогнозная оптимизация и бессерверные рабочие процессы оплачиваются по одному SKU для бессерверных заданий.

Чтобы отличить использование, столбцы billing_origin_product и product_features предоставляют дополнительные сведения о конкретном продукте и функциях, связанных с использованием.

В столбце billing_origin_product показан продукт Databricks, связанный с записью об использовании. К ним относятся следующие значения:

  • JOBS
  • DLT
  • SQL
  • ALL_PURPOSE
  • MODEL_SERVING
  • INTERACTIVE
  • DEFAULT_STORAGE
  • VECTOR_SEARCH
  • LAKEHOUSE_MONITORING
  • PREDICTIVE_OPTIMIZATION
  • ONLINE_TABLES
  • FOUNDATION_MODEL_TRAINING
  • AGENT_EVALUATION
  • FINE_GRAINED_ACCESS_CONTROL
  • NETWORKING. Затраты, связанные с подключением бессерверных вычислений к ресурсам через частные конечные точки. Для использования NETWORKING, workspace_id — это null, usage_unit — это hour, а networking.connectivity_type — это PRIVATE_IP.
  • APPS: затраты, связанные с созданием и запуском приложений Databricks

Справочник по функциям продукта

Столбец product_features — это объект, содержащий сведения о конкретных возможностях продукта, используемых и включающий следующие пары "ключ-значение".

  • jobs_tier: значения включают LIGHT, CLASSICили null
  • sql_tier: значения включают CLASSIC, PROили null
  • dlt_tier: значения включают CORE, PRO, ADVANCEDили null
  • is_serverless: значения включают true или falseили null
  • is_photon: значения включают true или falseили null
  • serving_type: значения включают MODEL, GPU_MODEL, FOUNDATION_MODEL, FEATUREили null
  • offering_type: значения включают BATCH_INFERENCE или null.
  • networking.connectivity_type: значения включают PUBLIC_IP и PRIVATE_IP