Ссылка на таблицу учёта системы платного использования

2025-06-11

В этой статье представлен обзор системной таблицы биллингового использования, включая структуру и примеры запросов. В системных таблицах данные о выставляемом по счету использовании вашей учетной записи централизованы и перенаправлены во все регионы, чтобы вы могли просматривать общую активность вашей учетной записи из любого региона, где находится ваша рабочая область.

Сведения об использовании этой таблицы для мониторинга затрат и примеров запросов см. в статье "Мониторинг затрат с помощью системных таблиц".

Путь к таблице: эта системная таблица расположена по адресу system.billing.usage.

Схема таблицы использования с выставлением счетов

В таблице системы использования с выставлением счетов используется следующая схема:

Имя столбца	Тип данных	Описание	Пример
`record_id`	строка	Уникальный идентификатор для этой записи о использовании	`11e22ba4-87b9-4cc2-9770-d10b894b7118`
`account_id`	строка	Идентификатор учетной записи, для который был создан отчет	`23e22ba4-87b9-4cc2-9770-d10b894b7118`
`workspace_id`	строка	Идентификатор рабочей области, с которым было связано это использование	`1234567890123456`
`sku_name`	строка	Название SKU	`STANDARD_ALL_PURPOSE_COMPUTE`
`cloud`	строка	Облако, связанное с этим использованием. Возможные значения: `AWS`, `AZURE`и `GCP`.	`AWS`, `AZURE` или `GCP`
`usage_start_time`	отметка времени	Время начала, соответствующее этой записи использования. Сведения о часовом поясе записываются в конце значения с `+00:00`, представляющей часовой пояс UTC.	`2023-01-09 10:00:00.000+00:00`
`usage_end_time`	отметка времени	Время окончания, соответствующее этой записи об использовании. Сведения о часовом поясе записываются в конце значения с `+00:00`, представляющей часовой пояс UTC.	`2023-01-09 11:00:00.000+00:00`
`usage_date`	Дата	Дата записи об использовании, это поле можно использовать для ускорения агрегирования по дате.	`2023-01-01`
`custom_tags`	карта	Пользовательские теги, связанные с записью об использовании	`{ “env”: “production” }`
`usage_unit`	строка	Единица, в которой измеряется это использование	`DBU`
`usage_quantity`	десятичное число	Количество единиц, потребляемых для этой записи	`259.2958`
`usage_metadata`	Структура	Предоставленные системой метаданные об использовании, включая идентификаторы для вычислительных ресурсов и заданий (если применимо). См. метаданные об использовании.	См. метаданные об использовании
`identity_metadata`	Структура	Предоставленные системой метаданные об идентичностях, участвующих в процессе использования. См. сведения о метаданных удостоверений.	См. метаданные удостоверений
`record_type`	строка	Указывает, является ли запись исходной, отменой или повтором. Значение равно `ORIGINAL` , если запись не связана с исправлением. См. раздел "Тип записи".	`ORIGINAL`
`ingestion_date`	Дата	Дата приема записи в таблицу `usage`	`2024-01-01`
`billing_origin_product`	строка	Продукт, инициировавший использование. За некоторые продукты можно выставлять счета по разным номерам SKU. Возможные значения см. в разделе Product.	`JOBS`
`product_features`	Структура	Сведения о конкретных возможностях продукта, используемых. См. сведения о функциях продукта.	См . сведения о функциях продукта
`usage_type`	строка	Тип использования, который относится к продукту или рабочей нагрузке для целей выставления счетов. Возможные значения: `COMPUTE_TIME`, `STORAGE_SPACE`, `NETWORK_BYTE`, `NETWORK_HOUR`, `API_OPERATION`, `TOKEN`или `GPU_TIME`.	`STORAGE_SPACE`

Справочник по метаданным об использовании

Значения в usage_metadata представляют собой строки, которые сообщают вам об объектах и ресурсах рабочей области, участвующих в записи об использовании.

Только подмножество этих значений заполняется в любой заданной записи использования в зависимости от типа вычислений и используемых функций. Третий столбец в таблице показывает, какие типы использования вызывают заполнение каждого значения.

Значение	Описание	Заполнено для (в противном случае `null`)
`cluster_id`	Идентификатор кластера, связанного с записью об использовании	Несерверное использование вычислительных ресурсов, включая записные книжки, задания, Декларативные конвейеры Lakeflow и устаревшую модель обслуживания
`job_id`	Идентификатор задания, связанного с записью об использовании	Бессерверные задания и задания, выполняемые на вычислительных ресурсах для выполнения заданий (не заполняется для заданий, запускаемых на универсальных вычислительных ресурсах)
`warehouse_id`	Идентификатор хранилища SQL, связанного с записью об использовании	Рабочие нагрузки выполняются в хранилище SQL
`instance_pool_id`	Идентификатор пула экземпляров, связанного с записью об использовании	Использование бессерверных вычислений из пулов, включая записные книжки, задания, декларативные конвейеры Lakeflow и устаревшую модель обслуживания
`node_type`	Тип экземпляра вычислительного ресурса	Несерверное использование вычислительных ресурсов, включая записные книжки, задания, декларативные конвейеры Lakeflow и все хранилища SQL
`job_run_id`	Идентификатор задания, выполнение которого связано с записью об использовании	Бессерверные задания и задания, выполняемые на вычислительных ресурсах для выполнения заданий (не заполняется для заданий, запускаемых на универсальных вычислительных ресурсах)
`notebook_id`	Идентификатор записной книжки, которая используется	Бессерверные записные книжки
`dlt_pipeline_id`	Идентификатор конвейера, связанного с записью об использовании	Декларативные конвейеры Lakeflow и функции, использующие эти же деклараторные конвейеры, такие как материализованные представления, онлайн-таблицы, индексирование векторного поиска и Lakeflow Connect.
`endpoint_name`	Имя конечной точки обслуживания модели или конечной точки поиска векторов, связанной с записью об использовании.	Обслуживание моделей и векторный поиск
`endpoint_id`	Идентификатор конечной точки обслуживания модели или конечной точки поиска по векторам, связанных с записью об использовании.	Обслуживание моделей и векторный поиск
`dlt_update_id`	Идентификатор обновления конвейера, связанного с записью об использовании	Декларативные конвейеры Lakeflow и функции, использующие эти же деклараторные конвейеры, такие как материализованные представления, онлайн-таблицы, индексирование векторного поиска и Lakeflow Connect.
`dlt_maintenance_id`	Идентификатор задач обслуживания конвейера, связанных с записью об использовании	Декларативные конвейеры Lakeflow и функции, использующие эти же деклараторные конвейеры, такие как материализованные представления, онлайн-таблицы, индексирование векторного поиска и Lakeflow Connect.
`metastore_id`	Это значение не заполняется в Azure Databricks	Всегда `null`
`run_name`	Уникальное пользовательское имя запуска дообучения базовой модели, связанного с записью об использовании	Тонкая настройка модели Foundation
`job_name`	Имя задания, связанного с записью об использовании	Задания выполняются на бессерверных вычислениях
`notebook_path`	Путь хранения в рабочем пространстве записной книжки, связанной с использованием	Блокноты работают на бессерверных вычислениях
`central_clean_room_id`	Идентификатор центрального чистого помещения, связанного с записью об использовании	Чистые комнаты
`source_region`	Регион рабочей области, связанный с её использованием. Возвращает значение только для бессерверного сетевого использования.	Бессерверные сети
`destination_region`	Область доступа к ресурсу. Возвращает значение только для бессерверного сетевого использования.	Бессерверные сети
`app_id`	Идентификатор приложения, связанного с записью об использовании	Приложения Databricks
`app_name`	Введенное пользователем имя приложения, связанного с записью об использовании	Приложения Databricks
`private_endpoint_name`	Имя применимой частной конечной точки, развернутой с бессерверным вычислением	Бессерверные сети
`budget_policy_id`	Идентификатор бессерверной политики бюджета, подключенной к рабочей нагрузке	Бессерверное использование вычислительных ресурсов, включая записные книжки, задания, декларативные конвейеры Lakeflow и конечные точки обслуживания моделей

Справочник по метаданным идентичности

В столбце identity_metadata содержатся дополнительные сведения об идентификаторах, задействованных в использовании.

Поле run_as фиксирует, кто выполнял рабочую нагрузку. Эти значения заполняются только для определенных типов рабочих нагрузок, перечисленных в таблице ниже.
Поле owned_by применяется только к использованию хранилища SQL и регистрирует пользователя или субъекта-службы, который владеет хранилищем SQL, ответственным за использование.

Поле identity_metadata.created_by относится к Databricks Apps и регистрирует сообщение электронной почты пользователя, создавшего приложение.

идентификации для запуска от имени

Запись идентификатора в identity_metadata.run_as зависит от продукта, связанного с использованием. См. следующую таблицу поведения identity_metadata.run_as:

Тип рабочей нагрузки	Идентичность `run_as`
Вычисления заданий	Пользователь или субъект-служба, определенный в параметре `run_as` . По умолчанию задания выполняются от имени владельца задания, но администраторы могут изменить это на другого пользователя или учетную запись службы.
Бессерверные вычисления для заданий	Пользователь или субъект-служба, определенный в параметре `run_as` . По умолчанию задания выполняются от имени владельца задания, но администраторы могут изменить это на другого пользователя или учетную запись службы.
Бессерверные вычисления для записных книжек	Пользователь, выполняющий команды записной книжки (в частности, пользователь, создавший сеанс записной книжки). Для общих записных книжек это включает использование другими пользователями в рамках одного сеанса записной книжки.
Декларативные конвейеры Lakeflow	Пользователь, разрешения которого используются для запуска конвейера. Это можно изменить, передав владение конвейером.
Тонкая настройка модели Foundation	Пользователь или служебный принципал, инициировавший запуск обучения для тонкой настройки.
Прогнозная оптимизация	Служебный объект, принадлежащий Databricks, который выполняет операции прогнозной оптимизации.
Мониторинг озерохранилища	Пользователь, создавший монитор.

Ссылка на тип записи

Таблица billing.usage поддерживает исправления. Исправления возникают, когда любое поле записи об использовании неправильно и должно быть исправлено.

При исправлении Azure Databricks добавляет две новые записи в таблицу. Запись отзыва отрицает исходную неправильную запись, а затем запись перепрописи содержит исправленную информацию. Записи исправления определяются по полю record_type.

RETRACTION: используется для отмены исходного неправильного использования. Все поля идентичны ORIGINAL записи, кроме usage_quantity, отрицательного значения, которое отменяет исходное количество потребления. Например, если количество использования исходной записи было 259.4356, то запись аннулирования будет иметь количество использования -259.4356.
RESTATEMENT: запись, содержащая правильные поля и количество использования.

Например, следующий запрос возвращает правильное количество почасового использования, связанное с job_id, даже если были внесены исправления. Агрегируя количество использования, резервная запись устраняет исходную запись, и возвращаются только значения повторной записи.

SELECT
  usage_metadata.job_id, usage_start_time, usage_end_time,
  SUM(usage_quantity) as usage_quantity
FROM system.billing.usage
GROUP BY ALL
HAVING usage_quantity != 0

Примечание.

Для исправлений, где исходная запись об использовании не должна была быть сделана, исправление может добавлять только запись отзыва и не добавлять запись о повторной формулировке.

Справочник по ссылке на продукт-источник выставления счетов

Некоторые продукты Databricks оплачиваются по одному общему номенклатурному номеру SKU. Например, мониторинг Lakehouse, прогнозная оптимизация и бессерверные рабочие процессы оплачиваются по одному SKU для бессерверных заданий.

Чтобы отличить использование, столбцы billing_origin_product и product_features предоставляют дополнительные сведения о конкретном продукте и функциях, связанных с использованием.

В столбце billing_origin_product показан продукт Databricks, связанный с записью об использовании. К ним относятся следующие значения:

JOBS
DLT
SQL
ALL_PURPOSE
MODEL_SERVING
INTERACTIVE
DEFAULT_STORAGE
VECTOR_SEARCH
LAKEHOUSE_MONITORING
PREDICTIVE_OPTIMIZATION
ONLINE_TABLES
FOUNDATION_MODEL_TRAINING
AGENT_EVALUATION
FINE_GRAINED_ACCESS_CONTROL

NETWORKING. Затраты, связанные с подключением бессерверных вычислений к ресурсам через частные конечные точки. Для использования NETWORKING, workspace_id — это null, usage_unit — это hour, а networking.connectivity_type — это PRIVATE_IP.
APPS: затраты, связанные с созданием и запуском приложений Databricks

Справочник по функциям продукта

Столбец product_features — это объект, содержащий сведения о конкретных возможностях продукта, используемых и включающий следующие пары "ключ-значение".

jobs_tier: значения включают LIGHT, CLASSICили null
sql_tier: значения включают CLASSIC, PROили null
dlt_tier: значения включают CORE, PRO, ADVANCEDили null
is_serverless: значения включают true или falseили null
is_photon: значения включают true или falseили null
serving_type: значения включают MODEL, GPU_MODEL, FOUNDATION_MODEL, FEATUREили null
offering_type: значения включают BATCH_INFERENCE или null.

networking.connectivity_type: значения включают PUBLIC_IP и PRIVATE_IP