Примечание
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В этой статье представлен обзор системной таблицы биллингового использования, включая структуру и примеры запросов. В системных таблицах данные о выставляемом по счету использовании вашей учетной записи централизованы и перенаправлены во все регионы, чтобы вы могли просматривать общую активность вашей учетной записи из любого региона, где находится ваша рабочая область.
Сведения об использовании этой таблицы для мониторинга затрат и примеров запросов см. в статье "Мониторинг затрат с помощью системных таблиц".
Путь к таблице: эта системная таблица расположена по адресу system.billing.usage
.
Схема таблицы использования с выставлением счетов
В таблице системы использования с выставлением счетов используется следующая схема:
Имя столбца | Тип данных | Описание | Пример |
---|---|---|---|
record_id |
строка | Уникальный идентификатор для этой записи о использовании | 11e22ba4-87b9-4cc2-9770-d10b894b7118 |
account_id |
строка | Идентификатор учетной записи, для который был создан отчет | 23e22ba4-87b9-4cc2-9770-d10b894b7118 |
workspace_id |
строка | Идентификатор рабочей области, с которым было связано это использование | 1234567890123456 |
sku_name |
строка | Название SKU | STANDARD_ALL_PURPOSE_COMPUTE |
cloud |
строка | Облако, связанное с этим использованием. Возможные значения: AWS , AZURE и GCP . |
AWS , AZURE или GCP |
usage_start_time |
отметка времени | Время начала, соответствующее этой записи использования. Сведения о часовом поясе записываются в конце значения с +00:00 , представляющей часовой пояс UTC. |
2023-01-09 10:00:00.000+00:00 |
usage_end_time |
отметка времени | Время окончания, соответствующее этой записи об использовании. Сведения о часовом поясе записываются в конце значения с +00:00 , представляющей часовой пояс UTC. |
2023-01-09 11:00:00.000+00:00 |
usage_date |
Дата | Дата записи об использовании, это поле можно использовать для ускорения агрегирования по дате. | 2023-01-01 |
custom_tags |
карта | Пользовательские теги, связанные с записью об использовании | { “env”: “production” } |
usage_unit |
строка | Единица, в которой измеряется это использование | DBU |
usage_quantity |
десятичное число | Количество единиц, потребляемых для этой записи | 259.2958 |
usage_metadata |
Структура | Предоставленные системой метаданные об использовании, включая идентификаторы для вычислительных ресурсов и заданий (если применимо). См. метаданные об использовании. | См. метаданные об использовании |
identity_metadata |
Структура | Предоставленные системой метаданные об идентичностях, участвующих в процессе использования. См. сведения о метаданных удостоверений. | См. метаданные удостоверений |
record_type |
строка | Указывает, является ли запись исходной, отменой или повтором. Значение равно ORIGINAL , если запись не связана с исправлением. См. раздел "Тип записи". |
ORIGINAL |
ingestion_date |
Дата | Дата приема записи в таблицу usage |
2024-01-01 |
billing_origin_product |
строка | Продукт, инициировавший использование. За некоторые продукты можно выставлять счета по разным номерам SKU. Возможные значения см. в разделе Product. | JOBS |
product_features |
Структура | Сведения о конкретных возможностях продукта, используемых. См. сведения о функциях продукта. | См . сведения о функциях продукта |
usage_type |
строка | Тип использования, который относится к продукту или рабочей нагрузке для целей выставления счетов. Возможные значения: COMPUTE_TIME , STORAGE_SPACE , NETWORK_BYTE , NETWORK_HOUR , API_OPERATION , TOKEN или GPU_TIME . |
STORAGE_SPACE |
Справочник по метаданным об использовании
Значения в usage_metadata
представляют собой строки, которые сообщают вам об объектах и ресурсах рабочей области, участвующих в записи об использовании.
Только подмножество этих значений заполняется в любой заданной записи использования в зависимости от типа вычислений и используемых функций. Третий столбец в таблице показывает, какие типы использования вызывают заполнение каждого значения.
Значение | Описание | Заполнено для (в противном случае null ) |
---|---|---|
cluster_id |
Идентификатор кластера, связанного с записью об использовании | Несерверное использование вычислительных ресурсов, включая записные книжки, задания, Декларативные конвейеры Lakeflow и устаревшую модель обслуживания |
job_id |
Идентификатор задания, связанного с записью об использовании | Бессерверные задания и задания, выполняемые на вычислительных ресурсах для выполнения заданий (не заполняется для заданий, запускаемых на универсальных вычислительных ресурсах) |
warehouse_id |
Идентификатор хранилища SQL, связанного с записью об использовании | Рабочие нагрузки выполняются в хранилище SQL |
instance_pool_id |
Идентификатор пула экземпляров, связанного с записью об использовании | Использование бессерверных вычислений из пулов, включая записные книжки, задания, декларативные конвейеры Lakeflow и устаревшую модель обслуживания |
node_type |
Тип экземпляра вычислительного ресурса | Несерверное использование вычислительных ресурсов, включая записные книжки, задания, декларативные конвейеры Lakeflow и все хранилища SQL |
job_run_id |
Идентификатор задания, выполнение которого связано с записью об использовании | Бессерверные задания и задания, выполняемые на вычислительных ресурсах для выполнения заданий (не заполняется для заданий, запускаемых на универсальных вычислительных ресурсах) |
notebook_id |
Идентификатор записной книжки, которая используется | Бессерверные записные книжки |
dlt_pipeline_id |
Идентификатор конвейера, связанного с записью об использовании | Декларативные конвейеры Lakeflow и функции, использующие эти же деклараторные конвейеры, такие как материализованные представления, онлайн-таблицы, индексирование векторного поиска и Lakeflow Connect. |
endpoint_name |
Имя конечной точки обслуживания модели или конечной точки поиска векторов, связанной с записью об использовании. | Обслуживание моделей и векторный поиск |
endpoint_id |
Идентификатор конечной точки обслуживания модели или конечной точки поиска по векторам, связанных с записью об использовании. | Обслуживание моделей и векторный поиск |
dlt_update_id |
Идентификатор обновления конвейера, связанного с записью об использовании | Декларативные конвейеры Lakeflow и функции, использующие эти же деклараторные конвейеры, такие как материализованные представления, онлайн-таблицы, индексирование векторного поиска и Lakeflow Connect. |
dlt_maintenance_id |
Идентификатор задач обслуживания конвейера, связанных с записью об использовании | Декларативные конвейеры Lakeflow и функции, использующие эти же деклараторные конвейеры, такие как материализованные представления, онлайн-таблицы, индексирование векторного поиска и Lakeflow Connect. |
metastore_id |
Это значение не заполняется в Azure Databricks | Всегда null |
run_name |
Уникальное пользовательское имя запуска дообучения базовой модели, связанного с записью об использовании | Тонкая настройка модели Foundation |
job_name |
Имя задания, связанного с записью об использовании | Задания выполняются на бессерверных вычислениях |
notebook_path |
Путь хранения в рабочем пространстве записной книжки, связанной с использованием | Блокноты работают на бессерверных вычислениях |
central_clean_room_id |
Идентификатор центрального чистого помещения, связанного с записью об использовании | Чистые комнаты |
source_region |
Регион рабочей области, связанный с её использованием. Возвращает значение только для бессерверного сетевого использования. | Бессерверные сети |
destination_region |
Область доступа к ресурсу. Возвращает значение только для бессерверного сетевого использования. | Бессерверные сети |
app_id |
Идентификатор приложения, связанного с записью об использовании | Приложения Databricks |
app_name |
Введенное пользователем имя приложения, связанного с записью об использовании | Приложения Databricks |
private_endpoint_name |
Имя применимой частной конечной точки, развернутой с бессерверным вычислением | Бессерверные сети |
budget_policy_id |
Идентификатор бессерверной политики бюджета, подключенной к рабочей нагрузке | Бессерверное использование вычислительных ресурсов, включая записные книжки, задания, декларативные конвейеры Lakeflow и конечные точки обслуживания моделей |
Справочник по метаданным идентичности
В столбце identity_metadata
содержатся дополнительные сведения об идентификаторах, задействованных в использовании.
- Поле
run_as
фиксирует, кто выполнял рабочую нагрузку. Эти значения заполняются только для определенных типов рабочих нагрузок, перечисленных в таблице ниже. - Поле
owned_by
применяется только к использованию хранилища SQL и регистрирует пользователя или субъекта-службы, который владеет хранилищем SQL, ответственным за использование.
- Поле
identity_metadata.created_by
относится к Databricks Apps и регистрирует сообщение электронной почты пользователя, создавшего приложение.
идентификации для запуска от имени
Запись идентификатора в identity_metadata.run_as
зависит от продукта, связанного с использованием. См. следующую таблицу поведения identity_metadata.run_as
:
Тип рабочей нагрузки | Идентичность run_as |
---|---|
Вычисления заданий | Пользователь или субъект-служба, определенный в параметре run_as . По умолчанию задания выполняются от имени владельца задания, но администраторы могут изменить это на другого пользователя или учетную запись службы. |
Бессерверные вычисления для заданий | Пользователь или субъект-служба, определенный в параметре run_as . По умолчанию задания выполняются от имени владельца задания, но администраторы могут изменить это на другого пользователя или учетную запись службы. |
Бессерверные вычисления для записных книжек | Пользователь, выполняющий команды записной книжки (в частности, пользователь, создавший сеанс записной книжки). Для общих записных книжек это включает использование другими пользователями в рамках одного сеанса записной книжки. |
Декларативные конвейеры Lakeflow | Пользователь, разрешения которого используются для запуска конвейера. Это можно изменить, передав владение конвейером. |
Тонкая настройка модели Foundation | Пользователь или служебный принципал, инициировавший запуск обучения для тонкой настройки. |
Прогнозная оптимизация | Служебный объект, принадлежащий Databricks, который выполняет операции прогнозной оптимизации. |
Мониторинг озерохранилища | Пользователь, создавший монитор. |
Ссылка на тип записи
Таблица billing.usage
поддерживает исправления. Исправления возникают, когда любое поле записи об использовании неправильно и должно быть исправлено.
При исправлении Azure Databricks добавляет две новые записи в таблицу. Запись отзыва отрицает исходную неправильную запись, а затем запись перепрописи содержит исправленную информацию. Записи исправления определяются по полю record_type
.
-
RETRACTION
: используется для отмены исходного неправильного использования. Все поля идентичныORIGINAL
записи, кромеusage_quantity
, отрицательного значения, которое отменяет исходное количество потребления. Например, если количество использования исходной записи было259.4356
, то запись аннулирования будет иметь количество использования-259.4356
. -
RESTATEMENT
: запись, содержащая правильные поля и количество использования.
Например, следующий запрос возвращает правильное количество почасового использования, связанное с job_id
, даже если были внесены исправления. Агрегируя количество использования, резервная запись устраняет исходную запись, и возвращаются только значения повторной записи.
SELECT
usage_metadata.job_id, usage_start_time, usage_end_time,
SUM(usage_quantity) as usage_quantity
FROM system.billing.usage
GROUP BY ALL
HAVING usage_quantity != 0
Примечание.
Для исправлений, где исходная запись об использовании не должна была быть сделана, исправление может добавлять только запись отзыва и не добавлять запись о повторной формулировке.
Справочник по ссылке на продукт-источник выставления счетов
Некоторые продукты Databricks оплачиваются по одному общему номенклатурному номеру SKU. Например, мониторинг Lakehouse, прогнозная оптимизация и бессерверные рабочие процессы оплачиваются по одному SKU для бессерверных заданий.
Чтобы отличить использование, столбцы billing_origin_product
и product_features
предоставляют дополнительные сведения о конкретном продукте и функциях, связанных с использованием.
В столбце billing_origin_product
показан продукт Databricks, связанный с записью об использовании. К ним относятся следующие значения:
JOBS
DLT
SQL
ALL_PURPOSE
MODEL_SERVING
INTERACTIVE
DEFAULT_STORAGE
VECTOR_SEARCH
LAKEHOUSE_MONITORING
PREDICTIVE_OPTIMIZATION
ONLINE_TABLES
FOUNDATION_MODEL_TRAINING
AGENT_EVALUATION
FINE_GRAINED_ACCESS_CONTROL
-
NETWORKING
. Затраты, связанные с подключением бессерверных вычислений к ресурсам через частные конечные точки. Для использованияNETWORKING
,workspace_id
— этоnull
,usage_unit
— этоhour
, аnetworking.connectivity_type
— этоPRIVATE_IP
. -
APPS
: затраты, связанные с созданием и запуском приложений Databricks
Справочник по функциям продукта
Столбец product_features
— это объект, содержащий сведения о конкретных возможностях продукта, используемых и включающий следующие пары "ключ-значение".
-
jobs_tier
: значения включаютLIGHT
,CLASSIC
илиnull
-
sql_tier
: значения включаютCLASSIC
,PRO
илиnull
-
dlt_tier
: значения включаютCORE
,PRO
,ADVANCED
илиnull
-
is_serverless
: значения включаютtrue
илиfalse
илиnull
-
is_photon
: значения включаютtrue
илиfalse
илиnull
-
serving_type
: значения включаютMODEL
,GPU_MODEL
,FOUNDATION_MODEL
,FEATURE
илиnull
-
offering_type
: значения включаютBATCH_INFERENCE
илиnull
.
-
networking.connectivity_type
: значения включаютPUBLIC_IP
иPRIVATE_IP