Поделиться через


Сценарий ценообразования с помощью конвейера для загрузки 1 ТБ данных Parquet в таблицу Lakehouse

В этом сценарии операция копирования использовалась в конвейере для загрузки 1 ТБ данных Parquet, хранящихся в Azure Data Lake Storage (ADLS) Gen2 в таблицу Lakehouse в Microsoft Fabric.

Цены, используемые в следующем примере, являются гипотетическими и не намерены подразумевать точные фактические цены. Это просто для демонстрации того, как можно оценить, спланировать и управлять затратами на проекты Фабрики данных в Microsoft Fabric. Кроме того, так как возможности Fabric имеют уникальную цену в разных регионах, мы используем модель оплаты по факту использования для возможностей Fabric в регионе US West 2 (типичный регион Azure) по цене 0,18 долл. США за CU в час. Ознакомьтесь здесь с разделом Microsoft Fabric — Цены, чтобы изучить другие варианты ценообразования на ресурсы Fabric.

Конфигурация

Чтобы выполнить этот сценарий, необходимо создать конвейер со следующей конфигурацией:

снимок экрана, показывающий настройку потока, копирующего данные CSV в таблицу Lakehouse.

Оценка затрат с помощью приложения метрик Fabric

Снимок экрана с длительностью и потреблением CU задания в приложении Fabric Metrics.

Операция перемещения данных использовала 291 960 секунд CU с длительностью 810,16 секунды (13,5 минуты), в то время как никаких операций выполнения действий не было, так как в выполнении конвейера отсутствовали некопировальные действия.

Заметка

Несмотря на то, что эта метрика отображается как метрика, фактическое время выполнения не имеет значения при вычислении эффективных часов CU с приложением Fabric Metrics, так как метрика CU секунд, которую она также сообщает, уже учитывает его продолжительность.

Метрика Операция перемещения данных
CU секунды 291 960 секунды CU
Эффективные часы CU (291,960) / (60*60) CU-hours = 81.1 CU-hours

Общая стоимость выполнения при $0,18/ч CU = (81,1 ч CU) * ($0,18/ч CU) ≈ $14,60