Поделиться через


Наилучшие практики использования уровней доступа к BLOB

В этой статье приведены рекомендации по использованию уровней доступа для оптимизации производительности и снижения затрат. Дополнительные сведения о уровнях доступа см. в статье "Уровни доступа для BLOB-данных".

Выбор наиболее экономичных уровней доступа

Вы можете сократить затраты, разместив данные BLOB в наиболее экономичные классы доступа. Для оптимизации затрат, связанных с использованием данных, доступно три уровня. Например, горячий уровень имеет более высокую стоимость хранения, но более низкую стоимость чтения. Таким образом, если вы планируете часто обращаться к своим данным, горячий уровень может быть самым экономичным вариантом. Если вы планируете читать данные реже, холодный или архивный уровень может оказаться наиболее понятным, так как он повышает стоимость чтения данных при снижении затрат на хранение данных.

Чтобы определить наиболее оптимальный уровень доступа, попробуйте оценить, какой процент данных будет считываться ежемесячно. На следующей диаграмме показано влияние на месячные расходы при различных процентах чтения.

Диаграмма, на которой показан столбец для каждого уровня, представляющий ежемесячные затраты на основе процентного профиля чтения

Чтобы моделировать и анализировать затраты на использование прохладного, холодного и архивного хранения, см. статью Архивное против холодного и прохладного хранения. Вы можете применить аналогичные методы моделирования, чтобы сравнить стоимость горячего, прохладного, холодного или архивного.

Перенос данных непосредственно на наиболее экономичные уровни доступа

Выбор оптимального уровня сразу может снизить затраты. Если вы изменяете уровень блочного BLOB, который уже загрузили, вы сначала оплачиваете стоимость записи на начальный уровень при загрузке BLOB, а затем оплачиваете стоимость записи на желаемый уровень. Если вы изменяете уровни с помощью политики управления жизненным циклом, то для вступления политики в силу потребуется один день, и еще один день — для завершения выполнения. Вы также будете нести затраты на емкость хранения данных на начальном уровне до изменения уровня.

Перемещение данных на наиболее экономичные уровни доступа

После отправки данных следует периодически анализировать контейнеры и большие двоичные объекты, чтобы понять, как они хранятся, организованы и используются в рабочей среде. Затем используйте политики управления жизненным циклом для перемещения данных на наиболее экономичные уровни. Например, данные, которые не были доступны в течение более 30 дней, могут быть более экономичными, если они помещаются на холодный уровень. Рассмотрите возможность архивации данных, которые не были доступны в течение более 180 дней.

Чтобы собрать данные телеметрии, включите отчеты инвентаризации BLOB-объектов и включите отслеживание времени последнего доступа. Анализ шаблонов использования на основе времени последнего доступа с помощью таких средств, как Azure Synapse или Azure Databricks. Сведения о способах анализа данных см. в любой из следующих статей:

Добавление уровня и страничные BLOB-объекты

Анализ может показать добавочные или страничные двоичные объекты, которые не используются активно. Например, у вас могут быть файлы журнала (добавляемые BLOB-объекты), которые больше не считываются или записываются, но вы хотите сохранить их для соблюдения требований. Аналогичным образом вы могут захотеть создать резервную копию дисков или моментальных снимков дисков (страничные BLOB-объекты). Эти двоичные объекты также можно переместить на более холодные уровни. Однако сначала их необходимо преобразовать в блочные BLOB-объекты.

Сведения о преобразовании добавочных и страничных BLOB-объектов в блочные BLOB-объекты см. в разделе Преобразование добавочных и страничных BLOB-объектов в блочные BLOB-объекты.

Упаковка небольших файлов перед перемещением данных на более холодные уровни

Каждая операция чтения или записи повлечет за собой затраты. Чтобы сократить затраты на чтение и запись данных, рассмотрите возможность упаковки небольших файлов в большие файлы с помощью таких форматов файлов, как TAR или ZIP. Меньше файлов уменьшает количество операций, необходимых для передачи данных.

На следующей диаграмме показаны относительные последствия упаковки файлов для холодного уровня. Стоимость чтения предполагает ежемесячный процент чтения в размере 30%.

Диаграмма, показывающая влияние на затраты при пакете небольших файлов перед отправкой на холодный уровень доступа.

На следующей диаграмме показаны относительные последствия упаковки файлов для архивного уровня. Стоимость чтения предполагает ежемесячный процент чтения в размере 30%.

Диаграмма, показывающая влияние на затраты при пакете небольших файлов перед отправкой на уровень доступа к архиву.

Чтобы смоделировать и проанализировать экономию при упаковке файлов, см. вкладку "Экономия при упаковке" в этой книге.

Подсказка

Чтобы упростить поиск и чтение сценариев, попробуйте создать индекс, сопоставляющий упакованные пути к файлам с исходными путями к файлам, а затем хранить эти индексы в виде блочных BLOB-объектов на горячем уровне.

Дальнейшие действия