Работа с большими каталогами в файлах Azure

Область применения: ✔️ общие папки NFS

В этой статье приведены рекомендации по работе с каталогами, содержащими большое количество файлов. Обычно рекомендуется уменьшить количество файлов в одном каталоге, разместив файлы по нескольким каталогам. Однако существуют ситуации, в которых нельзя избежать больших каталогов. При работе с большими каталогами в общих папках Azure, подключенных к клиентам Linux, рассмотрите следующие рекомендации.

Увеличьте количество хэш-контейнеров

Общий объем ОЗУ в системе, выполняющий перечисление, влияет на внутреннюю работу протоколов файловой системы, таких как NFS и SMB. Даже если пользователи не испытывают высокую загрузку памяти, количество доступной памяти влияет на число хэш-ячейк inode в системе, что улучшает производительность перечисления в больших каталогах. Можно изменить количество хэш-контейнеров инодов в системе, чтобы уменьшить количество хэш-конфликтов, возникающих при больших нагрузках по перечислению.

Чтобы увеличить количество хэш-ведер инодов, измените параметры конфигурации загрузки.

С помощью текстового редактора измените /etc/default/grub файл.
```
sudo vim /etc/default/grub
```
Добавьте следующий текст в файл /etc/default/grub. Эта команда задает 128 МБ в качестве размера хэш-таблицы и увеличивает потребление памяти системы не более 128 МБ.
```
GRUB_CMDLINE_LINUX="ihash_entries=16777216"
```
Если GRUB_CMDLINE_LINUX уже существует, добавьте ihash_entries=16777216, разделенный пробелом, как показано ниже:
```
GRUB_CMDLINE_LINUX="<previous commands> ihash_entries=16777216"
```
Чтобы применить изменения, выполните следующую команду:
```
sudo update-grub2
```
Перезапустите систему:
```
sudo reboot
```
Чтобы убедиться, что изменения эффективны после перезагрузки, проверьте команды cmdline ядра:
```
cat /proc/cmdline
```
Если ihash_entries отображается, система применила этот параметр, а производительность перечисления должна повыситься экспоненциально.

Вы также можете проверить выходные данные dmesg, чтобы узнать, применена ли строка команд ядра.
```
dmesg | grep "Inode-cache hash table"
Inode-cache hash table entries: 16777216 (order: 15, 134217728 bytes, linear)
```

Команды и операции

Способ указания команд и операций также может повлиять на производительность. Перечисление всех файлов в большом каталоге с помощью ls команды является хорошим примером.

Примечание.

Некоторые операции, такие как рекурсивная ls, find, и du, требуют как имена файлов, так и атрибуты файлов, поэтому они объединяют перечисления каталогов (чтобы получить записи) с вызовом функции stat для каждой записи (чтобы получить атрибуты). Мы рекомендуем использовать более высокое значение для actimeo в точках монтирования, где вы, скорее всего, будете выполнять такие команды.

Использование неоцененных ls

В некоторых дистрибутивах Linux оболочка автоматически задает параметры по умолчанию для ls команды, например ls --color=auto. Это изменяет способ работы ls по сети и добавляет дополнительные операции в выполнение ls. Чтобы избежать снижения производительности, рекомендуется использовать ls без алиасов. Это можно сделать одним из трех способов.

В качестве временного обходного решения, влияющего только на текущий сеанс, можно удалить псевдоним с помощью команды unalias ls.
Для внесения постоянных изменений вы можете изменить псевдоним ls в файле пользователя bashrc/bash_aliases. В Ubuntu отредактируйте ~/.bashrc, чтобы удалить псевдоним для ls.
Вместо вызова lsможно напрямую вызвать двоичный ls файл, например /usr/bin/ls. Это позволяет использовать ls без каких-либо параметров, которые могут находиться в псевдониме. Расположение двоичного файла можно найти, выполнив команду which ls.

Запретить сортировку выходных данных ls

При использовании ls с другими командами можно повысить производительность, предотвратив ls сортировку выходных данных в ситуациях, когда вам не нужно заботиться о порядке, возвращающем ls файлы. Сортировка выходных данных добавляет значительные затраты.

Вместо выполнения ls -l | wc -l чтобы получить общее количество файлов, можно использовать параметры -f или -U с ls, чтобы предотвратить сортировку выходных данных. Разница в том, что -f показывает скрытые файлы, а -U — нет.

Например, если вы вызываете двоичный ls файл в Ubuntu напрямую, вы запустите /usr/bin/ls -1f | wc -l или /usr/bin/ls -1U | wc -l.

На следующей диаграмме сравнивается время, необходимое для вывода результатов с использованием неупорядоченных, несортированных ls и отсортированных ls.

График, сравнивающий общее время в секундах на выполнение команды ls с сортировкой и без сортировки.

Операции копирования и резервного копирования файлов

При копировании данных из общей папки или выполнении резервного копирования из общих папок в другое расположение, для достижения оптимальной производительности рекомендуется использовать моментальный снимок общего ресурса в качестве источника вместо текущей общей папки с активными операциями ввода-вывода. Приложения резервного копирования должны выполнять команды непосредственно на моментальном снимке. Дополнительные сведения см. в разделе "Использование моментальных снимков общего ресурса" для Azure Files.

См. также

Улучшение производительности файлового общего ресурса Azure NFS

Обратная связь

Были ли сведения на этой странице полезными?

Last updated on 2026-03-12

Оптимизация производительности общей папки при доступе к большим каталогам из клиентов Linux

Увеличьте количество хэш-контейнеров

Рекомендуемые параметры монтирования

actimeo

NFS nconnect