Поделиться через


Настройка Azure Files в процессе копирования

В этой статье рассматривается, как использовать действие копирования данных в конвейере для копирования данных из файлов Azure и в них.

Поддерживаемые форматы

Файлы Azure поддерживают следующие форматы файлов. Дополнительные сведения о параметрах с учетом форматирования см. в соответствующих статьях.

Поддерживаемая конфигурация

Для настройки каждой вкладки в действии копирования перейдите к следующим разделам соответственно.

General

Ознакомьтесь с руководством по общим параметрам , чтобы настроить вкладку "Общие параметры".

Исходный материал

Следующие свойства поддерживаются для файлов Azure на вкладке "Источник " действия копирования.

Требуются следующие свойства:

  • Подключение. Выберите подключение к файлам Azure из списка подключений. Если подключение не существует, создайте новое подключение к службе "Файлы Azure", нажав кнопку "Создать".

  • Тип пути к файлу: можно выбрать путь к файлу, префикс, подстановочный путь к файлу, список файлов в качестве типа пути к файлу. Конфигурация каждого параметра:

    • Путь к файлу: если выбрать этот тип, данные можно скопировать из указанного пути к папке или файлу.

    • Префикс: префикс имени файла в указанной общей папке для фильтрации исходных файлов. Выбраны файлы с именем, начинающийся с fileshare_in_connection/this_prefix . Он использует серверный фильтр для файлов Azure, который обеспечивает лучшую производительность, чем стандартный фильтр.

      Снимок экрана, показывающий тип пути к файлу с префиксом.

    • Путь к файлу с подстановочными знаками: укажите папку или путь к файлу с подстановочными знаками для фильтрации исходных папок или файлов.

      Допустимые подстановочные знаки : * (соответствует нулю или нескольким символам) и ? (соответствует нулю или одному символу). Используйте ^ для экранирования, если в имени папки присутствует подстановочный знак или символ экранирования. Дополнительные примеры см. в примерах фильтров папок и файлов.

      Снимок экрана: путь к файлу подстановочного знака.

      Путь к папке подстановочных знаков: укажите путь к папке с подстановочными знаками для фильтрации исходных папок.

      Имя файла с подстановочными знаками: укажите имя файла с подстановочными знаками в настроенном пути к папке с подстановочными знаками для фильтрации исходных файлов.

    • Список файлов: указывает заданный набор файлов для копирования. В списке путей к файлу введите или перейдите к текстовому файлу, включающее список файлов, которые нужно скопировать, один файл на строку, который является относительным путем к каждому файлу.

      При использовании этого параметра не указывайте имя файла. Дополнительные примеры см. в примерах списка файлов.

      Снимок экрана: путь к списку файлов.

      • Путь к папке: укажите путь к папке. Это обязательно.

      • Путь к списку файлов: укажите путь к текстовому файлу, который содержит список файлов, которые нужно скопировать.

  • Рекурсивно: укажите, считываются ли данные рекурсивно из вложенных папок или только из указанной папки. Обратите внимание, что если выбран Рекурсивно, а назначение — это файловое хранилище, то пустая папка или вложенная папка не копируются и не создаются в месте назначения. Это свойство выбрано по умолчанию и не применяется при настройке пути к списку файлов.

  • Формат файла: выберите формат файла, примененный в раскрывающемся списке. Выберите "Параметры", чтобы настроить формат файла. Сведения о параметрах различных форматов файлов см. в статьях в поддерживаемом формате .

В разделе "Дополнительно" можно указать следующие поля:

  • Фильтр по последнему изменению: файлы фильтруются на основе последних измененных дат. Это свойство не применяется при настройке типа пути к файлу в качестве списка файлов.

    • Время начала (UTC): файлы выбираются, если время последнего изменения больше или равно заданному времени.

    • Время окончания (UTC): файлы выбираются, если время последнего изменения меньше настроенного времени.

      Если время начала (UTC) имеет значение datetime, но время окончания (UTC) равно NULL, это означает, что файлы, последние измененные атрибуты которых больше или равно значению даты и времени будут выбраны. Если время окончания (UTC) имеет значение datetime, но время начала (UTC) равно NULL, это означает, что файлы, последние измененные атрибуты которых меньше значения datetime будут выбраны. Свойства могут иметь значение NULL, что означает, что к данным не будет применен фильтр атрибутов файлов.

  • Включение обнаружения секций: укажите, следует ли анализировать секции из пути к файлу и добавлять их в качестве дополнительных исходных столбцов. Он не выбирается по умолчанию и не поддерживается при использовании двоичного формата файла.

    • Корневой путь секционирования: Если обнаружение разделов включено, укажите абсолютный корневой путь, чтобы читать секционированные папки в виде столбцов данных.

      Если он не указан, по умолчанию

      • При использовании пути к файлу или списка файлов в источнике корневой путь секции — это настроенный путь.
      • При использовании фильтра папок с подстановочными знаками корневой путь раздела – это часть пути перед первым подстановочным знаком.

      Например, если вы настраиваете путь как root/folder/year=2020/month=08/day=27, следующим образом:

      • Если указать корневой путь секции в качестве root/folder/year=2020, действие копирования создаст еще два столбца месяца и день со значением "08" и "27" соответственно, в дополнение к столбцам внутри файлов.
      • Если корневой путь секции не указан, дополнительный столбец не будет создан.

    Снимок экрана: обнаружение разделов.

  • Максимальное число одновременных подключений: это свойство указывает верхний предел параллельных подключений, установленных в хранилище данных во время выполнения действия. Указывайте значение только при необходимости ограничить количество одновременных подключений.

  • Дополнительные столбцы: добавьте дополнительные столбцы данных для хранения относительного пути или статического значения исходных файлов. Выражение поддерживается для последнего варианта.

Место назначения

Следующие свойства поддерживаются для файлов Azure на вкладке "Назначение " действия копирования.

Снимок экрана: вкладка назначения.

Требуются следующие свойства:

  • Связь: Выберите подключение к файлам Azure из списка подключений. Если подключение не существует, создайте новое подключение к файлам Azure, нажав кнопку "Создать".
  • Путь к файлу: нажмите кнопку "Обзор" , чтобы выбрать файл, который требуется скопировать или заполнить путь вручную.
  • Формат файла: выберите формат файла, примененный в раскрывающемся списке. Выберите "Параметры", чтобы настроить формат файла. Сведения о параметрах различных форматов файлов см. в статьях в поддерживаемом формате .

В разделе "Дополнительно" можно указать следующие поля:

  • Поведение копирования: определяет поведение копирования, если источник является файлами из файлового хранилища данных. Вы можете выбрать поведение из раскрывающегося списка.

    Снимок экрана: поведение копирования.

    • Уплощение иерархии: все файлы из исходной папки находятся на первом уровне целевой папки. У целевых файлов есть автоматически созданные имена.
    • Слияние файлов: объединить все файлы из исходной папки в один файл. Если указано имя файла, то оно присваивается объединенному файлу. В противном случае это автоматически созданное имя файла.
    • Сохранение иерархии: сохраняет иерархию файлов в целевой папке. Относительный путь исходного файла к исходной папке идентичен относительному пути целевого файла к целевой папке.
  • Максимальное число одновременных подключений: верхний предел одновременных подключений, установленных в хранилище данных во время выполнения действия. Указывайте значение только при необходимости ограничить количество одновременных подключений.

  • Максимальное количество строк для каждого файла: при записи данных в папку можно выбрать запись в несколько файлов и указать максимальные строки для каждого файла. Укажите максимальные строки, которые требуется записать для каждого файла.

Картирование

Чтобы настроить конфигурацию вкладки "Сопоставление ", перейдите к разделу "Настройка сопоставлений" на вкладке сопоставления. Если в качестве формата файла выбран двоичный файл, сопоставление не будет поддерживаться.

Settings

Сведения о настройке вкладки "Параметры " см. в разделе "Настройка других параметров" на вкладке "Параметры".

Сводка таблицы

В следующих таблицах содержатся дополнительные сведения о действии копирования в файлах Azure.

Исходная информация

Имя Description Ценность Обязательно Свойство скрипта JSON
Подключение Ваше подключение к исходному хранилищу данных. <ваше подключение к Azure Files> Да connection
Тип пути к файлу Тип пути к файлу, используемый для получения исходных данных. • Путь к файлу
•Приставка
• Путь к файлу с подстановочными знаками
• Список файлов
Да /
Путь к файлу
Каталог Путь к папке. <имя папки> нет folderPath
Имя файла Имя файла, находящееся по указанному пути к папке. <имя файла> нет fileName
Для префикса
префикс Префикс имени файла в указанной общей папке для фильтрации исходных файлов. <ваш префикс> нет prefix
Путь к файлу с подстановочными знаками
Путь папки с подстановочными знаками Путь к папке будет использовать подстановочные знаки для фильтрации исходных папок. <Путь к папке с подстановочными знаками> нет wildcardFolderPath
Имя файла подстановочного знака Имя файла с подстановочными знаками в указанной папке или пути к папке подстановочных знаков для фильтрации исходных файлов. <имя файла с подстановочными знаками> Да wildcardFileName
Список файлов
Путь к папке Путь к папке. <имя папки> нет путь к папке
Путь к списку файлов Указывает, что нужно скопировать заданный набор файлов. Наведите указатель на текстовый файл, содержащий список файлов, которые требуется скопировать, один файл на строку. < Путь к списку файлов > нет fileListPath
Рекурсивно Обработайте все файлы во входной папке и ее вложенных папках рекурсивно или просто те, которые в выбранной папке. Этот параметр отключен при выборе одного файла. Выбранный или отмена выбора нет recursive
Формат файлов Формат файла для исходных данных. Сведения о различных форматах файлов см. в статьях в поддерживаемом формате для получения подробных сведений. / Да /
Фильтрация по дате изменения Файлы с последним измененным временем в диапазоне [время начала, время окончания) будут отфильтрованы для дальнейшей обработки. Время будет применено к часовой поясу UTC в формате yyyy-mm-ddThh:mm:ss.fffZ. Эти свойства можно пропустить, что означает, что фильтр атрибутов файла не будет применен. Это свойство не применяется при настройке типа пути к файлу в качестве списка файлов. datetime нет modifiedDatetimeStart
modifiedDatetimeEnd
Включение обнаружения разделов Указывает, следует ли анализировать секции из пути к файлу и добавлять их в качестве дополнительных исходных столбцов. выбран или не выбран (по умолчанию) нет enablePartitionDiscovery:
true или false (по умолчанию)
Максимальное число одновременных подключений Верхний предел одновременных подключений, установленных к хранилищу данных во время выполнения активности. Указывайте значение только при необходимости ограничить количество одновременных подключений. <максимальное число одновременных подключений> нет maxConcurrentConnections
Дополнительные столбцы Добавьте дополнительные столбцы данных для хранения относительного пути или статического значения исходных файлов. Выражение поддерживается для последнего варианта. •Имя
•Ценность
нет дополнительныеКолонки
•имя
•ценность

Сведения о назначении

Имя Description Ценность Обязательно Свойство скрипта JSON
Подключение Подключение к целевому хранилищу данных. <подключение> Да connection
Путь к файлу Путь к папке или файлу целевого файла. < Путь к папке или файлу > Да /
Каталог Путь к папке в указанном контейнере. <имя папки> нет путь к папке
Имя файла Имя файла в указанном контейнере и пути к папке. <имя файла> нет fileName
Поведение копирования Определяет поведение копирования, когда источником являются файлы из файлового хранилища данных. • Плоская иерархия
• Слияние файлов
• Сохранение иерархии
нет поведение копирования
• УпрощениеИерархии
• MergeFiles
• Сохранить Иерархию
Максимальное число одновременных подключений Верхний предел одновременных подключений, установленных к хранилищу данных во время выполнения активности. Указывайте значение только при необходимости ограничить количество одновременных подключений. <максимальное число одновременных подключений> нет maxConcurrentConnections
Максимальное количество строк на файл При записи данных в папку можно выбрать запись в несколько файлов и указать максимальные строки для каждого файла. Укажите максимальные строки, которые требуется записать для каждого файла. < максимальное количество строк на файл > нет maxRowsPerFile