Настройка папки для операции копирования

В этой статье описывается, как использовать действие копирования в конвейере для копирования данных из и в папку.

Необходимые условия

Чтобы скопировать данные из папки, необходимо настроить локальный шлюз данных. Дополнительные сведения см. в статье Как получить доступ к локальным источникам данных в Data Factory.

Поддерживаемые форматы

Соединитель папок поддерживает следующие форматы файлов. Дополнительные сведения о параметрах с учетом форматирования см. в соответствующих статьях.

Поддерживаемые исходные форматы

Поддерживаемые форматы назначения

Поддерживаемая конфигурация

Для настройки каждой вкладки в действии копирования перейдите к следующим разделам соответственно.

Общие сведения

Ознакомьтесь с руководством по общим параметрам, чтобы настроить вкладку "Общие параметры".

Исходный материал

Следующие свойства поддерживаются для папки на вкладке "Источник " действия копирования.

Снимок экрана: конфигурация вкладки

Требуются следующие свойства:

  • Подключение. Выберите подключение к папке из списка подключений. Если подключение не существует, создайте новое подключение к папке.

  • Тип пути к файлу: можно выбрать путь к файлу, фильтр файлов, путь к файлу с подстановочными символами или список файлов. Конфигурация для каждого параметра:

    • Путь к файлу: нажмите кнопку "Обзор" , чтобы выбрать файл, который требуется скопировать, или указать путь вручную.

    • Фильтр файлов: собственный фильтр на стороне файлового сервера, который обеспечивает лучшую производительность, чем фильтр подстановочных знаков.

      • Путь к папке: укажите путь к папке.
      • Фильтр файлов: используется * для сопоставления нуля или нескольких символов, а ? также для сопоставления с нулевым или одним символом. Узнайте больше о синтаксисе и заметках в разделе Примечания.
    • Путь к файлу с подстановочными знаками: укажите пути к подстановочным знакам.

      • Пути к подстановочным знакам: укажите папку или путь к файлу с подстановочными знаками для фильтрации исходных папок или файлов.

        Допустимые подстановочные знаки: * (соответствует нулю или нескольким символам) и ? (соответствует нулю или одному символу). Используется ^ для обхода, если имя папки содержит подстановочные знаки или этот escape-символ внутри.

        • Путь к папке подстановочных знаков: укажите путь к папке с подстановочными знаками для фильтрации исходных папок.

        • Имя файла с маской: укажите имя файла с маской в пути к вашей папке (или путь к папке с маской) для фильтрации исходных файлов.

    • Список файлов: указывает, что требуется скопировать заданный набор файлов.

      • Путь к папке: укажите путь к папке.
      • Путь к списку файлов: указывает на текстовый файл, содержащий список файлов, которые требуется скопировать, один файл на строку, который является относительным путем к указанному пути к файлу.
  • Формат файла: выберите формат файла, примененный в раскрывающемся списке. Выберите "Параметры", чтобы настроить формат файла. Параметры различных форматов файлов см. в статьях в поддерживаемом формате.

Следующие свойства являются необязательными:

  • Рекурсивно: укажите, считываются ли данные рекурсивно из вложенных папок или только из указанной папки. Это свойство выбрано по умолчанию и не применяется при настройке списка файлов.
  • Удаление файлов после завершения. Указывает, удаляются ли двоичные файлы из исходного хранилища после успешного перехода в целевое хранилище. Удаление выполняется для каждого файла отдельно. Это свойство допустимо только в сценарии копирования двоичных файлов.

В разделе "Дополнительно" можно указать следующие поля:

  • Фильтр по последнему изменению: файлы фильтруются на основе последних измененных дат. Это свойство не применяется при настройке типа пути к файлу в качестве списка файлов.

    • Время начала (UTC): файлы выбираются, если время последнего изменения больше или равно заданному времени.

    • Время окончания (UTC): файлы выбираются, если время последнего изменения меньше настроенного времени.

    Если время начала (UTC) имеет значение даты и времени, но время окончания (UTC) равно NULL, это означает, что будут выбраны файлы, последние измененные атрибуты которых больше или равно значению datetime. Если время окончания (UTC) имеет значение даты и времени, но время начала (UTC) равно NULL, это означает, что файлы, последние измененные атрибуты которых меньше значения datetime будут выбраны. Свойства могут иметь значение NULL, что означает, что к данным не будет применен фильтр атрибутов файлов.

  • Включение обнаружения секций: укажите, следует ли анализировать секции из пути к файлу и добавлять их в качестве дополнительных исходных столбцов. Он не выбирается по умолчанию и не поддерживается при использовании двоичного формата файла.

    • Корневой путь к партициям: Если обнаружение партиций включено, укажите абсолютный корневой путь, чтобы читать партицированные папки как столбцы данных.

      Если параметр не задан (по умолчанию), происходит следующее.

      • При использовании пути к файлу или списка файлов в источнике корневой путь секции — это настроенный путь.
      • При использовании фильтра папок с подстановочными знаками корневой путь раздела – это часть пути перед первым подстановочным знаком.
  • Максимальное число одновременных подключений: это свойство указывает верхний предел параллельных подключений, установленных в хранилище данных во время выполнения действия. Указывайте значение только при необходимости ограничить количество одновременных подключений.

Место назначения

Следующие свойства поддерживаются для папки на вкладке "Назначение " действия копирования.

Снимок экрана: конфигурация вкладки

Требуются следующие свойства:

  • Подключение. Выберите подключение к папке из списка подключений. Если подключение не существует, создайте новое подключение к папке.

  • Путь к файлу: нажмите кнопку "Обзор" , чтобы выбрать файл, который требуется скопировать или заполнить путь вручную.

  • Формат файла: выберите формат файла, примененный в раскрывающемся списке. Выберите "Параметры", чтобы настроить формат файла. Параметры различных форматов файлов см. в статьях в поддерживаемом формате.

Следующие свойства являются необязательными:

В разделе "Дополнительно" можно указать следующие поля:

  • Поведение копирования: определяет поведение копирования, если источник является файлами из файлового хранилища данных. Вы можете выбрать поведение из раскрывающегося списка.

    • Уплощение иерархии: все файлы из исходной папки находятся на первом уровне целевой папки. У целевых файлов есть автоматически созданные имена.
    • Слияние файлов: объединить все файлы из исходной папки в один файл. Если указано имя файла, то объединенный файл получает указанное имя. В противном случае это автоматически созданное имя файла.
    • Сохранение иерархии (по умолчанию): сохраняет иерархию файлов в целевой папке. Относительный путь исходного файла к исходной папке идентичен относительному пути целевого файла к целевой папке.
  • Максимальное число одновременных подключений: верхний предел одновременных подключений, установленных в хранилище данных во время выполнения действия. Указывайте значение только при необходимости ограничить количество одновременных подключений.

Картирование

Чтобы настроить вкладку "Сопоставление", перейдите к разделу "Настройка сопоставлений" на вкладке "Сопоставление".

Settings

Для настройки вкладки перейдите к Настройка других параметров на вкладке "Параметры".

Сводка таблицы

В следующих таблицах содержатся дополнительные сведения о процессе копирования в папке.

Исходная информация

Имя Описание Ценность Обязательный Свойство скрипта JSON
Подключение Ваше подключение к исходному хранилищу данных. <подключение к папке> Да connection
Тип пути к файлу Тип пути к файлу, используемый для получения исходных данных. / Да /
Путь к файлу
Путь к файлу Папка или путь к файлу, из которой считываются файлы. <папка или путь к файлу> Нет folderPath
Имя файла
Для фильтра файлов
Путь к папке Укажите путь к папке. <Путь к папке> Нет folderPath
Фильтр файлов Собственный фильтр на стороне файлового сервера. <фильтр файлов> Нет fileFilter
Путь к файлу с подстановочными знаками
Путь папки с подстановочными знаками Путь к папке подстановочных знаков, используемый для фильтрации исходных папок. <Путь к папке с подстановочными знаками> Нет wildcardFolderPath
Имя файла подстановочного знака Для фильтрации исходных файлов используется шаблон имени файла с подстановочными знаками. <имя файла с подстановочными знаками> Нет wildcardFileName
Список файлов
Путь к папке Укажите путь к папке. <Путь к папке> Нет folderPath
Путь к списку файлов Путь к текстовому файлу со списком файлов для копирования (относительно настроенного пути). <Путь к списку файлов> Нет fileListPath
Формат файлов Формат файла для исходных данных. Сведения о различных форматах файлов см. в статьях в поддерживаемом формате. / Да /
Рекурсивно Указывает, считываются ли данные рекурсивно из подпапок или только из указанной папки. Это свойство не применяется при настройке списка файлов. true/false Нет рекурсивный
Удаление файлов после завершения Указывает, удаляются ли двоичные файлы из исходного хранилища после успешного перехода в целевое хранилище. true/false Нет deleteFilesAfterCompletion
Фильтрация по дате изменения Файлы с последним измененным временем в диапазоне [время начала, время окончания) будут отфильтрованы для дальнейшей обработки. Время будет применено к часовой поясу UTC в формате YYYY-MM-DDTHH:mm:ssZ. Эти свойства можно пропустить, что означает, что фильтр атрибутов файла не будет применен. Это свойство не применяется при настройке типа пути к файлу в качестве списка файлов. <Дата и время> Нет modifiedDatetimeStart
modifiedDatetimeEnd
Включение обнаружения разделов Указывает, следует ли анализировать секции из пути к файлу и добавлять их в качестве дополнительных исходных столбцов. true/false Нет ВключитьОбнаружениеРазделов
Корневой путь раздела Если обнаружение секций включено, укажите абсолютный корневой путь, чтобы считывать секционированные папки как столбцы данных. <корневой путь вашего раздела> Нет partitionRootPath
Максимальное число одновременных подключений Верхний предел одновременных подключений, установленных для хранилища данных в процессе выполнения задания. Указывайте значение только при необходимости ограничить количество одновременных подключений. <Целое число> Нет maxConcurrentConnections

Сведения о назначении

Имя Описание Ценность Обязательный Свойство скрипта JSON
Подключение Подключение к целевому хранилищу данных. <подключение к папке> Да connection
Путь к файлу Путь к папке, в которой записываются файлы. <Путь к папке> Да folderPath
Имя файла
Формат файлов Формат файла для целевых данных. Сведения о различных форматах файлов см. в статьях в поддерживаемом формате. / Да /
Поведение копирования Определяет, как файлы записываются в место назначения. FlattenHierarchy
MergeFiles
Сохранить иерархию (по умолчанию)
Нет copyBehavior
Максимальное число одновременных подключений Максимальное количество одновременных подключений к хранилищу данных. <Целое число> Нет maxConcurrentConnections