Формат Excel в фабрике данных в Microsoft Fabric

формат Excel поддерживает чтение данных из .xlsx и .xls файлов. В этой статье описывается настройка формата Excel в качестве источника в конвейере действий копирования в фабрике данных в Microsoft Fabric.

Поддерживаемые возможности

Формат Excel поддерживается в качестве источника для следующих действий и соединителей.

Категория Соединитель или действие
Поддерживаемый соединитель Amazon S3
Совместимая с Amazon S3
Хранилище BLOB-объектов Azure
Azure Data Lake Storage 2-го поколения
Файлы Azure
Файловая система
FTP
Google Cloud Storage
HTTP
Lakehouse Files
Хранилище Oracle Cloud
SFTP
Поддерживаемая активность Копирование (источник/-)
Операция поиска
Активность получения метаданных
Удаление действия

Формат Excel в операции копирования

Чтобы настроить формат Excel, выберите подключение в источнике действия копирования конвейера и выберите Excel в раскрывающемся списке формата файла. Выберите параметры для дальнейшей настройки этого формата.

Снимок экрана: параметры формата файла.

Excel в качестве источника

После выбора формата Excel отображаются следующие свойства.

  • Режим листа: выберите режим листа, который вы хотите использовать для чтения данных Excel. Выберите имя или индекс.

    • Имя. При выборе имени в разделе "Имя листа" выберите имя листа Excel для чтения данных или нажмите кнопку "Изменить", чтобы указать имя листа вручную. Если вы указываете на папку или несколько файлов, убедитесь, что этот конкретный лист существует во всех этих файлах.

      Снимок экрана: выбор имени в режиме листа.

    • Индекс. При выборе индекса в разделе индекса листа выберите индекс листа Excel для чтения данных или нажмите кнопку "Изменить ", чтобы указать имя листа вручную. Данные начинают считываться с 0. Если лист добавлен или удален из файла Excel, индекс существующих листов будет автоматически изменен.

      Снимок экрана: выбор индекса в режиме листа.

После выбора параметров в разделе "Формат файла" в диалоговом окне "Всплывающие параметры формата файла" отображаются следующие свойства.

Снимок экрана: выбор формата файла.

  • Тип сжатия: кодек сжатия, используемый для чтения файлов Excel. Вы можете выбрать вариант None, bzip2, gzip, deflate, ZipDeflate, TarGzip или tar в раскрывающемся списке.

  • Уровень сжатия. Укажите коэффициент сжатия при выборе типа сжатия. Вы можете выбрать вариант "Оптимальный " или "Быстрый".

    • Fastest: операция сжатия должна выполняться как можно быстрее, даже если итоговый файл будет сжат не оптимально.
    • Optimal: операция сжатия должна выполняться оптимально, даже если для ее завершения требуется больше времени. Дополнительные сведения см. в разделе Уровень сжатия.
  • Диапазон: диапазон ячеек в заданном листе для поиска выборочных данных, например:

    • Не указано: считывает весь рабочий лист в виде таблицы, начиная с первой непустой строки и столбца.
    • A3: считывает таблицу, начиная с заданной ячейки, динамически обнаруживает все строки ниже и все столбцы справа.
    • A3:H5: считывает этот фиксированный диапазон в виде таблицы.
    • A3:A3: считывает эту одну ячейку.
  • Значение NULL: указывает строковое представление значения NULL. Значение по умолчанию — пустая строка.

  • Первая строка в качестве заголовка: указывает, следует ли рассматривать первую строку в заданном листе или диапазоне как строку заголовка с именами столбцов. Не выбрано по умолчанию.

свойства действия копирования Excel

Excel в качестве источника

Следующие свойства поддерживаются в разделе источника действия копирования при использовании формата Excel.

Имя Описание Значение Обязательно Свойство скрипта JSON
  Формат файлов Формат файла, который требуется использовать. Excel Да тип (под datasetSettings):
Excel
Режим листа  Режим листа, который требуется использовать для чтения данных Excel.  - Имя
- Указатель
Да  — имяЛиста
- sheetIndex
Тип сжатия Кодек сжатия, используемый для чтения файлов Excel. Выберите из:
Не допускается
bzip2
gzip
сжимать
ZipDeflate
TarGzip
tar
Нет тип (под compression):

bzip2
gzip
сжатие (deflate)
ZipDeflate
TarGzip
tar
Уровень сжатия  Коэффициент сжатия. Допустимые значения: оптимальный или самый быстрый. Оптимальный или быстрый Нет уровень (под compression):
Самый быстрый
Оптимально
Диапазон Диапазон ячеек на заданном листе для поиска выборочных данных. <диапазон ячеек> Нет диапазон
Значение NULL Строковое представление значения NULL. <ваше значение NULL>
пустая строка (по умолчанию)
Нет нулевое значение
Первая строка в качестве заголовка Следует ли рассматривать первую строку в заданном листе или диапазоне как строку заголовка с именами столбцов. Выбрано или не выбрано Нет firstRowAsHeader:
true или false (по умолчанию)