Формат Excel в фабрике данных в Microsoft Fabric
В этой статье описывается настройка формата Excel в конвейере данных фабрики данных в Microsoft Fabric.
Поддерживаемые возможности
Формат Excel поддерживается для следующих действий и соединителей в качестве источника.
Категория | Соединитель или действие |
---|---|
Поддерживаемый соединитель | Amazon S3 |
Совместимая с Amazon S3 | |
Хранилище BLOB-объектов Azure | |
Azure Data Lake Storage 1-го поколения | |
Azure Data Lake Storage 2-го поколения | |
Файлы Azure | |
Файловая система | |
FTP | |
Google Cloud Storage | |
HTTP | |
Lakehouse Files | |
Хранилище Oracle Cloud | |
SFTP | |
Поддерживаемая активность | Действие копирования (источник/-) |
Действие поиска | |
Действие получения метаданных в Фабрике данных Azure | |
Действие удаления |
Формат Excel в действии копирования
Чтобы настроить формат Excel, выберите подключение в источнике действия копирования конвейера данных и выберите Excel в раскрывающемся списке формата файла. Выберите параметры для дальнейшей настройки этого формата.
Excel в качестве источника
После выбора формата Excel отображаются следующие свойства.
Режим листа: выберите режим листа, который вы хотите использовать для чтения данных Excel. Выберите имя или индекс.
Имя. При выборе имени в разделе "Имя листа" выберите имя листа Excel для чтения данных или нажмите кнопку "Изменить", чтобы указать имя листа вручную. Если вы указываете на папку или несколько файлов, убедитесь, что этот конкретный лист существует во всех этих файлах.
Индекс. При выборе индекса в разделе индекса листа выберите индекс листа Excel для чтения данных или нажмите кнопку "Изменить ", чтобы указать имя листа вручную. Данные начинаются с 0. Если лист добавлен или удален из файла Excel, индекс существующих листов будет автоматически изменен.
После выбора параметров в разделе "Формат файла" в диалоговом окне "Всплывающие параметры формата файла" отображаются следующие свойства.
Тип сжатия: кодек сжатия, используемый для чтения файлов Excel. Вы можете выбрать вариант None, bzip2, gzip, deflate, ZipDeflate, TarGzip или tar в раскрывающемся списке.
Уровень сжатия. Укажите коэффициент сжатия при выборе типа сжатия. Вы можете выбрать вариант "Оптимальный " или "Быстрый".
- Fastest: операция сжатия должна выполняться как можно быстрее, даже если итоговый файл будет сжат не оптимально.
- Optimal: операция сжатия должна выполняться оптимально, даже если для ее завершения требуется больше времени. Дополнительные сведения см. в разделе Уровень сжатия.
Диапазон: диапазон ячеек в заданном листе для поиска выборочных данных, например:
- Не указано: считывает весь лист в виде таблицы из первой непустой строки и столбца.
A3
: считывает таблицу, начиная с заданной ячейки, динамически обнаруживает все строки ниже и все столбцы справа.A3:H5
: считывает этот фиксированный диапазон в виде таблицы.A3:A3
: считывает эту одну ячейку.
Значение NULL: указывает строковое представление значения NULL. Значение по умолчанию — пустая строка.
Первая строка в качестве заголовка: указывает, следует ли рассматривать первую строку в заданном листе или диапазоне как строку заголовка с именами столбцов. Не выбрано по умолчанию.
Сводка таблицы
Excel в качестве источника
Следующие свойства поддерживаются в разделе источника действия копирования при использовании формата Excel.
Имя | Описание | Значение | Обязательно | Свойство скрипта JSON |
---|---|---|---|---|
Формат файлов | Формат файла, который требуется использовать. | Excel | Да | тип (под datasetSettings ):Excel |
Режим листа | Режим листа, который требуется использовать для чтения данных Excel. | - Имя - Указатель |
Да | — sheetName - sheetIndex |
Тип сжатия | Кодек сжатия, используемый для чтения файлов Excel. | Можно выбрать: Не допускается bzip2 gzip выкачивать ZipDeflate TarGzip дёготь |
No | тип (под compression ): bzip2 gzip выкачивать ZipDeflate TarGzip tar |
Уровень сжатия | Коэффициент сжатия. Допустимые значения: оптимальный или самый быстрый. | Оптимальный или быстрый | Без | уровень (под compression ): Самый быстрый Оптимально |
Диапазон | Диапазон ячеек на заданном листе для поиска выборочных данных. | <диапазон ячеек> | Без | range |
Значение NULL | Строковое представление значения NULL. | <значение NULL> пустая строка (по умолчанию) |
Без | nullValue |
Первая строка в качестве заголовка | Следует ли рассматривать первую строку в заданном листе или диапазоне как строку заголовка с именами столбцов. | Выбрано или не выбрано | No | firstRowAsHeader: true или false (по умолчанию) |