Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
XML (расширяемый язык разметки) — это текстовый формат для структурированного обмена данными. В этой статье описывается настройка XML-формата в качестве источника в конвейере копирования в Data Factory в Microsoft Fabric.
Поддерживаемые возможности
Формат XML поддерживается для следующих действий и соединителей в качестве источника.
| Категория | Соединитель или действие |
|---|---|
| Поддерживаемый соединитель | Amazon S3 |
| Совместимая с Amazon S3 | |
| Хранилище BLOB-объектов Azure | |
| Azure Data Lake Storage 2-го поколения | |
| Файлы Azure | |
| Файловая система | |
| FTP | |
| Google Cloud Storage | |
| HTTP | |
| Lakehouse Files | |
| Хранилище Oracle Cloud | |
| SFTP | |
| Поддерживаемая активность | Копирование (источник/-) |
| Операция поиска | |
| Активность получения метаданных | |
| Удаление действия |
Формат XML в процессе копирования
Чтобы настроить формат XML, выберите подключение в источнике действия копирования конвейера и выберите XML в раскрывающемся списке формата файла. Выберите параметры для дальнейшей настройки этого формата.
XML в качестве источника
После выбора параметров в разделе "Формат файла" в диалоговом окне "Всплывающие параметры формата файла" отображаются следующие свойства.
Тип сжатия: кодек сжатия, используемый для чтения XML-файлов. Вы можете выбрать тип None, bzip2, gzip, deflate, ZipDeflate, TarGZip или tar в раскрывающемся списке.
Если выбрать ZipDeflate в качестве типа сжатия, сохраните имя ZIP-файла в виде папки в разделе "Дополнительные параметры" на вкладке "Источник ".
-
Сохраните имя ZIP-файла в виде папки: указывает, следует ли сохранять имя исходного ZIP-файла в виде структуры папок во время копирования.
- Если этот флажок установлен (по умолчанию), служба записывает распакованные файлы в
<specified file path>/<folder named as source zip file>/. - Если этот флажок снят, служба записывает распакованные файлы непосредственно в
<specified file path>. Чтобы избежать непредвиденных ситуаций, убедитесь в том, что в разных исходных ZIP-файлах нет файлов с одинаковыми именами.
- Если этот флажок установлен (по умолчанию), служба записывает распакованные файлы в
Если выбрать TarGZip/tar в качестве типа сжатия, параметр "Сохранить имя файла сжатия в качестве папки" отображается в разделе "Дополнительные параметры" на вкладке "Источник".
-
Сохранение имени файла сжатия в виде папки: указывает, следует ли сохранять исходное сжатое имя файла в виде структуры папок во время копирования.
- Если этот флажок установлен (по умолчанию), служба записывает распакованные файлы в
<specified file path>/<folder named as source compressed file>/. - Если этот флажок снят, служба записывает распакованные файлы непосредственно в
<specified file path>. Чтобы избежать непредвиденных ситуаций, убедитесь в том, что в разных исходных файлах нет файлов с одинаковыми именами.
- Если этот флажок установлен (по умолчанию), служба записывает распакованные файлы в
-
Сохраните имя ZIP-файла в виде папки: указывает, следует ли сохранять имя исходного ZIP-файла в виде структуры папок во время копирования.
Уровень сжатия. Укажите коэффициент сжатия при выборе типа сжатия. Вы можете выбрать один из самых быстрых или оптимальных вариантов.
- Fastest: операция сжатия должна выполняться как можно быстрее, даже если итоговый файл будет сжат не оптимально.
- Optimal: операция сжатия должна выполняться оптимально, даже если для ее завершения требуется больше времени. Дополнительные сведения см. в разделе Уровень сжатия.
Кодировка: укажите тип кодирования, используемый для чтения текстовых файлов. Выберите один тип из раскрывающегося списка. Значение по умолчанию — UTF-8.
Значение NULL: указывает строковое представление значения NULL. Значение по умолчанию — пустая строка.
В разделе "Дополнительные параметры" на вкладке "Источник " отображаются следующие свойства связанного формата XML.
Режим проверки: указывает, следует ли проверять схему XML. Выберите один режим из раскрывающегося списка.
- Нет. Выберите этот параметр, чтобы не использовать режим проверки.
- xsd: выберите эту схему, чтобы проверить схему XML с помощью XSD.
- dtd: выберите это, чтобы проверить схему XML с помощью DTD.
Пространство имен: Укажите, следует ли включить пространство имен при анализе XML-файлов. Он выбран по умолчанию.
Пары префиксов пространства имен: если пространства имен включены, выберите +Создать и укажите URL-адрес и префикс. Вы можете добавить дополнительные пары, нажав кнопку +Создать.
Сопоставление URI пространства имен с префиксом используется для именования полей при анализе XML-файла. Если в XML-файле есть пространство имен и оно включено, по умолчанию имя поля совпадает с именем в XML-документе. Если в этой карте есть элемент, определенный для URI пространства имен, имя поля будет иметь значениеprefix:fieldName.
Определение типа данных: укажите, следует ли обнаруживать целые числа, двойные и логические типы данных. Он выбран по умолчанию.
Свойства активности копирования XML
XML в качестве источника
Следующие свойства поддерживаются в разделе Источник действия копирования при использовании формата XML.
| Имя | Описание | Значение | Обязательно | Свойство скрипта JSON |
|---|---|---|---|---|
| Формат файлов | Формат файла, который требуется использовать. | XML | Да | тип (под datasetSettings):Xml |
| Тип сжатия | Кодек сжатия, используемый для чтения XML-файлов. |
Не допускается bzip2 gzip сжимать ZipDeflate TarGZip tar |
Нет | тип (под compression): bzip2 gzip сжатие (deflate) ZipDeflate TarGZip tar |
| Уровень сжатия | Коэффициент сжатия. |
Самая быстрая Оптимальный |
Нет | уровень (под compression): Самый быстрый Оптимально |
| Кодирование | Тип кодирования, используемый для чтения текстовых файлов. | UTF-8 (по умолчанию), "UTF-8 без BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1252", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" | Нет | имя кодировки |
| Сохранение имени ZIP-файла в качестве папки | Указывает, следует ли сохранять имя исходного ZIP-файла в виде структуры папок во время копирования. | Выбранный (по умолчанию) или отмена выбора | Нет | сохранитьИмяАрхиваВкачествеПапки (под compressionProperties->type в качестве ZipDeflateReadSettings):true (по умолчанию) или false |
| Сохранение имени файла сжатия в виде папки | Указывает, следует ли сохранять исходное сжатое имя файла в виде структуры папок во время копирования. | Выбранный (по умолчанию) или отмена выбора | Нет | сохранитьИмяФайлаПриСжатииКакПапку (под compressionProperties->type как TarGZipReadSettings или TarReadSettings):true (по умолчанию) или false |
| Значение NULL | Строковое представление значения NULL. |
<ваше значение NULL> пустая строка (по умолчанию) |
Нет | нулевое значение |
| Режим проверки | Следует ли проверить xml-схему. |
Не допускается xsd dtd |
Нет | режим_проверки xsd dtd |
| Пространства имен | Следует ли включать пространство имен при синтаксическом анализе XML-файлов. | Выбрано (по умолчанию) или не выбрано | Нет | пространства имен: true (по умолчанию) или false |
| Пары префиксов пространства имен | Универсальный идентификатор ресурса (URI) пространства имен для соответствия префиксу, используемому для именования полей при разборе XML-файла. Если в XML-файле есть пространство имен и оно включено, по умолчанию имя поля совпадает с именем в XML-документе. Если в этой карте есть элемент, определенный для URI пространства имен, имя поля будет иметь значение prefix:fieldName. |
<URL:>< префикс> | Нет | namespacePrefixes: <URL:>< префикс> |
| Определение типа данных | Следует ли выявлять типы данных "целое число", "число с плавающей запятой" и "логическое значение". | Выбрано (по умолчанию) или не выбрано | Нет | определитьТипДанных true (по умолчанию) или false |