Поделиться через


Функции массива в потоке данных для сопоставления

ОБЛАСТЬ ПРИМЕНЕНИЯ: Фабрика данных Azure Azure Synapse Analytics

Совет

Попробуйте использовать фабрику данных в Microsoft Fabric, решение для аналитики с одним интерфейсом для предприятий. Microsoft Fabric охватывает все, от перемещения данных до обработки и анализа данных в режиме реального времени, бизнес-аналитики и отчетности. Узнайте, как бесплатно запустить новую пробную версию !

Потоки данных доступны в конвейерах как Фабрики данных Azure, так и Azure Synapse. Эта статья относится к потокам данных для сопоставления. Если вы не знакомы с преобразованиями, см. вводную статью Преобразование данных с помощью потока данных для сопоставления.

В следующих статьях приведены сведения о функциях массивов, поддерживаемых Azure Data Factory и Azure Synapse Analytics в потоках сопоставления данных.

Список функций массива

Функции массива выполняют преобразование структур данных, которые являются массивами. К ним относятся специальные ключевые слова для указания элементов и индексов массива:

  • #acc представляет значение, которое необходимо включить в отдельные выходные данные при сокращении массива;
  • #index представляет текущий индекс массива вместе с номерами индексов массива #index2, #index3 ...;
  • #item представляет значение текущего элемента в массиве.
Функция массива Задача
array. Создает массив элементов. Все элементы должны быть одного типа. Если элементы не указаны, по умолчанию используется пустой массив строк. То же, что и оператор создания [].
at Находит элемент в индексе массива. Индекс основан на 1. Индекс вне допустимого диапазона возвращает значение NULL. Находит значение в отображении по заданному ключу. Если ключ не найден, он возвращает значение NULL.
содержит Возвращает значение true, если какой-либо элемент в указанном массиве оценивается как true в предоставленном предикате. Функция Contains ожидает ссылку на один элемент в функции предиката в качестве #item.
distinct Возвращает отдельный набор элементов из массива.
except Возвращает набор отличий одного массива от другого, удаляя дубликаты.
filter Фильтрует элементы массива, которые не соответствуют предоставленному предикату. Функция Filter ожидает ссылку на один элемент в функции предиката в качестве #item.
find Поиск первого элемента в массиве, соответствующего условию. Принимает функцию фильтра, в которой можно указать элемент массива как #item. Для глубоко вложенных сопоставлений можно ссылаться на родительские сопоставления, используя нотацию #item_n(#item_1, #item_2...).
flatten Сводит массив или массивы в единый массив. Массивы атомарных элементов возвращаются без изменений. Последний аргумент является необязательным и по умолчанию равен false для рекурсивного выравнивания, когда появление вложенности превышает один уровень.
в папке Проверяет, находится ли элемент в массиве.
пересекать Возвращает набор пересечений отдельных элементов из двух массивов.
карта Сопоставляет каждый элемент массива с новым элементом, используя предоставленное выражение. Функция map ожидает ссылку на один элемент, обозначенный как #item, в функции выражения.
mapIf Условно сопоставляет массив с другим массивом с той же или меньшей длиной. Значения могут принадлежать к любому типу данных, включая structTypes. Принимает функцию сопоставления, в которой можно указать элемент в массиве как #item, а текущий индекс как #index. Для глубоко вложенных карт можно ссылаться на родительские карты с помощью нотации #item_[n](#item_1, #index_1...) .
mapIndex Сопоставляет каждый элемент массива с новым элементом, используя предоставленное выражение. Функция map ожидает ссылку на один элемент в функции выражения в качестве #item, а также ссылку на индекс элемента в качестве #index.
mapLoop Перебирает числа от 1 до length, создавая массив этой длины. Принимает функцию сопоставления, в которой можно указать индекс в массиве как #index. Для глубоко вложенных сопоставлений можно ссылаться на родительские сопоставления, используя нотацию #index_n(#index_1, #index_2...).
уменьшить Накапливает элементы в массиве. Функция reduce ожидает ссылку на аккумулятор и один элемент, обозначенные в первом выражении как #acc и #item, и ожидает, что результирующее значение, обозначенное как #result, будет использоваться во втором выражении.
size Определяет размер массива или типа сопоставления.
ломтик Извлекает подмножество массива из позиции. Позиция отсчитывается от единицы. Если длина не указана, то по умолчанию она считается до конца строки.
сортировать Сортирует массив, используя предоставленную функцию предиката. Sort ожидает ссылку на два последовательных элемента в выражении функции как #item1 и #item2.
раскрыть Разворачивает массив в набор строк и повторяет значения для оставшихся столбцов в каждой строке
союз Возвращает объединенное множество уникальных элементов из двух массивов.

Другие доступные функции