Контекст навыка и язык заметок ввода

В этой статье приведена справочная документация по контексту навыка и синтаксису входных данных. Это полное описание языка выражений, используемого для создания путей к узлам в обогащенном документе.

Навыки поиска ИИ Azure могут использовать и дополнять данные, поступающие из источника данных, и из выходных данных других навыков. Рабочий набор данных, представляющий текущее состояние работы индексатора для текущего документа, начинается с необработанных данных, поступающих из источника данных, и постепенно обогащен выходными данными каждого навыка. Эти данные внутренне упорядочены в виде дерева, которую можно запрашивать для использования в качестве входных данных навыка или добавления в индекс. Узлы в дереве могут быть простыми значениями, такими как строки и числа, массивы или сложные объекты и даже двоичные файлы. Даже простые значения можно дополнить более структурированными сведениями. Например, строка может быть аннотирована с дополнительными сведениями, хранящимися под ним в дереве обогащения. Выражения, используемые для запроса внутренней структуры, используют расширенный синтаксис, подробно описанный в этой статье. Обогащенную структуру данных можно проверить из сеансов отладки. Выражения, запрашивающие структуру, также можно протестировать из сеансов отладки.

На протяжении всей статьи мы используем следующие обогащенные данные в качестве примера. Эти данные типичны для структуры, которую вы получаете при обогащении документа с помощью набора навыков, включая OCR, извлечение ключевых фраз, перевод текста, определение языка и распознавание сущностей, а также пользовательский навык токенизации.

Path	Value
`document`
`merged_content`	"Исследование BMN 110 в педиатрических пациентов"...
`keyphrases`
`[0]`	"Исследование BMN"
`[1]`	"Syndrome"
`[2]`	"Педиатрические пациенты"
...
`locations`
`[0]`	"IVA"
`translated_text`	"Étude de BMN 110 chez les пациентов pédiatriques"...
`entities`
`[0]`
`category`	"Organization"
`subcategory`	`null`
`confidenceScore`	0.72
`length`	3
`offset`	9
`text`	"BMN"
...
`organizations`
`[0]`	"BMN"
`language`	"en"
`normalized_images`
`[0]`
`layoutText`	...
`text`
`words`
`[0]`	"Study"
`[1]`	"of"
`[2]`	"BMN"
`[3]`	"110"
...
`[1]`
`layoutText`	...
`text`
`words`
`[0]`	"it"
`[1]`	"is"
`[2]`	"certainly"
...
...
...

Корневой каталог документа

Данные находятся под единственным корневым элементом, а путь — "/document". Корневой элемент — это контекст по умолчанию для навыков.

Простые пути

Простые пути через внутренний обогащенный документ можно выразить с помощью простых маркеров, разделенных косыми чертами. Этот синтаксис аналогичен спецификации указателя JSON.

Свойства объектов

Свойства узлов, представляющих объекты, добавляют значения в дерево под именем свойства. Эти значения можно получить путем добавления имени свойства в виде маркера, разделенного косой чертой:

Expression	Value
`/document/merged_content/language`	`"en"`

Маркеры имен свойств чувствительны к регистру.

Индекс элемента массива

На определенные элементы массива можно ссылаться с помощью числового индекса, например имени свойства:

Expression	Value
`/document/merged_content/keyphrases/1`	`"Syndrome"`
`/document/merged_content/entities/0/text`	`"BMN"`

Последовательности экранирования

Существует несколько символов, которые имеют особое значение и должны быть экранированы, если они должны быть интерпретированы as-is вместо элемента синтаксиса. К этим символам относятся #, /а ~ также другие.

escape-последовательность	Особое значение (использование в синтаксисе пути)	Example
`~0`	Используется для экранирования `~`	"~0" для `~`, где "~/documents" становится "~0~1documents"
`~1`	Используется для экранирования `/`	"~1" для `/`, где "~/documents" становится "~0~1documents"
`~2`	Используется для обхода произвольных последовательностей (включая, но не ограничивается `#` и `*`)	"~2#~2", где "readme#requirements" становится "readme~2#~2requirements"

Перечисление массива

Массив значений можно получить с помощью маркера '*' :

Expression	Value
`/document/normalized_images/0/text/words/*`	`["Study", "of", "BMN", "110" ...]`

Маркер '*' не должен находиться в конце пути. Можно перечислить все узлы, соответствующие пути со звездой в середине или с несколькими звездами:

Expression	Value
`/document/normalized_images//text/words/`	`["Study", "of", "BMN", "110" ... "it", "is", "certainly" ...]`

В этом примере возвращается плоский список всех соответствующих узлов.

Можно поддерживать большую структуру и получить отдельный массив для слов каждой страницы с помощью '#' маркера вместо второго '*' маркера:

Expression	Value
`/document/normalized_images/*/text/words/#`	`[["Study", "of", "BMN", "110" ...], ["it", "is", "certainly" ...] ...]`

Маркер '#' выражает, что массив должен рассматриваться как одно значение вместо перечисления.

Перечисление массивов в контексте

Часто полезно обрабатывать каждый элемент массива в изоляции и иметь разные наборы входных и выходных данных навыка для каждого элемента. Это рекомендуется сделать, задав контекст навыка перечислению вместо значения по умолчанию "/document".

В следующем примере мы используем одно из входных выражений, которые мы использовали раньше, но с другим контекстом, который изменяет результирующее значение.

Context	Expression	Values
`/document/normalized_images/*`	`/document/normalized_images//text/words/`	`["Study", "of", "BMN", "110" ...]` `["it", "is", "certainly" ...]` ...

Для этого сочетания контекста и ввода навык выполняется один раз для каждого нормализованного изображения: один раз и "/document/normalized_images/0" один раз."/document/normalized_images/1" Два входных значения, соответствующих каждому выполнению навыка, подробно описаны в столбце значений.

При перечислении массива в контексте все выходные данные навыка добавляются в документ в качестве обогащения контекста. В предыдущем примере выходные данные с именем "out" имеют свои значения для каждого выполнения, добавленного в документ соответственно в разделе "/document/normalized_images/0/out" и "/document/normalized_images/1/out".

Литеральные значения

Входные данные навыка могут принимать литеральные значения в качестве входных данных вместо динамических значений, запрашиваемых из существующего документа. Эту рекомендацию можно выполнить, добавив к значению знак равенства. Значения могут быть числами, строками или логическими значениями. Строковые значения могут быть заключены в одинарные ' или двойные " кавычки.

Expression	Value
`=42`	`42`
`=2.45E-4`	`0.000245`
`="some string"`	`"some string"`
`='some other string'`	`"some other string"`
`="unicod\u0065"`	`"unicode"`
`=false`	`false`

В массивах строк

Если для определенного ввода навыка требуется массив данных, но данные представлены как одно значение в данный момент или необходимо объединить несколько разных отдельных значений в поле массива, то можно создать встроенное значение массива как часть выражения ввода навыка, упаковав разделенный запятыми список выражений в скобках ([ и ]). Значение массива может быть сочетанием путей выражений или литеральных значений по мере необходимости. Вы также можете создать вложенные массивы в массивах таким образом.

Expression	Value
`=['item']`	["item"]
`=[$(/document/merged_content/entities/0/text), 'item']`	["BMN", "элемент"]
`=[1, 3, 5]`	[1, 3, 5]
`=[true, true, false]`	[истина, истина, ложь]
`=[[$(/document/merged_content/entities/0/text), 'item'],['item2', $(/document/merged_content/keyphrases/1)]]`	[["BMN", "item"], ["item2", "Синдром"]]

Если у навыка есть контекст, который объясняет выполнение навыка на входные данные массива (то есть как это означает, что "context": "/document/pages/*" навык выполняется один раз на страницу) pagesзатем передает это значение как выражение в качестве входных данных в массив строк использует одно из этих значений одновременно.

Пример с нашим примером обогащенных данных, если ваш навык context является /document/merged_content/keyphrases/* , а затем вы создаете встроенный массив следующего =['key phrase', $(/document/merged_content/keyphrases/*)] на входе этого навыка, то навык выполняется три раза, один раз со значением ["ключевой фразы", "Исследование BMN"], другой со значением ["ключевой фразы", "Синдром"] и, наконец, со значением ["ключевой фразы", "Педиатрические пациенты"]. Значение литерала "ключевой фразы" остается одинаковым каждый раз, но значение пути выражения изменяется при каждом выполнении навыка.

Составные выражения

Можно объединить значения с помощью унарных, двоичных и тернарных операторов. Операторы могут объединять литеральные значения и значения, полученные из оценки пути. При использовании внутри выражения пути должны быть заключены между "$(" и ")".

Логическое значение не `'!'`

Expression	Value
`=!false`	`true`

Отрицательная `'-'`

Expression	Value
`=-42`	`-42`
`=-$(/document/merged_content/entities/0/offset)`	`-9`

Сложение `'+'`

Expression	Value
`=2+2`	`4`
`=2+$(/document/merged_content/entities/0/offset)`	`11`

Вычитание `'-'`

Expression	Value
`=2-1`	`1`
`=$(/document/merged_content/entities/0/offset)-2`	`7`

Умножение `'*'`

Expression	Value
`=2*3`	`6`
`=$(/document/merged_content/entities/0/offset)*2`	`18`

Деление `'/'`

Expression	Value
`=3/2`	`1.5`
`=$(/document/merged_content/entities/0/offset)/3`	`3`

По модулю `'%'`

Expression	Value
`=15%4`	`3`
`=$(/document/merged_content/entities/0/offset)%2`	`1`

Объединение строк `'+'`

Expression	Value
`="Hello," + "world!"`	`"Hello, world!"`
`=$(/document/merged_content/entities/0/text) + $(/document/merged_content/entities/0/category)`	`"BMN Organization"`

Меньше, чем или равно, больше и больше или равно `'<''<=''>''>='`

Expression	Value
`=15<4`	`false`
`=4<=4`	`true`
`=15>4`	`true`
`=1>=2`	`false`

Равенство и неравенство `'==''!='`

Expression	Value
`=15==4`	`false`
`=4==4`	`true`
`=15!=4`	`true`
`=1!=1`	`false`

Логические операции, а также и монопольные или `'&&''||'` эксклюзивные `'^'`

Expression	Value
`=true&&true`	`true`
`=true&&false`	`false`
`=true\|\|true`	`true`
`=true\|\|false`	`true`
`=false\|\|false`	`false`
`=true^false`	`true`
`=true^true`	`false`

Оператор Ternary `'?:'`

Можно дать входные значения, основанные на оценке логического выражения с помощью тернарного оператора.

Expression	Value
`=true?"true":"false"`	`"true"`
`=$(/document/merged_content/entities/0/offset)==9?"nine":"not nine"`	`"nine"`

Круглые скобки и приоритет оператора

Операторы оцениваются с приоритетами, которые соответствуют обычным соглашениям: унарные операторы, а затем умножение, деление и модуло, а затем сложение и вычитание, а затем сравнение, а затем равенство, а затем логические операторы. Также применяются обычные правила ассоциативности.

Круглые скобки можно использовать для изменения или диамбигуации порядка оценки.

Expression	Value
`=3*2+5`	`11`
`=3*(2+5)`	`21`

См. также

Обратная связь

Были ли сведения на этой странице полезными?

Last updated on 2026-01-07

Поделиться через

Контекст навыка и язык заметок ввода

Корневой каталог документа

Простые пути

Свойства объектов

Индекс элемента массива

Последовательности экранирования

Перечисление массива

Перечисление массивов в контексте

Литеральные значения

В массивах строк

Составные выражения

Логическое значение не '!'

Отрицательная '-'

Сложение '+'

Вычитание '-'

Умножение '*'

Деление '/'

По модулю '%'

Объединение строк '+'

Меньше, чем или равно, больше и больше или равно '<''<=''>''>='

Равенство и неравенство '==''!='

Логические операции, а также и монопольные или '&&''||' эксклюзивные '^'

Оператор Ternary '?:'