Примечание
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Часть создания службы поиска — выбор ценовой категории (или SKU). В портале Azure уровень указывается на странице "Выбор тарифного плана" при создании службы. В PowerShell или Azure CLI уровень указывается с помощью -Sku
параметра.
Уровень определяет:
- Максимальное количество индексов и других объектов, разрешенных в службе.
- Размер и скорость секций (физическое хранилище).
- Оплачиваемая ставка как фиксированная ежемесячная стоимость, но и добавочная стоимость при добавлении емкости.
- Характеристики рабочей нагрузки. Некоторые уровни оптимизированы для определенных рабочих нагрузок.
В некоторых случаях от выбранной ценовой категории зависит также доступность функций уровня "Премиум"".
Тарифы выставления счетов отображаются на странице Выбор ценовой категории портала Azure. Вы можете проверить страницу цен на региональные тарифы и просмотреть Планирование и управление затратами, чтобы узнать больше о модели биллинга.
Примечание.
Поисковые сервисы, созданные после 3 апреля 2024 года, имеют более крупные разделы и более высокие векторные квоты почти на всех уровнях. Дополнительные сведения см. в статье Ограничения службы.
Описания уровней
Есть следующие ценовые категории: Бесплатный, Базовый, Стандартный и Оптимизированный для хранилища. Категории "Стандарт" и "Оптимизированный для хранения" доступны в нескольких конфигурациях и вариантах емкости. На следующем снимке экрана из портала Azure показаны доступные уровни без учёта цен (которые можно найти в портале Azure и на странице цен).
Free создает ограниченную поисковую службу для небольших проектов, например, использование учебников и примеров кода. На внутреннем уровне системные ресурсы используются совместно несколькими подписчиками. Вы не можете масштабировать бесплатную службу, выполнять значительные рабочие нагрузки и некоторые функции уровня "Премиум" недоступны. Для каждой подписки Azure можно использовать только одну бесплатную службу поиска. Если служба неактивна в течение длительного периода времени, ее можно удалить, чтобы освободить емкость, особенно если регион находится под ограничениями емкости.
К наиболее часто используемым уровням выставления счетов относятся:
Базовый имеет возможность удовлетворить соглашение об уровне обслуживания с поддержкой трех реплик.
Стандартная (S1, S2, S3) — это значение по умолчанию. Это обеспечивает большую гибкость масштабирования для рабочих нагрузок. Можно масштабировать как разделы, так и реплики. Имея в распоряжении выделенные ресурсы, вы можете разворачивать крупные проекты, оптимизировать производительность и наращивать емкость.
Некоторые уровни предназначены для определенных типов работы:
Standard 3 High Density (S3 HD) — это режим хостинга для S3, где поддерживающее оборудование оптимизировано для многочисленных небольших индексов и предназначено для сценариев мультитенантности. Плата за единицу в категории S3 HD такая же, как и в S3, но оборудование оптимизировано для быстрого чтения файлов в условиях значительного числа небольших индексов.
Уровни хранилища, оптимизированные для хранения (L1, L2), предлагают большую емкость хранилища по более низкой цене на ТБ, чем уровни "Стандартный". Эти уровни предназначены для больших индексов, которые не изменяются очень часто. Основной компромисс заключается в увеличенной задержке запросов, поэтому следует проверить, соответствует ли такая конфигурация требованиям вашего приложения.
Дополнительные сведения о различных уровнях на странице ценообразования, ограничениях служб в статье "Поиск ИИ Azure" и на странице портал Azure при подготовке службы.
Доступность региона по уровням
Список регионов предоставляет расположения, в которых предлагается поиск по искусственному интеллекту Azure. Некоторые регионы могут иметь ограничения емкости для определенных уровней, что предотвращает создание новых служб поиска на этих уровнях. В списке используются сноски для указания ограниченных регионов и уровней.
При создании службы поиска на портале Azure недоступные сочетания уровней региона автоматически исключаются.
Доступность компонентов по ценовым категориям
Большинство функций доступны на всех уровнях, включая уровень "Бесплатный". В некоторых случаях уровень определяет доступность функции. В следующей таблице описываются ограничения.
Функция | Рекомендации по уровню |
---|---|
индексаторы | Индексаторы недоступны в S3 HD. Индексаторы имеют больше ограничений на бесплатном уровне. |
Параметр конфигурации индексатора executionEnvironment |
Возможность закрепить всю обработку индексатора только в кластерах поиска, выделенных вашей службе поиска, требует минимум S2. |
Обогащение ИИ | Работает на бесплатном уровне, но не рекомендуется. |
Управляемые или доверенные удостоверения для исходящего доступа индексатора | Недоступен в категории "Бесплатный". |
Управляемые пользователем ключи шифрования | Недоступен в категории "Бесплатный". |
Доступ к брандмауэру IP | Недоступен в категории "Бесплатный". |
Частная конечная точка (интеграция с Приватным каналом Azure) | Для входящих подключений к службе поиска — недоступна в категории "Бесплатный". Для исходящих подключений индексаторов к другим ресурсам Azure — недоступна в категориях "Бесплатный" и S3 HD. Для индексаторов, использующих наборы навыков, эта функция недоступна в тарифах «Бесплатный», «Базовый», S1 и S3 HD. |
Зоны доступности | Недоступно на уровне "Бесплатный" или "Базовый". |
Семантический рангер | Недоступен в категории "Бесплатный". |
Качество работы ресурсоемких функций может быть недостаточным, если не выделить достаточную емкость. Например, при обогащении с помощью ИИ у ряда навыков, работающих на протяжении длительного времени, истекает время ожидания на уровне служб "Бесплатный", кроме случаев, когда набор данных небольшой.
Верхние пределы
Уровни определяют максимальное хранилище самой службы, а также максимальное количество индексов, индексаторов, источников данных, наборов навыков и карт синонимов, которые можно создать. Для полного списка всех ограничений см. Ограничения в Azure AI Search.
Размер и скорость раздела
Ценовая категория содержит сведения о хранилище на раздел, которое составляет от 15 ГБ для уровня "Базовый" до 2 ТБ для уровня Storage Optimized (L2). Другие аппаратные характеристики, такие как скорость операций, задержка и скорость передачи, не публикуются, но уровни, предназначенные для конкретных архитектур решений, основаны на оборудовании, которое имеет функции для поддержки этих сценариев. Дополнительные сведения о секциях см. в статье "Оценка емкости и надежность" в службе "Поиск ИИ Azure" и управление ими.
Примечание.
В апреле 2024 года в некоторых регионах стали доступны разделы жестких дисков с более высокой емкостью. В мае 2024 года была выпущена вторая волна разделов большей емкости. Если у вас есть более старая служба поиска, вы можете обновить службу , чтобы воспользоваться большей емкостью с той же ставкой выставления счетов.
Тарифы за обслуживание
Тарифы различаются в зависимости от ценовой категории: в категориях, предусматривающих более дорогостоящие оборудование или функции, тарифы выше. Ставку тарифного уровня можно найти на страницах цен Azure для Azure ИИ Поиск.
После создания службы тариф складывается из фиксированной стоимости круглосуточной работы службы и добавочной стоимости в случае, если вы решите добавить емкость.
Вычислительные ресурсы выделяются службам поиска в форме разделов (хранилища) и реплик (экземпляров обработчика запросов). Изначально создается служба с одним разделом и одной репликой, а тариф включает оба эти ресурса. Однако при масштабировании емкости затраты повышаются или понижаются с шагом приращения, зависящим от тарифа.
Это показывается в следующем примере. Пусть действует гипотетический тариф, равный 100 долларам в месяц. Если служба поиска работает на исходном уровне емкости, т. е. с одним разделом и одной репликой, то можно ожидать, что в конце месяца вы заплатите те же 100 долларов. Если же вы добавите две дополнительные реплики, чтобы обеспечить высокую доступность, сумма ежемесячного счета вырастет до 300 долларов (100 долларов за первую пару реплики и раздела, а также 200 долларов за две реплики).
Эта модель выставления счетов основана на концепции применения тарифа к единицам поиска (SU), используемым службой поиска. Изначально все службы настраиваются на одну SU, но вы можете увеличить их количество, добавив разделы или реплики для обработки более интенсивных рабочих нагрузок. Дополнительные сведения см. в статье "Как оценить затраты на поисковую службу".
Изменения уровня
Службы можно переключать между уровнями "Базовый" и "Стандартный" (S1, S2 и S3). В настоящее время можно переключаться только с нижнего уровня на более высокий уровень, например переход с уровня "Базовый" на S1. Регион также не может иметь ограничения емкости на более высоком уровне. Дополнительные сведения см. в разделе "Изменение ценовой категории".
Если вы хотите переключиться на более низкий уровень или на другой уровень, отличный от перечисленных ранее, подход:
Создайте новую службу поиска на новом уровне.
Разместите содержимое поиска на новый сервис. Выполните этот контрольный список , чтобы убедиться, что у вас есть все содержимое.
Удалите старую службу поиска, если вы уверены, что она больше не нужна.
Для больших индексов, которые вы не хотите перестроить с нуля, рассмотрите возможность использования одного из примеров резервного копирования и восстановления для их перемещения:
- Пример резервного копирования и восстановления (C#)
- Пример резервного копирования и восстановления (Python)
- Максимальное резервное копирование и восстановление индекса (Python)
Следующие шаги
Лучший способ выбрать ценовую категорию — начать с минимальной ценовой категории, а затем основывайтесь на опыте и тестировании, чтобы принимать решение сохранить услугу или перейти на более высокую категорию.
Для следующих действий рекомендуется создать службу поиска на уровне, которая может соответствовать уровню тестирования, который вы предлагаете выполнить, а затем ознакомьтесь со следующими рекомендациями по оценке затрат и емкости: