Поделиться через


Планирование и управление затратами на службу Azure AI Search

В этой статье описывается выставление счетов за поиск ИИ Azure, включая фиксированные и переменные затраты, а также рекомендации по управлению затратами.

Перед созданием службы поиска используйте калькулятор цен Azure для оценки затрат на основе запланированной емкости и функций. Другой ресурс — это лист планирования емкости, который моделирует ожидаемый размер индекса, пропускную способность индексирования и затраты на индексирование.

По мере развития рабочей нагрузки поиска следуйте нашим советам, чтобы свести к минимуму затраты на развертывание и операцию. Можно также использовать встроенные метрики для мониторинга запросов и управления затратами для создания бюджетов, оповещений и экспорта данных.

Примечание.

Разделы с более высокой емкостью доступны по той же ставке выставления счетов для служб, созданных после апреля и мая 2024 года. Дополнительные сведения об обновлениях размера секций см. в разделе "Ограничения службы".

Описание модели выставления счетов

Поиск Azure AI предлагает как фиксированную оплату, так и оплату по мере использования. Вы оплачиваете фиксированную ставку для службы поиска до тех пор, пока она существует, а функции premium выставляются в соответствии с вашим использованием.

Затраты на поиск ИИ Azure являются лишь частью ежемесячных расходов в счете Azure. Хотя эта статья посвящена планированию затрат на поиск ИИ Azure и управлению ими, счета выставляются для всех служб Azure и ресурсов, используемых в подписке Azure, включая службы, отличные от Майкрософт.

Как взимается плата за базовую службу

При создании или использовании ресурсов для поиска начисляется плата за минимальное требуемое количество реплик и секций (R × P) по пропорциональной почасовой ставке вашей ценовой категории. По мере увеличения или уменьшения единиц поиска, изменяются и ваши издержки. Дополнительные сведения и пример модели выставления счетов см. в разделе "Тарифы выставления счетов".

Как взимается плата за функции premium

В дополнение к базовой стоимости службы поиска взимается плата за функции premium. В следующей таблице перечислены функции premium и их единицы выставления счетов. Все эти функции являются необязательными, поэтому если вы не используете их, вы не несете никаких расходов.

Функция Единица выставления счетов
Извлечение изображений (обогащение ИИ) 1 На 1000 изображений. Дополнительные сведения см. на странице цен.
Навык поиска пользовательских объектов (обогащение ИИ) На 1000 текстовых записей. Откройте страницу цен
Встроенные или настраиваемые навыки (обогащение ИИ) 2 Количество транзакций. Плата взимается по тарифу поставщика моделей: службы ИИ Azure, Azure OpenAI или Azure AI Foundry.
Векторизаторы2 Число операций векторизации. Плата взимается по тарифу поставщика моделей: Azure AI Vision, Azure OpenAI или Azure AI Foundry.
Семантический рангер Количество запросов queryType=semantic. Выставляется по прогрессивной ставке. Дополнительные сведения см. на странице цен.
Общая приватная ссылка Плата за пропускную способность взимается до тех пор, пока совместно используемая частная ссылка существует и используется.

1 Относится к изображениям, извлеченным из файла в конвейере индексатора. Извлечение текста бесплатно. С вас будут взиматься деньги за извлечение изображений при включении параметра indexAction или при вызове функции извлечения документов.

2 Плата за модели Azure OpenAI и модели Azure AI Foundry отображаются в счете за эти службы.

Как взимается плата в остальных случаях

В зависимости от конфигурации и использования могут применяться следующие расходы:

Примечание.

Плата не взимается за количество полнотекстовых и векторных запросов, ответов на запросы или за обработку документов. Однако ограничения служб применяются к каждой ценовой категории.

Оценка и планирование затрат

Используйте калькулятор цен Azure , чтобы оценить базовые затраты на поиск ИИ Azure. При создании службы можно также найти предполагаемые затраты и сравнения по уровням на странице "Выбор ценовой категории ".

Для первоначального тестирования рекомендуется создать лист планирования емкости. Лист помогает понять отношение индекса к источнику и влияние обогащения или векторных функций как на емкость, так и на затраты.

Чтобы создать лист планирования емкости, выполните приведенные ниже действия.

  1. Индексируйте небольшой пример (1–5%) ваших данных. Включите любые навыки OCR, обогащения или внедрения, которые вы планируете использовать.

  2. Измеряйте размер индекса, пропускную способность индексирования и затраты на индексирование.

  3. Экстраполируйте результаты для оценки полномасштабных требований к данным.

Минимизация затрат

Чтобы свести к минимуму затраты на решение поиска ИИ Azure, используйте следующие стратегии.

Развертывание и конфигурация

  • Создайте службу поиска в регионе с большим объемом хранилища на секцию.

  • Создайте все связанные ресурсы Azure в одном регионе (или как можно меньше регионов), чтобы свести к минимуму или исключить расходы на пропускную способность.

  • Выберите самую легкую ценовую категорию , которая соответствует вашим потребностям. Базовый и S1 предлагают полный доступ к современному API с наименьшей почасовой ставкой за SU.

  • Используйте веб-приложения Azure для внешнего приложения, чтобы хранить запросы и ответы в пределах границ центра обработки данных.

Масштабирование

  • Добавляйте разделы только при необходимости размера индекса или пропускной способности загрузки.

  • Добавьте реплики только при увеличении количества запросов в секунду, если сложные запросы замедляют работу службы или когда требуется высокая доступность.

  • Увеличение масштаба для операций с большим объемом ресурсов, таких как индексирование, а затем перенастраивание вниз для обычных рабочих нагрузок запросов.

  • Написание кода для автоматизации масштабирования для прогнозируемых шаблонов рабочих нагрузок.

  • Помните, что емкость и цены не являются линейными. Удвоение емкости более чем удваивает затраты на том же уровне. Для повышения производительности по аналогичной цене рекомендуется перейти на более высокий уровень.

Индексирование и обогащение

Мониторинг затрат

На уровне обслуживания можно отслеживать встроенные метрики для запросов в секунду (QPS), задержку поиска, регулирование запросов и размер индекса. Затем можно создать панель мониторинга Azure Monitor , которая накладывает QPS, задержку и данные затрат, чтобы определить, когда следует добавлять или удалять реплики.

На уровне подписки или группы ресурсов управление затратами предоставляет средства для отслеживания, анализа и контроля затрат. Управление затратами можно использовать для:

  • Создайте бюджеты, определяющие и отслеживающие ход выполнения по ограничениям расходов. Для более детального мониторинга настройте бюджеты с помощью фильтров для определенных ресурсов Или служб Azure. Фильтры препятствуют случайному созданию ресурсов, которые требуют дополнительных затрат.

  • Создайте оповещения, которые автоматически уведомляют заинтересованных лиц об аномалиях расходов или рисках перерасхода. Оповещения основываются на расходах по сравнению с пороговыми значениями бюджета и затрат. Бюджеты и оповещения создаются для подписок и групп ресурсов, что делает их полезными для мониторинга общих затрат.

  • Экспорт данных затрат в учетную запись хранения. Это полезно, если вам или другим пользователям необходимо выполнить более дорогостоящий анализ. Например, специалисты по финансам могут анализировать данные с помощью Excel или Power BI. Можно экспортировать данные о затратах ежедневно, еженедельно или ежемесячно и задать настраиваемый диапазон дат. Экспорт данных затрат — это рекомендуемый метод для получения наборов данных затрат.

Вопросы и ответы

Можно ли временно закрыть службу поиска, чтобы сэкономить на затратах?

Поиск работает в виде непрерывной службы. Выделенные ресурсы всегда работают и выделены для вашего эксклюзивного использования на протяжении всего срока действия вашей услуги. Чтобы полностью остановить выставление счетов, необходимо удалить службу. Удаление службы является необратимой операцией и ведет к удалению связанных с ней данных.

Можно ли изменить тариф выставления счетов (уровень) существующей службы поиска?

Существующие службы можно переключать между уровнями "Базовый" и "Стандартный" (S1, S2 и S3). В настоящее время можно переключаться только с нижнего уровня на более высокий уровень, например переход с уровня "Базовый" на S1. Дополнительные сведения см. в разделе "Изменение ценовой категории".