Примечание
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В этой статье описывается выставление счетов за поиск ИИ Azure, включая фиксированные и переменные затраты, а также рекомендации по управлению затратами.
Перед созданием службы поиска используйте калькулятор цен Azure для оценки затрат на основе запланированной емкости и функций. Другой ресурс — это лист планирования емкости, который моделирует ожидаемый размер индекса, пропускную способность индексирования и затраты на индексирование.
По мере развития рабочей нагрузки поиска следуйте нашим советам, чтобы свести к минимуму затраты на развертывание и операцию. Можно также использовать встроенные метрики для мониторинга запросов и управления затратами для создания бюджетов, оповещений и экспорта данных.
Примечание.
Разделы с более высокой емкостью доступны по той же ставке выставления счетов для служб, созданных после апреля и мая 2024 года. Дополнительные сведения об обновлениях размера секций см. в разделе "Ограничения службы".
Описание модели выставления счетов
Поиск Azure AI предлагает как фиксированную оплату, так и оплату по мере использования. Вы оплачиваете фиксированную ставку для службы поиска до тех пор, пока она существует, а функции premium выставляются в соответствии с вашим использованием.
Затраты на поиск ИИ Azure являются лишь частью ежемесячных расходов в счете Azure. Хотя эта статья посвящена планированию затрат на поиск ИИ Azure и управлению ими, счета выставляются для всех служб Azure и ресурсов, используемых в подписке Azure, включая службы, отличные от Майкрософт.
Как взимается плата за базовую службу
При создании или использовании ресурсов для поиска начисляется плата за минимальное требуемое количество реплик и секций (R × P) по пропорциональной почасовой ставке вашей ценовой категории. По мере увеличения или уменьшения единиц поиска, изменяются и ваши издержки. Дополнительные сведения и пример модели выставления счетов см. в разделе "Тарифы выставления счетов".
Как взимается плата за функции premium
В дополнение к базовой стоимости службы поиска взимается плата за функции premium. В следующей таблице перечислены функции premium и их единицы выставления счетов. Все эти функции являются необязательными, поэтому если вы не используете их, вы не несете никаких расходов.
Функция | Единица выставления счетов |
---|---|
Извлечение изображений (обогащение ИИ) 1 | На 1000 изображений. Дополнительные сведения см. на странице цен. |
Навык поиска пользовательских объектов (обогащение ИИ) | На 1000 текстовых записей. Откройте страницу цен |
Встроенные или настраиваемые навыки (обогащение ИИ) 2 | Количество транзакций. Плата взимается по тарифу поставщика моделей: службы ИИ Azure, Azure OpenAI или Azure AI Foundry. |
Векторизаторы2 | Число операций векторизации. Плата взимается по тарифу поставщика моделей: Azure AI Vision, Azure OpenAI или Azure AI Foundry. |
Семантический рангер | Количество запросов queryType=semantic . Выставляется по прогрессивной ставке. Дополнительные сведения см. на странице цен. |
Общая приватная ссылка | Плата за пропускную способность взимается до тех пор, пока совместно используемая частная ссылка существует и используется. |
1 Относится к изображениям, извлеченным из файла в конвейере индексатора. Извлечение текста бесплатно. С вас будут взиматься деньги за извлечение изображений при включении параметра indexAction
или при вызове функции извлечения документов.
2 Плата за модели Azure OpenAI и модели Azure AI Foundry отображаются в счете за эти службы.
Как взимается плата в остальных случаях
В зависимости от конфигурации и использования могут применяться следующие расходы:
Трафик данных может привести к затратам на сеть. См. цены на пропускную способность.
Некоторые функции уровня "Премиум", такие как хранилища знаний, сеансы отладки и кэши обогащения, зависят от службы хранилища Azure и затраты на хранение. Плата за эти функции отображается в счете службы хранилища Azure.
Управляемые клиентом ключи, обеспечивающие двойное шифрование конфиденциального содержимого, требуют оплачиваемого хранилища ключей Azure.
Набор навыков может включать встроенные оплачиваемые навыки, встроенные неоплачиваемые служебные навыки и пользовательские навыки. Неоплачиваемые вспомогательные навыки включают условный, формирователь, слияние текста и разделение текста. У них нет требования к ключу API или ограничение на 20 документов.
Пользовательский навык — это предлагаемая вами функциональность. Пользовательские навыки оплачиваются только в том случае, если они вызывают другие оплачиваемые сервисы. У них нет требования к ключу API или ограничение на 20 документов.
Примечание.
Плата не взимается за количество полнотекстовых и векторных запросов, ответов на запросы или за обработку документов. Однако ограничения служб применяются к каждой ценовой категории.
Оценка и планирование затрат
Используйте калькулятор цен Azure , чтобы оценить базовые затраты на поиск ИИ Azure. При создании службы можно также найти предполагаемые затраты и сравнения по уровням на странице "Выбор ценовой категории ".
Для первоначального тестирования рекомендуется создать лист планирования емкости. Лист помогает понять отношение индекса к источнику и влияние обогащения или векторных функций как на емкость, так и на затраты.
Чтобы создать лист планирования емкости, выполните приведенные ниже действия.
Индексируйте небольшой пример (1–5%) ваших данных. Включите любые навыки OCR, обогащения или внедрения, которые вы планируете использовать.
Измеряйте размер индекса, пропускную способность индексирования и затраты на индексирование.
Экстраполируйте результаты для оценки полномасштабных требований к данным.
Минимизация затрат
Чтобы свести к минимуму затраты на решение поиска ИИ Azure, используйте следующие стратегии.
Развертывание и конфигурация
Создайте службу поиска в регионе с большим объемом хранилища на секцию.
Создайте все связанные ресурсы Azure в одном регионе (или как можно меньше регионов), чтобы свести к минимуму или исключить расходы на пропускную способность.
Выберите самую легкую ценовую категорию , которая соответствует вашим потребностям. Базовый и S1 предлагают полный доступ к современному API с наименьшей почасовой ставкой за SU.
Используйте веб-приложения Azure для внешнего приложения, чтобы хранить запросы и ответы в пределах границ центра обработки данных.
Масштабирование
Добавляйте разделы только при необходимости размера индекса или пропускной способности загрузки.
Добавьте реплики только при увеличении количества запросов в секунду, если сложные запросы замедляют работу службы или когда требуется высокая доступность.
Увеличение масштаба для операций с большим объемом ресурсов, таких как индексирование, а затем перенастраивание вниз для обычных рабочих нагрузок запросов.
Написание кода для автоматизации масштабирования для прогнозируемых шаблонов рабочих нагрузок.
Помните, что емкость и цены не являются линейными. Удвоение емкости более чем удваивает затраты на том же уровне. Для повышения производительности по аналогичной цене рекомендуется перейти на более высокий уровень.
Индексирование и обогащение
Используйте добавочное индексирование для обработки только новых или измененных данных.
Используйте кэширование обогащения и хранилище знаний для повторного использования ранее обогащенного содержимого. Хотя кэширование приводит к расходам на хранение, оно снижает совокупную стоимость обогащения ИИ.
Держите векторные данные сжатыми. Рекомендации по поиску векторов см. в рекомендациях по сжатие векторов.
Мониторинг затрат
На уровне обслуживания можно отслеживать встроенные метрики для запросов в секунду (QPS), задержку поиска, регулирование запросов и размер индекса. Затем можно создать панель мониторинга Azure Monitor , которая накладывает QPS, задержку и данные затрат, чтобы определить, когда следует добавлять или удалять реплики.
На уровне подписки или группы ресурсов управление затратами предоставляет средства для отслеживания, анализа и контроля затрат. Управление затратами можно использовать для:
Создайте бюджеты, определяющие и отслеживающие ход выполнения по ограничениям расходов. Для более детального мониторинга настройте бюджеты с помощью фильтров для определенных ресурсов Или служб Azure. Фильтры препятствуют случайному созданию ресурсов, которые требуют дополнительных затрат.
Создайте оповещения, которые автоматически уведомляют заинтересованных лиц об аномалиях расходов или рисках перерасхода. Оповещения основываются на расходах по сравнению с пороговыми значениями бюджета и затрат. Бюджеты и оповещения создаются для подписок и групп ресурсов, что делает их полезными для мониторинга общих затрат.
Экспорт данных затрат в учетную запись хранения. Это полезно, если вам или другим пользователям необходимо выполнить более дорогостоящий анализ. Например, специалисты по финансам могут анализировать данные с помощью Excel или Power BI. Можно экспортировать данные о затратах ежедневно, еженедельно или ежемесячно и задать настраиваемый диапазон дат. Экспорт данных затрат — это рекомендуемый метод для получения наборов данных затрат.
Вопросы и ответы
Можно ли временно закрыть службу поиска, чтобы сэкономить на затратах?
Поиск работает в виде непрерывной службы. Выделенные ресурсы всегда работают и выделены для вашего эксклюзивного использования на протяжении всего срока действия вашей услуги. Чтобы полностью остановить выставление счетов, необходимо удалить службу. Удаление службы является необратимой операцией и ведет к удалению связанных с ней данных.
Можно ли изменить тариф выставления счетов (уровень) существующей службы поиска?
Существующие службы можно переключать между уровнями "Базовый" и "Стандартный" (S1, S2 и S3). В настоящее время можно переключаться только с нижнего уровня на более высокий уровень, например переход с уровня "Базовый" на S1. Дополнительные сведения см. в разделе "Изменение ценовой категории".