Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
После выполнения необходимых действий выполните действия, описанные в этой статье, чтобы развернуть расширение Edge RAG.
Чтобы попробовать Edge RAG без необходимости использования локального оборудования, см. краткое руководство. Установка предварительной версии RAG Edge с поддержкой Azure Arc.
Это важно
Предварительная версия RAG Edge, включенная Azure Arc в настоящее время в предварительной версии. Ознакомьтесь с Дополнительными условиями использования для предварительных версий Microsoft Azure, чтобы узнать юридические условия, применимые к функциям Azure, которые находятся в статусе бета, предварительного просмотра или иначе еще не выпущены в общий доступ.
Предпосылки
Прежде чем приступить к работе, выполните предварительные требования к развертыванию для предварительной версии RAG Edge.
Развертывание расширения
Разверните edge RAG с помощью портала Azure или Azure CLI с предоставленной корпорацией Майкрософт языковой модели или добавьте собственную языковую модель.
На портале Azure перейдите к кластеру Azure Kubernetes в локальной среде Azure.
Выберите Параметры>, Расширения>, Добавить и Edge RAG из списка.
На вкладке Основные сведения укажите следующую информацию.
Поле Ценность Подписка Выберите подписку, содержащую кластер Службы Azure Kubernetes (AKS) в локальной среде Azure. Группа ресурсов Выберите группу ресурсов, содержащую кластер AKS Arc. Deployment name (Имя развертывания) Укажите имя развертывания. Регион Выберите регион для развертывания Edge RAG. Кластер Выберите кластер, в который требуется развернуть RAG Edge.
Нажмите кнопку "Далее": конфигурация.
На вкладке "Конфигурация" укажите следующие сведения:
Поле Ценность Режим развертывания Выберите режим GPU или режим ЦП в зависимости от доступного оборудования. Модель Сведения, которые вы вводите в этом разделе, зависят от выбранной языковой модели. Языковая модель Выберите языковую модель, которую требуется развернуть. Выберите либо языковую модель, предоставленную корпорацией Майкрософт, либо собственную. Языковая модель Майкрософт Если вы выбрали корпорацию Майкрософт, выберите одну из предоставленных корпорацией Майкрософт языковых моделей. Добавление собственной языковой модели Если вы решили предоставить собственную языковую модель, введите следующие сведения. Имя модели Введите имя языковой модели. Конечная точка LLM Введите имя конечной точки большой языковой модели (LLM) в формате http://some-endpointилиhttps://some-endpoint. Например:https://<Endpoint_Name>.openai.azure.com/openai/deployments/<model_name> /chat/completions?api-version=<API_VERSION>.Максимальный токен (k) Введите диапазон чисел от 4K до 2048 K для языковой модели. Параметры SSL SSL CNAME Укажите доменное имя для вашей системы. Это доменное имя совпадает с URI перенаправления, предоставленным во время регистрации приложения. Имя секрета SSL Kubernetes Укажите понятное имя секрета SSL, используемого приложением. По умолчанию Edge RAG использует самозаверяющий SSL-сертификат для хранения под этим именем в хранилище секретов Kubernetes. После установки сертификат можно обновить с помощью официального подписанного сертификата. Открыть Идентификатор приложения Entra Укажите идентификатор приложения из приложения, которое вы зарегистрировали в рамках настройки проверки подлинности (Регистрация приложений > Ваше приложение > Обзор). Идентификатор клиента Entra Укажите идентификатор арендатора из приложения, зарегистрированного в рамках настройки проверки подлинности (регистрация приложений > Ваше приложение > Общие сведения).
Нажмите кнопку "Далее": проверка и создание.
Проверьте и подтвердите предоставленные параметры.
Выберите «Создать», чтобы завершить развертывание RAG Edge.
После завершения развертывания в разделе "Расширения" убедитесь, что перечислены типы расширений microsoft.arc.rag и microsoft.extensiondiagnostics .
Развертывание расширения RAG Edge обычно занимает около 30 минут, но может занять больше времени в зависимости от подключения.
Добавление собственной языковой модели
Если вы добавили собственную языковую модель при развертывании расширения RAG Edge, выполните действия, описанные в разделе "Настройка проверки подлинности конечной точки BYOM" для edge RAG.