Разверните расширение для предварительного просмотра Edge RAG, активируемого с помощью Azure Arc.

После выполнения необходимых действий выполните действия, описанные в этой статье, чтобы развернуть расширение Edge RAG.

Чтобы попробовать Edge RAG без необходимости использования локального оборудования, см. краткое руководство. Установка предварительной версии RAG Edge с поддержкой Azure Arc.

Это важно

Предварительная версия RAG Edge, включенная Azure Arc в настоящее время в предварительной версии. Ознакомьтесь с Дополнительными условиями использования для предварительных версий Microsoft Azure, чтобы узнать юридические условия, применимые к функциям Azure, которые находятся в статусе бета, предварительного просмотра или иначе еще не выпущены в общий доступ.

Предпосылки

Прежде чем приступить к работе, выполните предварительные требования к развертыванию для предварительной версии RAG Edge.

Развертывание расширения

Разверните Edge RAG с помощью портала Azure или Azure CLI, используя предоставленную языковую модель Edge RAG или собственную языковую модель.

  1. На портале Azure перейдите к кластеру Azure Kubernetes в локальной среде Azure.

  2. Выберите Параметры>, Расширения>, Добавить и Edge RAG из списка.

    Снимок экрана расширений, которые можно добавить из кластера с выделенным Edge RAG.

  3. На вкладке Основные сведения укажите следующую информацию.

    Поле Ценность
    Подписка Выберите подписку, содержащую кластер Службы Azure Kubernetes (AKS) в локальной среде Azure.
    Группа ресурсов Выберите группу ресурсов, содержащую кластер AKS Arc.
    Deployment name (Имя развертывания) Укажите имя развертывания.
    Регион Выберите регион для развертывания Edge RAG.
    Кластер Выберите кластер, в который требуется развернуть RAG Edge.

    Снимок экрана: вкладка

  4. Нажмите кнопку "Далее": конфигурация.

  5. На вкладке "Конфигурация" укажите следующие сведения:

    Поле Ценность
    Режим развертывания Выберите режим GPU или режим ЦП в зависимости от доступного оборудования.
    Модель Сведения, которые вы вводите в этом разделе, зависят от выбранной языковой модели.
    Источник языковой модели Выберите языковую модель, которую требуется развернуть. Выберите языковую модель, предоставляемую Edge RAG, или приведите собственную языковую модель (BYOM).
    Имя языковой модели Если вы решили использовать предоставленную модель, выберите одну из языковых моделей, предоставляемых edge RAG.
    Добавление собственной языковой модели Если вы решили принести собственную языковую модель, введите следующие сведения.
    Имя модели Введите имя языковой модели.
    Конечная точка LLM Введите имя конечной точки большой языковой модели (LLM) в формате http://some-endpoint или https://some-endpoint. Например: https://<Endpoint_Name>.openai.azure.com/openai/deployments/<model_name> /chat/completions?api-version=<API_VERSION>.
    Максимальный токен (k) Введите диапазон чисел от 4K до 2048 K для языковой модели.
    Параметры SSL
    SSL CNAME Укажите доменное имя для вашей системы. Это доменное имя совпадает с URI перенаправления, предоставленным во время регистрации приложения.
    Имя секрета SSL Kubernetes Укажите понятное имя секрета SSL, используемого приложением. По умолчанию Edge RAG использует самозаверяющий SSL-сертификат для хранения под этим именем в хранилище секретов Kubernetes. После установки сертификат можно обновить с помощью официального подписанного сертификата.
    Открыть
    Идентификатор приложения Entra Укажите идентификатор приложения из приложения, которое вы зарегистрировали в рамках настройки проверки подлинности (Регистрация приложений > Ваше приложение > Обзор).
    Идентификатор клиента Entra Укажите идентификатор арендатора из приложения, зарегистрированного в рамках настройки проверки подлинности (регистрация приложений > Ваше приложение > Общие сведения).

    Снимок экрана: вкладка конфигурации, в которой выбран тип модели и другие конфигурации.

  6. Выберите Review + create.

  7. Проверьте и подтвердите предоставленные параметры.

  8. Выберите «Создать», чтобы завершить развертывание RAG Edge.

  9. После завершения развертывания в разделе "Расширения" убедитесь, что перечислены типы расширений microsoft.arc.rag и microsoft.extensiondiagnostics .

Развертывание расширения RAG Edge обычно занимает около 30 минут, но может занять больше времени в зависимости от подключения.

Создание собственной языковой модели

Если вы добавили собственную языковую модель при развертывании расширения RAG Edge, выполните действия, описанные в разделе "Настройка проверки подлинности конечной точки BYOM" для edge RAG.