Поделиться через


Использование моделей основы Open Source, которые курируются Машинное обучение Azure

В этой статье вы узнаете, как настроить, оценить и развернуть базовые модели в каталоге моделей.

Вы можете быстро протестировать любую предварительно обученную модель с помощью формы вывода образца на карточке модели, предоставляя собственные примеры входных данных для тестирования результата. Кроме того, карточка модели для каждой модели содержит краткое описание модели и ссылки на примеры для вывода на основе кода, тонкой настройки и оценки модели.

Как оценить базовые модели с помощью собственных тестовых данных

Вы можете оценить базовую модель для тестового набора данных, используя форму оценки пользовательского интерфейса или используя примеры на основе кода, связанные с карточкой модели.

Оценка с помощью студии

Вы можете вызвать форму "Оценка модели", нажав кнопку "Оценить " на карточке модели для любой базовой модели.

Снимок экрана: форма параметров оценки после того, как пользователь выбирает кнопку оценки на карточке модели для базовой модели.

Вы можете оценить каждую модель для конкретной задачи вывода, для которую используется модель.

Тестовые данные:

  1. Передайте тестовые данные, которые вы хотите использовать для оценки модели. Вы можете отправить локальный файл (в формате JSONL) или выбрать существующий зарегистрированный набор данных из рабочей области.
  2. После выбора набора данных необходимо сопоставить столбцы из входных данных на основе схемы, необходимой для задачи. Например, сопоставлять имена столбцов, соответствующие ключам "предложение" и "метка" для классификации текста

Снимок экрана: карта оценки в базовой модели оценки формы.

Вычисления.

  1. Укажите Машинное обучение Azure вычислительный кластер, который вы хотите использовать для точной настройки модели. Оценка должна выполняться на вычислительных ресурсах GPU. Убедитесь, что у вас есть достаточная квота вычислений для используемых номеров SKU вычислений.

  2. Нажмите кнопку " Готово " в форме "Оценка", чтобы отправить задание оценки. После завершения задания можно просмотреть метрики оценки для модели. На основе метрик оценки вы можете решить, хотите ли вы точно настроить модель с помощью собственных обучающих данных. Кроме того, можно решить, хотите ли вы зарегистрировать модель и развернуть ее в конечной точке.

Оценка с помощью примеров на основе кода

Чтобы приступить к оценке модели, мы предоставляем примеры (как записные книжки Python, так и примеры CLI) в примерах оценки в репозитории Git в azureml-examples. Каждая карточка модели также ссылается на примеры оценки для соответствующих задач

Настройка базовых моделей с помощью собственных обучающих данных

Чтобы повысить производительность модели в рабочей нагрузке, может потребоваться выполнить тонкую настройку базовой модели, используя собственные обучающие данные. Эти базовые модели можно легко настроить с помощью параметров точной настройки в студии или с помощью примеров на основе кода, связанных с картой модели.

Точное настройка с помощью студии

Вы можете вызвать форму параметров точной настройки, нажав кнопку "Точно настроить" на карточке модели для любой базовой модели.

Настройка параметров:

Снимок экрана: параметры тонкой настройки в форме параметров тонкой настройки базовых моделей.

Тип задачи точной настройки

  • Каждая предварительно обученная модель из каталога моделей может быть точно настроена для определенного набора задач (например, классификация текста, классификация маркеров, ответы на вопросы). Выберите задачу, используемую в раскрывающемся списке.

Обучающие данные

  1. Передайте обучающие данные, которые вы хотите использовать для точной настройки модели. Вы можете отправить локальный файл (в формате JSONL, CSV или TSV) или выбрать существующий зарегистрированный набор данных из рабочей области.

  2. Выбрав набор данных, необходимо сопоставить столбцы из входных данных на основе схемы, необходимой для задачи. Например: сопоставление имен столбцов, соответствующих ключам "предложение" и "метка" для классификации текста

Снимок экрана: схема точной настройки в мастере оценки базовых моделей.

  • Данные проверки: передайте данные, которые вы хотите использовать для проверки модели. При выборе автоматического разделения резервируется автоматическое разделение обучающих данных для проверки. Кроме того, можно предоставить другой набор данных проверки.
  • Тестовые данные. Передайте тестовые данные, которые вы хотите использовать для оценки точно настроенной модели. При выборе автоматического разделения резервируется автоматическое разделение обучающих данных для тестирования.
  • Вычисление. Укажите Машинное обучение Azure вычислительный кластер, который вы хотите использовать для точной настройки модели. Для точной настройки необходимо выполнить вычислительные ресурсы GPU. При точной настройке рекомендуется использовать вычислительные номера SKU с gpu A100 / V100. Убедитесь, что у вас есть достаточная квота вычислений для используемых номеров SKU вычислений.
  1. Нажмите кнопку "Готово " в форме точной настройки, чтобы отправить задание точной настройки. После завершения задания можно просмотреть метрики оценки для точно настроенной модели. Затем можно зарегистрировать выходные данные точно настроенной модели с помощью задания тонкой настройки и развернуть эту модель в конечной точке для вывода.

Настройка с помощью примеров на основе кода

В настоящее время Машинное обучение Azure поддерживает тонкую настройку моделей для следующих языковых задач.

  • Классификация текстов
  • Классификация токенов
  • Ответы на вопросы
  • Сводка
  • Перевод текста

Чтобы пользователи могли быстро приступить к настройке, мы опубликовали примеры (как записные книжки Python, так и примеры ИНТЕРФЕЙСА командной строки) для каждой задачи в примерах репозитория Git для azureml-examples. Каждая карточка модели также содержит ссылки на примеры тонкой настройки для поддерживаемых задач тонкой настройки.

Развертывание базовых моделей в конечных точках для вывода

Вы можете развернуть базовые модели (предварительно обученные модели из каталога моделей и точно настроенных моделей, после регистрации в рабочей области) в конечную точку, которую затем можно использовать для вывода. Поддерживается развертывание как в стандартных развертываниях, так и в управляемых вычислительных средах. Эти модели можно развернуть с помощью мастера развертывания пользовательского интерфейса или с помощью примеров на основе кода, связанных с карточкой модели.

Развертывание с помощью студии

Вы можете вызвать форму развертывания пользовательского интерфейса, нажав кнопку "Развернуть" на карточке модели для любой базовой модели и выбрав стандартное развертывание с помощью безопасности содержимого ИИ Azure или управляемых вычислений без безопасности содержимого ИИ Azure.

Снимок экрана: кнопка развертывания на карточке базовой модели.

Параметры развертывания

Так как скрипт оценки и среда автоматически включены в базовую модель, необходимо указать номер SKU виртуальной машины для использования, количество экземпляров и имя конечной точки, используемое для развертывания.

Снимок экрана: параметры развертывания на карточке базовой модели после нажатия кнопки развертывания пользователем.

Общая квота

Если вы развертываете модель Llama-2, Phi, Nemotron, Mistral, Dolly или Deci-DeciLM из каталога моделей, но не имеет достаточно квоты для развертывания, Машинное обучение Azure позволяет использовать квоту из общего пула квот в течение ограниченного времени. Для получения дополнительной информации по общим квотам см. Общие квоты службы "Машинное обучение" Azure.

Снимок экрана: параметр для временного развертывания модели Llama с использованием общей квоты.

Развертывание с помощью примеров на основе кода

Чтобы быстро начать развертывание и выполнение выводов, мы предоставляем примеры для инференса в репозитории azureml-examples на GitHub. Опубликованные примеры включают записные книжки Python и примеры ИНТЕРФЕЙСА командной строки. Каждая карточка модели также ссылается на примеры вывода для вывода в режиме реального времени и пакетного вывода.

Импорт базовых моделей

Если вы ищете каталог моделей и не найдете нужную модель с открытым исходным кодом, ее можно импортировать из Hugging Face в рабочую область Машинного обучения Azure. Кнопка импорта отображается в каталоге моделей только в том случае, если поиск не возвращает результатов.

Hugging Face — это библиотека с открытым исходным кодом для обработки естественного языка (NLP), которая предоставляет предварительно обученные модели для популярных задач NLP. В настоящее время поддерживается импорт моделей для следующих задач, если модель соответствует требованиям, перечисленным в записной книжке импорта модели:

  • Маска заливки
  • Классификация маркеров
  • Ответы на вопросы
  • резюмирование
  • Создание текста
  • Классификация текстов
  • перевод;
  • Классификация изображений
  • Текст к изображению

Примечание.

Модели из Hugging Face применяются к сторонним условиям лицензии, доступным на странице сведений об обнимаемой модели лица. Вы несете ответственность за соблюдение условий лицензии модели.

Когда поиск не возвращает результатов, выберите «Импорт записной книжки модели» для использования записной книжки импорта модели.

Снимок экрана: кнопка импорта модели, отображаемая при поиске, не возвращает результатов в каталоге базовых моделей.

Записная книжка импорта модели также включена в репозиторий Git azureml-examples здесь.

Чтобы импортировать модель, необходимо передать MODEL_ID модель из Hugging Face. Просмотрите модели в концентраторе распознавания лиц Hugging и определите модель для импорта. Убедитесь, что тип задачи модели является одним из поддерживаемых типов задач. Скопируйте идентификатор модели, который доступен в URI страницы или можно скопировать с помощью значка копирования рядом с именем модели. Назначьте его переменной "MODEL_ID" в записной книжке импорта модели. Например:

Снимок экрана, показывающий пример идентификатора модели Hugging Face ('bert-base-uncased'), как он отображается на странице документации по модели Hugging Face.

Для выполнения импорта модели необходимо предоставить вычислительные ресурсы. Выполнение импорта модели приводит к импорту указанной модели из hugging Face и зарегистрировано в рабочей области Машинное обучение Azure. Затем эту модель можно настроить или развернуть в конечной точке для вывода.

Подробнее