реестры Машинное обучение для MLOps
В этой статье описывается, как Машинное обучение Azure реестры отделяют ресурсы машинного обучения от рабочих областей, позволяя использовать MLOps в средах разработки, тестирования и рабочей среды. Ваши среды могут отличаться в зависимости от сложности ИТ-систем. Следующие факторы влияют на количество и тип необходимых сред:
- Политики безопасности и соответствия требованиям. Рабочие среды могут быть изолированы от сред разработки с точки зрения управления доступом, сетевой архитектуры и воздействия данных.
- Подписки. Среды разработки и рабочие среды часто используют отдельные подписки для выставления счетов, бюджетирования и управления затратами.
- Регионы. Возможно, вам потребуется развернуть в разных регионах Azure для поддержки требований к задержке и избыточности.
В предыдущих сценариях можно использовать разные рабочие области Машинное обучение Azure для разработки, тестирования и рабочей среды. Эта конфигурация представляет следующие потенциальные проблемы для обучения моделей и развертывания.
Возможно, вам потребуется обучить модель в рабочей области разработки, но развернуть ее в конечной точке рабочей области, возможно, в другой подписке или регионе Azure. В этом случае необходимо иметь возможность трассировать задание обучения. Например, при возникновении проблем с точностью или производительностью в рабочем развертывании необходимо проанализировать метрики, журналы, код, среду и данные, используемые для обучения модели.
Возможно, потребуется разработать конвейер обучения с тестируемыми данными или анонимными данными в рабочей области разработки, но переобучить модель с рабочими данными в рабочей рабочей области. В этом случае может потребоваться сравнить метрики обучения по образцам и рабочим данным, чтобы оптимизировать обучение с фактическими данными.
Перекрестная рабочая область MLOps с реестрами
Реестр, как репозиторий Git, отделяет ресурсы машинного обучения от рабочих областей и размещает ресурсы в центральном расположении, что делает их доступными для всех рабочих областей в организации. Реестры можно использовать для хранения и совместного использования ресурсов, таких как модели, среды, компоненты и наборы данных.
Чтобы повысить уровень моделей в средах разработки, тестирования и рабочей среды, можно начать с итеративной разработки модели в среде разработки. Если у вас хорошая модель кандидата, ее можно опубликовать в реестре. Затем модель из реестра можно развернуть в конечных точках в разных рабочих областях.
Совет
Если у вас уже есть модели, зарегистрированные в рабочей области, можно повысить уровень моделей в реестр. Вы также можете зарегистрировать модель непосредственно в реестре из выходных данных задания обучения.
Чтобы разработать конвейер в одной рабочей области, а затем запустить его в других рабочих областях, сначала зарегистрируйте компоненты и среды, которые образуют стандартные блоки конвейера. При отправке задания конвейера вычислительные ресурсы и обучающие данные, уникальные для каждой рабочей области, определяют рабочую область для выполнения.
На следующей схеме показано продвижение конвейера обучения между исследовательскими и разработками рабочих областей, а затем обученное повышение уровня модели для тестирования и рабочей среды.