Ведение журналов моделей MLflow

В этой статье описывается, как регистрировать обученные модели машинного обучения или артефакты в виде моделей MLflow. MLflow — это платформа с открытым кодом для управления рабочими процессами машинного обучения. В этой статье рассматриваются различные варианты настройки способа выполнения пакетов MLflow и запуска моделей.

Предпосылки

Пакет пакета SDK MLflow mlflow (версия 2.16.x или более ранняя версия)
Плагин MLflow для машинного обучения Azure azureml-mlflow
Пакет xgboost (версия 2.1.1 или более ранняя версия)
Пакет scikit-learn

Это важно

Машинное обучение Azure совместимо с MLflow 2.16 и более ранними версиями. MLflow 2.17 и более поздние версии вводят изменения в артефактные репозитории и API LoggedModels, которые подключаемый модуль azureml-mlflow в данный момент не поддерживает. Зафиксируйте версии MLflow и XGBoost, чтобы избежать проблем с совместимостью.

pip install "mlflow<=2.16.2" azureml-mlflow "xgboost<=2.1.1" scikit-learn

Использование автоматического ведения журналирования моделей

Используйте функцию MLflow autolog для автоматического журнала моделей. При использовании автоматического ведения журнала MLflow записывает все соответствующие метрики, параметры, артефакты и модели в вашей платформе. Данные, регистрируемые в журнал, зависят от фреймворка. По умолчанию при включении автоматического ведения журнала большинство моделей регистрируются. В некоторых ситуациях некоторые версии не ведут журнал моделей. Например, вкус PySpark не регистрирует модели, превышающие определенный размер.

Используйте либо mlflow.autolog, либо mlflow.<flavor>.autolog для активации автоматического ведения журнала. Следующий код используется autolog для регистрации модели классификатора, обученной с помощью XGBoost:

import mlflow
from xgboost import XGBClassifier
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# Load sample data and split into train/test sets.
X, y = load_breast_cancer(return_X_y=True, as_frame=True)
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42
)

mlflow.autolog()

model = XGBClassifier(eval_metric="logloss")
model.fit(X_train, y_train, eval_set=[(X_test, y_test)], verbose=False)

y_pred = model.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)

Ссылки:mlflow.autolog | XGBClassifier | accuracy_score

Примечание.

Остальные примеры кода в этой статье повторно используют переменные X_train, X_test, y_train и y_test из предыдущей настройки данных.

Совет

Если вы используете конвейеры машинного обучения, например конвейеры scikit-learn, используйте функциональные возможности этого типа конвейера для записи моделей. Ведение журнала модели автоматически выполняется при вызове fit метода в объекте конвейера. Записная книжка, которая регистрирует модель, включает предварительную обработку и использует конвейеры, см. в статье "Обучение и отслеживание классификатора XGBoost с помощью MLflow".

Почему логарифмические модели вместо артефактов?

Модели журналирования, а не необработанные артефакты, обеспечивают структурированный контракт между создателями моделей и потребителями. Подробное сравнение см. в разделе "Артефакты и модели" в MLflow.

Ведение журнала моделей обеспечивает следующие преимущества:

Вы можете использовать mlflow.<flavor>.load_model для непосредственной загрузки моделей для вывода и использовать функцию predict .
Входные данные конвейера могут использовать модели напрямую.
Модели можно развертывать без указания скрипта оценки или среды.
Swagger автоматически включается в рабочих конечных точках. В результате вы можете использовать функцию тестирования в студии машинного обучения Azure для тестирования моделей.
Вы можете использовать панель мониторинга ответственного искусственного интеллекта. Дополнительные сведения см. в статье "Использование панели мониторинга ответственного искусственного интеллекта" в студии машинного обучения Azure.

Модели журналов, использующие настраиваемую подпись, среду или примеры

Используйте метод MLflow mlflow.<flavor>.log_model для ручного журнала моделей. Этот рабочий процесс позволяет контролировать различные аспекты ведения журнала моделей.

Используйте этот метод, когда:

Необходимо указать среду Conda или пакеты pip, которые отличаются от автоматически обнаруженных пакетов или среды.
Вы хотите включить входные примеры.
В пакет необходимо включить определенные артефакты.
Метод autolog не правильно выводит подпись. Эта проблема может возникать при работе с тензорными входными данными, которые требуют, чтобы подпись была определенной фигурой.
Метод autolog не соответствует всем вашим потребностям.

Следующий код регистрирует модель классификатора XGBoost:

import mlflow
from xgboost import XGBClassifier
from sklearn.metrics import accuracy_score
from mlflow.models import infer_signature

mlflow.autolog(log_models=False)

with mlflow.start_run():
    model = XGBClassifier(eval_metric="logloss")
    model.fit(X_train, y_train, eval_set=[(X_test, y_test)], verbose=False)
    y_pred = model.predict(X_test)

    accuracy = accuracy_score(y_test, y_pred)

    # Infer the signature.
    signature = infer_signature(X_test, y_test)

    # Sample the data.
    input_example = X_train.sample(n=1)

    # Log the model manually.
    mlflow.xgboost.log_model(model, 
                             artifact_path="classifier", 
                             pip_requirements=["xgboost>=2.0"],
                             signature=signature,
                             input_example=input_example)

Ссылки:mlflow.xgboost.log_model | infer_signature

Примечание.

Вызов autolog использует конфигурацию log_models=False. Этот параметр отключает автоматическое ведение журнала моделей MLflow. Метод log_model используется позже для ручной регистрации модели.
Метод infer_signature пытается определить подпись непосредственно из входных и выходных данных.
Параметр pip_requirements задает пакеты, необходимые для модели. В качестве альтернативы можно использовать conda_env параметр с словарем или файлом YAML.

Модели журналов, использующие измененное поведение прогнозирования

При использовании mlflow.autolog или mlflow.<flavor>.log_model для регистрации модели, тип модели определяет, как выполняется вывод. Вкус также определяет, что возвращает модель. MLflow не предписывает определенное поведение относительно генерации predict результатов. В некоторых сценариях может потребоваться предварительно обработать данные или подвергнуть их последующей обработке.

В этой ситуации можно реализовать конвейеры машинного обучения, которые напрямую переходят от входных данных к выходным данным. Хотя этот тип реализации иногда может повысить производительность, это может оказаться сложной задачей. В таких случаях может быть полезно настроить способ обработки вывода модели. Дополнительные сведения см. в следующем разделе Регистрация пользовательских моделей.

Журнал пользовательских моделей

MLflow поддерживает множество платформ машинного обучения, включая CatBoost, Keras, LightGBM, ONNX, PyTorch, scikit-learn, Spark MLlib, TensorFlow, XGBoost и другие. Полный список см. в разделе Built-In "Варианты модели".

Однако может потребоваться изменить способ работы варианта или записать модель, которая не поддерживается MLflow изначально. Кроме того, может потребоваться записать модель, использующую несколько элементов из различных платформ. В таких случаях можно создать пользовательский вариант модели.

Чтобы решить проблему, MLflow предлагает версию PyFunc, стандартный интерфейс для моделей Python. Этот вариант может регистрировать любой объект как модель, если этот объект удовлетворяет двум условиям:

Вы реализуете как минимум метод predict.
Объект Python наследует от mlflow.pyfunc.PythonModel класса.

Совет

Сериализуемые модели, реализующие API scikit-learn, могут использовать модуль scikit-learn для записи модели, независимо от того, была ли модель построена с использованием scikit-learn. Если вы можете сохранить свою модель в формате Pickle, и объект имеет как минимум методы predict и predict_proba, используйте mlflow.sklearn.log_model для фиксации модели в процессе запуска MLflow.

Самый простой способ создать вкус для пользовательской модели — создать оболочку вокруг существующего объекта модели. MLflow сериализует и упаковает модель для вас. Объекты Python сериализуются, если объект может храниться в файловой системе в виде файла, как правило, в формате Pickle. Во время выполнения объект можно загрузить из этого файла. Загрузка восстанавливает все значения, свойства и методы, доступные при сохранении.

Используйте этот метод, когда:

Вы можете сериализовать вашу модель в формате «Pickle».
Вы хотите сохранить состояние модели сразу после обучения.
Вы хотите настроить способ predict работы функции.

Следующий код оборачивает модель, созданную с помощью XGBoost, так что она ведет себя иначе, чем стандартная реализация XGBoost. Он возвращает вероятности вместо классов.

from mlflow.pyfunc import PythonModel, PythonModelContext

class ModelWrapper(PythonModel):
    def __init__(self, model):
        self._model = model

    def predict(self, context: PythonModelContext, data, params=None):
        # The next line uses a prediction function. However, you could also use model.recommend(), model.forecast(), or a similar function instead.
        return self._model.predict_proba(data)

    # You can add extra functions if you need to. Because the model is serialized,
    # all of them are available when you load your model.
    def predict_batch(self, data):
        pass

Используйте следующий код для регистрации пользовательской модели во время выполнения:

import mlflow
from xgboost import XGBClassifier
from sklearn.metrics import accuracy_score
from mlflow.models import infer_signature

mlflow.xgboost.autolog(log_models=False)

with mlflow.start_run():
    model = XGBClassifier(eval_metric="logloss")
    model.fit(X_train, y_train, eval_set=[(X_test, y_test)], verbose=False)
    y_probs = model.predict_proba(X_test)

    accuracy = accuracy_score(y_test, y_probs.argmax(axis=1))
    mlflow.log_metric("accuracy", accuracy)

    signature = infer_signature(X_test, y_probs)
    mlflow.pyfunc.log_model(artifact_path="classifier", 
                            python_model=ModelWrapper(model),
                            signature=signature)

Ссылки:mlflow.pyfunc.log_model | PythonModel

Совет

В приведенном выше коде метод infer_signature использует y_probs для вывода сигнатуры. Целевой столбец содержит целевой класс, но модель возвращает две вероятности для каждого класса.

Иногда модель состоит из нескольких частей, которые необходимо загрузить. Иногда невозможно сериализовать модель в виде файла Pickle. В этих случаях используйте PythonModel класс. Он поддерживает произвольный список артефактов. Упаковайте каждый артефакт вместе с моделью.

Используйте этот метод, когда:

Вы не можете сериализовать вашу модель в формате Pickle, или у вас есть лучший формат сериализации, доступный.
У вашей модели есть один или несколько артефактов, на которые необходимо ссылаться для загрузки модели.
Вы хотите сохранить некоторые свойства конфигурации вывода, например количество рекомендуемых элементов.
Вы хотите настроить способ загрузки модели и способ работы predict функции.

В следующем коде показано, как регистрировать пользовательскую модель, использующую артефакты:

encoder_path = 'encoder.pkl'
joblib.dump(encoder, encoder_path)

model_path = 'xgb.model'
model.save_model(model_path)

mlflow.pyfunc.log_model(artifact_path="classifier", 
                        python_model=ModelWrapper(),
                        artifacts={ 
                            'encoder': encoder_path,
                            'model': model_path 
                        },
                        signature=signature)

Примечание.

Модель не сохраняется в формате Pickle. Вместо этого код сохраняет модель с помощью метода сохранения используемой платформы.
Класс ModelWrapper упаковывает модель, но модель не передается в качестве аргумента конструктору ModelWrapper .
Метод log_model имеет параметр словаря, artifacts. Его ключи содержат имена артефактов. Каждое значение содержит путь в локальной файловой системе к артефакту.

Соответствующая оболочка модели похожа на следующий код:

from mlflow.pyfunc import PythonModel, PythonModelContext

class ModelWrapper(PythonModel):
    def load_context(self, context: PythonModelContext):
        import pickle
        from xgboost import XGBClassifier
        from sklearn.preprocessing import OrdinalEncoder
        
        self._encoder = pickle.loads(context.artifacts["encoder"])
        self._model = XGBClassifier(eval_metric="logloss")
        self._model.load_model(context.artifacts["model"])

    def predict(self, context: PythonModelContext, data, params=None):
        return self._model.predict_proba(data)

Полная подпрограмма обучения выглядит примерно так, как показано в следующем коде:

import mlflow
from xgboost import XGBClassifier
from sklearn.preprocessing import OrdinalEncoder
from sklearn.metrics import accuracy_score
from mlflow.models import infer_signature

mlflow.xgboost.autolog(log_models=False)

with mlflow.start_run():
    encoder = OrdinalEncoder(
        handle_unknown='use_encoded_value', unknown_value=np.nan
    )
    X_train['thal'] = encoder.fit_transform(
        X_train['thal'].to_frame()
    )
    X_test['thal'] = encoder.transform(
        X_test['thal'].to_frame()
    )

    model = XGBClassifier(eval_metric="logloss")
    model.fit(
        X_train, y_train,
        eval_set=[(X_test, y_test)], verbose=False
    )
    y_probs = model.predict_proba(X_test)

    accuracy = accuracy_score(y_test, y_probs.argmax(axis=1))
    mlflow.log_metric("accuracy", accuracy)

    encoder_path = 'encoder.pkl'
    joblib.dump(encoder, encoder_path)
    model_path = "xgb.model"
    model.save_model(model_path)

    signature = infer_signature(X, y_probs)
    mlflow.pyfunc.log_model(
        artifact_path="classifier", 
        python_model=ModelWrapper(),
        artifacts={ 
            'encoder': encoder_path,
            'model': model_path 
        },
        signature=signature
    )

Иногда модель имеет сложную логику или загружает несколько исходных файлов во время вывода. Эта ситуация возникает, когда у вас есть библиотека Python для модели, например. В этом сценарии упакуйте библиотеку вместе с вашей моделью, чтобы они функционировали как единое целое.

Используйте этот метод, когда:

Вы не можете сериализовать вашу модель в формате Pickle, или у вас есть лучший формат сериализации, доступный.
Артефакты модели можно хранить в папке, в которой хранятся все необходимые артефакты.
Исходный код модели является сложным и требует нескольких файлов Python. Возможно, библиотека поддерживает модель.
Вы хотите настроить способ загрузки модели и работу функции predict.

MLflow поддерживает эти типы моделей. При использовании MLflow можно указать произвольный исходный код для упаковки вместе с моделью, если исходный код содержит модуль загрузчика. Модули загрузчика можно указать в вызове log_model с помощью loader_module параметра, указывающего пространство имен Python, реализующее загрузчик. Параметр code_paths также является обязательным. Он предоставляет исходные файлы, определяющие модуль загрузчика. В этом пространстве имен необходимо реализовать функцию _load_pyfunc(data_path: str), которая принимает путь к артефактам и возвращает объект, содержащий, как минимум, метод predict.

model_path = 'xgb.model'
model.save_model(model_path)

mlflow.pyfunc.log_model(artifact_path="classifier", 
                        data_path=model_path,
                        code_paths=['src'],
                        loader_module='loader_module',
                        signature=signature)

Примечание.

Модель не сохраняется в формате Pickle. Вместо этого код сохраняет модель с помощью метода сохранения используемой платформы.
Метод log_model имеет параметр, указывающий data_path на папку, в которой хранятся артефакты модели. Артефакты могут находиться в папке или файле. Артефакты упаковываются с моделью.
Метод log_model имеет параметр, указывающий code_paths на расположение исходного кода. Значение code_paths может быть путем или одним файлом. Исходный код упаковается в модель.
Функция _load_pyfunc хранится в модуле loader_module Python.

Папка src содержит loader_module.py файл. Этот файл служит модулем загрузчика и содержит следующие строки:

class MyModel():
    def __init__(self, model):
        self._model = model

    def predict(self, data):
        return self._model.predict_proba(data)

def _load_pyfunc(data_path: str):
    import os

    model = XGBClassifier(eval_metric='logloss')
    model.load_model(os.path.abspath(data_path))

    return MyModel(model)

Примечание.

Класс MyModel не наследуется, PythonModel как показано ранее. Однако она имеет функцию predict .
Исходный код модели находится в файле. Любой исходный код подходит. Папка с именем src идеально подходит в этой ситуации.
Функция _load_pyfunc возвращает экземпляр класса модели.

Полная подпрограмма обучения выглядит примерно так, как показано в следующем коде:

import mlflow
from xgboost import XGBClassifier
from sklearn.metrics import accuracy_score
from mlflow.models import infer_signature

mlflow.xgboost.autolog(log_models=False)

with mlflow.start_run():
    model = XGBClassifier(eval_metric="logloss")
    model.fit(
        X_train, y_train,
        eval_set=[(X_test, y_test)], verbose=False
    )
    y_probs = model.predict_proba(X_test)

    accuracy = accuracy_score(y_test, y_probs.argmax(axis=1))
    mlflow.log_metric("accuracy", accuracy)

    model_path = "xgb.model"
    model.save_model(model_path)

    signature = infer_signature(X_test, y_probs)
    mlflow.pyfunc.log_model(
        artifact_path="classifier",
        data_path=model_path,
        code_paths=["loader_module.py"],
        loader_module="loader_module",
        signature=signature
    )

Ссылки:mlflow.pyfunc.log_model | _load_pyfunc

Следующий шаг

Рекомендации по развертыванию моделей MLflow

Обратная связь

Были ли сведения на этой странице полезными?

Last updated on 2026-02-06

Поделиться через

Ведение журналов моделей MLflow

Предпосылки

Использование автоматического ведения журналирования моделей

Почему логарифмические модели вместо артефактов?

Модели журналов, использующие настраиваемую подпись, среду или примеры

Модели журналов, использующие измененное поведение прогнозирования

Журнал пользовательских моделей

Следующий шаг

Обратная связь

Дополнительные ресурсы