Поделиться через


Компонент многоклассовой логистической регрессии

В этой статье описывается компонент в конструкторе Машинного обучения Azure.

Этот компонент используется для создания модели логистической регрессии, которую можно использовать для прогнозирования нескольких значений.

Классификация с применением логистической регрессии является методом управляемого обучения и, следовательно, требует размеченного набора данных. Обучение модели осуществляется путем предоставления модели и размеченного набора данных в качестве входных данных для компонента, такого как Обучение модели. Обученную модель затем можно использовать для прогнозирования новых примеров входных данных.

Машинное обучение Azure также предоставляет компонент двухклассовой логистической регрессии, который подходит для классификации двоичных или дихотомических переменных.

О мультиклассовой логистической регрессии

Логистическая регрессия — это известный статистический метод, который используется для прогнозирования вероятности результата и широко применяется в задачах классификации. Алгоритм прогнозирует вероятность возникновения события путем подгонки данных логистической функции.

В мультиклассовой логистической регрессии классификатор можно использовать для прогнозирования нескольких результатов.

Настройка мультиклассовой логистической регрессии

  1. Добавьте компонент Многоклассовая логистическая регрессия в конвейер.

  2. Укажите, как вы хотите обучать модель, выбрав значение Create trainer mode (Создать режим учителя).

    • Одиночный параметр. Используйте этот вариант, если вы знаете, как хотите настроить модель, и предоставьте определенный ряд значений в качестве аргументов.

    • Диапазон параметров: используйте этот вариант, если вы не знаете наилучшие параметры и хотите выполнить перебор параметров. Выберите диапазон значений для итерации и в процессе Настройка гиперпараметров модели выполните итерацию по всем возможным сочетаниям указанных параметров, чтобы определить гиперпараметры, которые приводят к оптимальным результатам.

  3. Отклонение оптимизации. Укажите пороговое значение для конвергенции оптимизатора. Если улучшение между итерациями меньше, чем пороговое значение, алгоритм прекращает работу и возвращает текущую модель.

  4. Вес регуляризации L1, вес регуляризации L2. Введите значение, которое будет использоваться для параметров регуляризации L1 и L2. Для обоих рекомендуется ненулевое значение.

    Регуляризация — это метод предотвращения образования лжевзаимосвязей за счет применения штрафных коэффициентов к моделям с предельными значениями. Регуляризация предполагает добавление штрафа, связанного со значениями коэффициентов, к погрешности гипотезы. К точной модели с предельными коэффициентами будет применен больший штраф. При этом для менее точной модели с более приемлемыми значениями штраф будет меньше.

    Нормализация L1 и L2 имеют различные эффекты и используются. L1 можно применять к разреженным моделям, что полезно при работе с высокомерными данными. В отличие от этого, нормализация L2 предпочтительнее для данных, которые не разрежены. Этот алгоритм поддерживает линейное сочетание значений регуляризации L1 и L2. Это означает, что, если x = L1 и y = L2, ax + by = c определяет линейный диапазон терминов регуляризации.

    Для моделей логистической регрессии, например, регуляризации эластичной сети, были применены различные линейные сочетания терминов L1 и L2.

  5. Начальное число случайных чисел. Введите целочисленное значение, которое будет использоваться в качестве начального значения для алгоритма, если необходимо, чтобы результаты были повторяемыми между выполнениями. В противном случае в качестве начального значения используется значение системных часов, что может привести к несколько различным результатам в выполнении того же конвейера.

  6. Подключите размеченный набор данных и обучите модель:

    • Если для параметра Создать режим учителя задано значение Одиночный параметр, подключите отмеченный набор данных и компонент Обучение модели.

    • Если для параметра Create trainer mode выбран вариант Parameter Range, подключите набор помеченных данных и обучите модель с помощью модуля Настройка гиперпараметров модели.

    Примечание.

    При передаче диапазона параметров в модуль Обучение модели используется только значение по умолчанию в списке с одиночным параметром.

    Если передать в компонент Настройка гиперпараметров модели один набор значений параметров, когда он ожидает диапазон настроек для каждого параметра, он проигнорирует эти значения и использует значения по умолчанию для средства обучения.

    Если выбран вариант Parameter Range (Диапазон параметров) и указано одно значение для любого параметра, это единственное заданное значение будет использоваться во время очистки, даже если другие параметры меняются в диапазоне значений.

  7. Отправьте конвейер.

Следующие шаги

Ознакомьтесь с набором доступных компонентов для машинного обучения Azure.