stochasticLogisticRegression
stochasticLogisticRegression
Добавлено в версии: v20.1
Функция реализует стохастическую логистическую регрессию.
Может использоваться для задач бинарной классификации, поддерживает те же пользовательские параметры, что и stochasticLinearRegression, и работает аналогично.
Использование
Функция используется в два шага:
- Обучение модели
Для подбора параметров можно использовать такой запрос:
Здесь также необходимо вставить данные в таблицу train_data.
Количество параметров не является фиксированным и зависит только от количества аргументов, переданных в logisticRegressionState.
Все они должны быть числовыми значениями.
Обратите внимание, что столбец с целевым значением (которое требуется научиться предсказывать) вставляется первым аргументом.
Прогнозируемые метки должны находиться в диапазоне [-1, 1].
- Прогнозирование
Используя сохраненное состояние, можно предсказать вероятность того, что объект имеет метку 1.
Запрос вернёт столбец с вероятностями.
Обратите внимание, что первый аргумент evalMLMethod — это объект AggregateFunctionState, а следующие — столбцы признаков.
Также можно задать границу вероятности, которая определяет принадлежность элементов к различным меткам.
Тогда результатом будут метки.
test_data — таблица, аналогичная train_data, но может не содержать целевого значения.
Синтаксис
Аргументы
learning_rate— Коэффициент, определяющий длину шага при выполнении шага градиентного спуска. Слишком большое значение может привести к бесконечным значениям весов модели. Значение по умолчанию —0.00001.Float64l2_regularization_coef— коэффициент L2-регуляризации, который помогает предотвратить переобучение. По умолчанию значение —0.1.Float64mini_batch_size— задаёт количество элементов, для которых будут вычисляться и суммироваться градиенты при выполнении одного шага градиентного спуска. Чистый стохастический спуск использует один элемент, однако использование небольших батчей (порядка 10 элементов) делает шаги градиентного спуска более стабильными. Значение по умолчанию —15.UInt64method— метод для обновления весов:Adam(по умолчанию),SGD,Momentum,Nesterov.MomentumиNesterovтребуют немного больше вычислений и памяти, однако они полезны с точки зрения скорости сходимости и устойчивости стохастических градиентных методов.Stringtarget— целевые метки бинарной классификации. Должны находиться в диапазоне [-1, 1].Floatx1, x2, ...— значения признаков (независимые переменные). Все должны быть числами.Float
Возвращаемое значение
Возвращает веса обученной модели логистической регрессии. Для получения предсказаний используйте evalMLMethod, которая возвращает вероятности того, что объект имеет метку 1. Array(Float64)
Примеры
Обучение модели
Создание прогнозов
Классификация с порогом
См. также