Слайд 2Обучение с учителем
Логистическая регрессия
Обучение но основе решающих деревьев
Random Forest
К –ближайших соседей
Слайд 3Логистическая регрессия
Логистическая регрессия –это линейная модель бинарной классификации.
Слайд 4 Логистическая функция (сигмоида)
Слайд 6Логистическая регрессия
функции стоимости
Слайд 9Смещение (bias) и разброс (variance)
Разброс (variance) - дисперсия ответов алгоритмов Da
Cмещение (bias) – матожидание
разности между истинным ответом и выданным алгоритмом: E(f – a).
Слайд 10Смещение (bias) и разброс (variance)
Слайд 12Регуляризация
Регуляризация - метод для обработки коллинеарности (высокой корреляции среди признаков), фильтрации шума из
данных и в конечном счете предотвращения переобучения
Слайд 15Максимизация прироста информации
Слайд 16Меры неоднородности
Энтропия
Мера неоднородности Джини
Ошибка классификации
Слайд 17Random Forest (Случайный лес)
1 шаг. Случайным образом выбрать n образцов с возвратом. (
извлечь бутсрап-выборку)
2 шаг. Построить дерево на основе данных образцов по d признаков без возврата.
Агрегировать прогноз на основе большинства голосов