Системы искусственного интеллекта презентация

Октябрь 5, 2021

Главная
Информатика
Системы искусственного интеллекта

Содержание

2. План лекции Линейная регрессия со множеством переменных Метод градиентного спуска для нескольких переменных. Масштабирование признаков. Выбор
3. Линейная регрессия с одной переменной Тренировочное множество данных (скажем, всего m) Обозначения: m = число обучающих
4. Линейная регрессия с одной переменной Тренировочное множество данных (скажем, всего m) Обозначения: m = число тренировочных
5. Линейная регрессия со множеством переменных Тренировочное множество данных (скажем, всего m) Обозначения: n = число свойств/признаков/дескрипторов
6. Обозначения: n = число свойств/признаков/дескрипторов x(i) = «вход»/свойства i-го тренировочного примера (x(i), y(i)) xj(i) = j-е
7. Градиентный спуск для линейной регрессии со множеством переменных repeat until convergence { } (j = 0,
8. Градиентный спуск на практике! Масштабирование признаков Идея: привести все свойства к одному и тому же масштабу
9. Нормализация на математическое ожидание Идея: замена xj на, xj – μj с целью создания у свойств
10. Градиентный спуск на практике! 10 Отладка. Как убедиться в том, что градиентный спуск работает корректно? J(Q)
11. Полиномиальная регрессия 11 Предскажем цену на дом с использованием следующей гипотезы: hQ(x) = QTx = Q0
12. Полиномиальная регрессия 12 Полиномиальная регрессия – это тот инструмент, который близко связан с выбором новых свойств
13. Аналитическое решение 13 Метод аналитического поиска параметров Q Рассмотрим стоимостную функцию J(Q) Вычислим частные производные J(Q)
14. Нормальные уравнения Тренировочное множество данных (скажем, всего m = 4) 14 Масштабирование свойств не нужно! 2019,
15. 15 Когда, что лучше использовать? Пусть есть m тренировочных примеров и n свойств Градиентный спуск Необходим
16. Классификация. Примеры Классификация (предсказание дискретной выходной величины, например, 0 или 1) Примеры задач классификации Электронная почта
17. Классификация Размер опухоли Злокачественная опухоль? 0 (N) 1 (P) 17 Рак молочной железы (злокачественный или доброкачественный)
18. Классификация Размер опухоли Злокачественная опухоль? 0 (N) 1 (P) 18 Рак молочной железы (злокачественный или доброкачественный)
19. Классификация Размер опухоли Злокачественная опухоль? 0 (N) 1 (P) 19 Рак молочной железы (злокачественный или доброкачественный)
20. Классификация Размер опухоли Злокачественная опухоль? 0 (N) 1 (P) 20 Рак молочной железы (злокачественный или доброкачественный)
21. Классификация 21 Проблемы классификации на основе линейной регрессии с одной переменной Выход (y) задачи бинарной классификации
22. Логистическая регрессия 22 Необходимо сделать так, чтобы 0 ≤ hQ(x) ≤ 1 Для решения этой задачи
23. Интерпретация гипотезы в логистической регрессии 23 hQ(x) = оценке вероятности того, что y = 1 для
24. Граница решения (Decision Boundary) 24 z g(z) 0 1 0.5 Пусть порог классификатора hQ(x) находится в
25. Граница решения (Decision Boundary) 25 Пусть классификатор имеет вид: hQ(x) = g(Q0 + Q1x1 + Q2x2)
26. Нелинейные границы решения 26 Пусть классификатор имеет вид: hQ(x) = g(Q0 + Q1x1 + Q2x2 +
27. Стоимостная функция (Cost Function) 27 Дана тренировочная выборка {(x(1), y(1)), (x(2), y(2)), …, (x(m), y(m))}, где
28. Стоимостная функция (Cost Function) 28 Дана тренировочная выборка {(x(1), y(1)), (x(2), y(2)), …, (x(m), y(m))}, где
29. Стоимостная функция (Cost Function) 29 Дана тренировочная выборка {(x(1), y(1)), (x(2), y(2)), …, (x(m), y(m))}, где
30. Стоимостная функция (Cost Function) 30 Выбор стоимостной функции. Вариант первый! Возьмем абсолютно такую же как и
31. Стоимостная функция (Cost Function) 31 Выбор стоимостной функции. Вариант второй! Пусть стоимостная функция имеет вид: Заметим,
32. Стоимостная функция (Cost Function) 32 Выбор стоимостной функции. Вариант второй! Немного пояснений! -ln(z) z Если y
33. Стоимостная функция (Cost Function) 33 Для дальнейшего анализа стоимостную функцию для логистической регрессии удобно представить в
34. Градиентный спуск для лог. регрессии 34 repeat until convergence { } Вычислив производные получим repeat until
35. Градиентный спуск для лог. регрессии 35 repeat until convergence { } (j = 0, …, n)
36. Многоклассовая классификация 36 Бинарная классификация Многоклассовая классификация x2 x1 x2 x1 2019, Максим Кулагин e-mail: maksimkulagin06@yandex.ru
37. Многоклассовая классификация. Подход «один против всех» (One-vs-all) 37 x2 x1 x2 x1 x2 x1 x2 x1
38. Многоклассовая классификация. Подход «один против всех» (One-vs-all) 38 Обучаем классификаторы основанные на логистической регрессии hiQ(x) для
39. Обучение и переобучение 39 2019, Максим Кулагин e-mail: maksimkulagin06@yandex.ru
40. 40 2019, Максим Кулагин e-mail: maksimkulagin06@yandex.ru Обучение и переобучение
42. Скачать презентацию

Слайд 2

План лекции
Линейная регрессия со множеством переменных
Метод градиентного спуска для нескольких переменных.

Масштабирование признаков. Выбор скорости обучения
Полиномиальная регрессия
Нормальные уравнения
Классификация. Логистическая регрессия
Граница решения
Стоимостная функция для логистической регрессии
Многоклассовая классификация на основе логистической регрессии. Подходы «один против всех» и «один против одного»

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 3

Линейная регрессия с одной переменной
Тренировочное множество данных (скажем, всего m)
Обозначения: m

= число обучающих примеров
x = «входная» переменная / свойства
y = «выходная» переменная / «метка»
(x(i), y(i)) = i-й обучающий пример (строка)

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 4

Линейная регрессия с одной переменной
Тренировочное множество данных (скажем, всего m)
Обозначения: m

= число тренировочных примеров
x = «входная» переменная / свойства
y = «выходная» переменная / «метка»
(x(i), y(i)) = i-й тренировочный пример

Гипотеза h выглядит так: hQ(x) = Q0 + Q1 x

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 5

Линейная регрессия со множеством переменных
Тренировочное множество данных (скажем, всего m)
Обозначения: n

= число свойств/признаков/дескрипторов
x(i) = «вход»/свойства i-го тренировочного примера (x(i), y(i))
xj(i) = j-е свойство i-го тренировочного примера (x(i), y(i))
y(i) = «выходная» переменная / «метка» i-го тренировочного
примера (x(i), y(i))

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 6

Обозначения: n = число свойств/признаков/дескрипторов
x(i) = «вход»/свойства i-го тренировочного примера

(x(i), y(i))
xj(i) = j-е свойство i-го тренировочного примера (x(i), y(i))
y(i) = «выходная» переменная / «метка» i-го тренировочного
примера (x(i), y(i))

Линейная регрессия со множеством переменных

Тренировочное множество данных (скажем, всего m)

Гипотеза h выглядит так:
hQ(x) = QTx = Q0 + Q1 x1 + Q2 x2 + Q3 x3 + Q4 x4, здесь Q и x векторы-столбцы размерности n + 1

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 7

Градиентный спуск для линейной регрессии со множеством переменных
repeat until convergence
{
}
(j =

0, …, n)

Вычислив производные получим

repeat until convergence
{
}

параметры Q
обновляются
одновременно

hQ(x) = QTx = Q0 + Q1 x1 + Q2 x2 + … + Qn xn

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 8

Градиентный спуск на практике!
Масштабирование признаков
Идея: привести все свойства к одному и

тому же масштабу
Пример. Пусть x1 – площадь (0-2000 фут2), x2 – число комнат (1-5)

Ускоряем сходимость!

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 9

Нормализация на математическое ожидание
Идея: замена xj на, xj – μj с

целью создания у свойств нулевого среднего
Нормализация на математическое ожидание и масштабирование свойств приводят к следующей замене:

Нормализация на мат. ожидание и масштабирование не применяются к свойству x0!

Обычно в качестве Sj выбирается либо величина среднеквадратического отклонения свойства, либо разница между max и min значениями свойства на тренировочном множестве

При масштабировании и нормализации свойств на этапе обучения, требуется выполнять аналогичные операции на этапе предсказания для нового входа x!

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 10

Градиентный спуск на практике!
10
Отладка. Как убедиться в том, что градиентный спуск

работает корректно?
J(Q) должна уменьшаться после каждой итерации!
Как выбрать скорость обучения α?
Если α маленькое, то градиентный спуск может быть медленным
Если α большое, то градиентный спуск может проскочить минимум. Алгоритм может не сходиться или даже расходиться

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 11

Полиномиальная регрессия
11
Предскажем цену на дом с использованием следующей гипотезы:
hQ(x) = QTx

= Q0 + Q1 (длина дома) +
Q2 (ширина дома)

На основе свойств «длина дома» и «ширина дома», можно построить новое свойство «площадь дома» = «длина дома» * «ширина дома» и предсказывать цену так:

hQ(x) = QTx = Q0 + Q1 (площадь дома)

Иногда за счет введения новых свойств можно получить более лучшую модель!

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 12

Полиномиальная регрессия
12
Полиномиальная регрессия – это тот инструмент, который близко связан с

выбором новых свойств

Площадь в квадратных футах

Цена в 1000-х
долларов

100

200

300

400

500

1000

1500

2000

2500

hQ(x) = QTx = Q0 + Q1 (площадь) +
Q2 (площадь)2

Пусть х1 = площадь, x2 = (площадь)2,
тогда полиномиальная регрессия
сведется к линейной регрессии со
множеством переменных:
hQ(x) = QTx = Q0 + Q1 x1 + Q2 x2

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 13

Аналитическое решение
13
Метод аналитического поиска параметров Q
Рассмотрим стоимостную функцию J(Q)
Вычислим частные производные

J(Q) по Q0, Q1, …, Qn
Приравняем полученные производные к нулю

Решим систему линейных уравнений относительно
Q0, Q1, …, Qn

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 14

Нормальные уравнения
Тренировочное множество данных (скажем, всего m = 4)
14
Масштабирование свойств не

нужно!

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 15

15
Когда, что лучше использовать?
Пусть есть m тренировочных примеров и n свойств
Градиентный

спуск
Необходим выбор α
Необходимо много итераций
Работает хорошо даже если n большое (n = 106)

Нормальные уравнения
Нет необходимости выбирать α
Нет необходимости в итерациях
Необходимо вычислять (XTX)-1 , вычислительная стоимость O(n3)
Медленно работает если n большое. Используем если n = 100, 1000, 10000

Для вычисления обратной матрицы в Matlab используем функцию pinv

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 16

Классификация. Примеры
Классификация (предсказание дискретной выходной величины, например, 0 или 1)
Примеры задач

классификации
Электронная почта (Email): спам/не спам
Онлайн транзакции: мошенничество (да/нет)
Опухоль: злокачественная/доброкачественная
Видеоаналитика: номер/не номер, пешеход/не пешеход, лицо/не лицо и т.п.
Далее рассмотрим задачу бинарной классификации!
0: «отрицательный класс» (доброкачественная опухоль)
1: «положительный класс» (злокачественная опухоль)

Снова рассматриваем обучение с учителем!

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 17

Классификация
Размер опухоли
Злокачественная опухоль?
0 (N)
1 (P)
17
Рак молочной железы
(злокачественный или
доброкачественный)
0.5
2019, Максим

Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 18

Классификация
Размер опухоли
Злокачественная опухоль?
0 (N)
1 (P)
18
Рак молочной железы
(злокачественный или
доброкачественный)
Воспользуемся для

решения задачи классификации обычной линейной регрессией с одной переменной!

0.5

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 19

Классификация
Размер опухоли
Злокачественная опухоль?
0 (N)
1 (P)
19
Рак молочной железы
(злокачественный или
доброкачественный)
Пусть порог

классификатора hQ(x) находится в точке 0.5:
Если hQ(x) ≥ 0.5, то предсказываем «1»
Если hQ(x) < 0.5, то предсказываем «0»

0.5

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 20

Классификация
Размер опухоли
Злокачественная опухоль?
0 (N)
1 (P)
20
Рак молочной железы
(злокачественный или
доброкачественный)
Пусть порог

классификатора hQ(x) находится в точке 0.5:
Если hQ(x) ≥ 0.5, то предсказываем «1»
Если hQ(x) < 0.5, то предсказываем «0»

0.5

Добавили новую точку на этапе обучения!

Прямая значительно изменила свое положение! Классификация ухудшилась!

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 21

Классификация
21
Проблемы классификации на основе линейной регрессии с одной переменной
Выход (y) задачи

бинарной классификации должен принимать значения «0» или «1». В линейной регрессии hQ(x) может быть > 1 или < 0
Сильная чувствительность гипотезы по отношению к тренировочной выборке
Линейная регрессия может работать хорошо для некоторых частных случаев, но в общем классификация на основе нее – это плохая идея!
Введем понятие логистической регрессии, как простейшего метода классификации (0 ≤ hQ(x) ≤ 1)

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 22

Логистическая регрессия
22
Необходимо сделать так, чтобы 0 ≤ hQ(x) ≤ 1
Для решения

этой задачи представим гипотезу в следующем виде: hQ(x) = g(QTx)
Здесь функция g(z) представляет сигмоидную функцию (логистическую функцию) вида:

g(z)

0.5

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 23

Интерпретация гипотезы
в логистической регрессии
23
hQ(x) = оценке вероятности того, что y

= 1 для входа x
Пример: если x = [x0, x1]T = [1, размер опухоли]T и
hQ(x) = 0.7, тогда пациент с 70% шансом имеет злокачественную опухоль
Рассматриваемая вероятность P(y = i|x; Q) является условной вероятностью параметризованной Q того, что y = i для заданного x

P(y = 0|x; Q) + P(y = 1|x; Q) = 1,
P(y = 0|x; Q) = 1 - P(y = 1|x; Q)

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 24

Граница решения (Decision Boundary)
24
z
g(z)
0
1
0.5
Пусть порог классификатора hQ(x) находится в точке 0.5:
Если

hQ(x) ≥ 0.5 (QTx ≥ 0), то предсказываем «1»
Если hQ(x) < 0.5 (QTx < 0), то предсказываем «0»

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 25

Граница решения (Decision Boundary)
25
Пусть классификатор имеет вид:
hQ(x) = g(Q0

+ Q1x1 + Q2x2) = g(-3 + x1 + x2):
Предсказываем «y = 1» если -3 + x1 + x2 ≥ 0, иначе «y = 0»

Граница решения (Decision Boundary)

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 26

Нелинейные границы решения
26
Пусть классификатор имеет вид:
hQ(x) = g(Q0 +

Q1x1 + Q2x2 + Q3x12+ Q4x22) = g(-1 + x12 + x22):
Предсказываем «y = 1» если -1 + x12 + x22 ≥ 0, иначе «y = 0»

Нелинейная граница решения

-1

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 27

Стоимостная функция (Cost Function)
27
Дана тренировочная выборка {(x(1), y(1)), (x(2), y(2)), …,

(x(m), y(m))}, где m – число тренировочных примеров
Пусть x ∈ [x0, x1, …, xn]T, x0 = 1, y ∈ {0, 1}
Гипотеза hQ(x) имеет вид:

Как определить параметры Q?

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 28

Стоимостная функция (Cost Function)
28
Дана тренировочная выборка {(x(1), y(1)), (x(2), y(2)), …,

(x(m), y(m))}, где m – число тренировочных примеров
Пусть x ∈ [x0, x1, …, xn]T, x0 = 1, y ∈ {0, 1}
Гипотеза hQ(x) имеет вид:

Как определить параметры Q?

Воспользуемся как и в линейной регрессии стоимостной функцией!

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 29

Стоимостная функция (Cost Function)
29
Дана тренировочная выборка {(x(1), y(1)), (x(2), y(2)), …,

(x(m), y(m))}, где m – число тренировочных примеров
Пусть x ∈ [x0, x1, …, xn]T, x0 = 1, y ∈ {0, 1}
Гипотеза hQ(x) имеет вид:

Как определить параметры Q?

Как задать стоимостную функцию?

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 30

Стоимостная функция (Cost Function)
30
Выбор стоимостной функции. Вариант первый!
Возьмем абсолютно такую же

как и в линейной регрессии, помня о том, что гипотеза hQ(x) задается через сигмоидную функцию
Проблема! Стоимостная функция перестает быть выпуклой

J(Q)

Невыпуклая

J(Q)

Выпуклая

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 31

Стоимостная функция (Cost Function)
31
Выбор стоимостной функции. Вариант второй!
Пусть стоимостная функция имеет

вид:

Заметим, что Cost = 0 если y(i) = 1, hQ(x(i)) = 1
Если y(i) = 1 и hQ(x(i)) → 0 тогда Cost → ∞
Если hQ(x(i)) = 0, но y(i) = 1, мы штрафуем алгоритм обучения очень высокой стоимостью!

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 32

Стоимостная функция (Cost Function)
32
Выбор стоимостной функции. Вариант второй!
Немного пояснений!
-ln(z)
z
Если y =

-ln(1-z)

Если y = 0

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 33

Стоимостная функция (Cost Function)
33
Для дальнейшего анализа стоимостную функцию для логистической регрессии

удобно представить в виде:

Для того, чтобы найти параметры Q, необходимо минимизировать J(Q), например, методом градиентного спуска
Для того, чтобы выполнить предсказание для нового входного значения x используем

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 34

Градиентный спуск для лог. регрессии
34
repeat until convergence
{
}
Вычислив производные получим
repeat until

convergence
{
}

Замечание. Градиентный спуск выглядит идентично линейной регрессии, но hQ(x) задается иначе!

(j = 0, …, n)

параметры Q
обновляются
одновременно

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 35

Градиентный спуск для лог. регрессии
35
repeat until convergence
{
}
(j = 0, …,

Вычислив производные получим

repeat until convergence
{
}

параметры Q
обновляются
одновременно

Замечание. В Matlab есть встроенная функция fminunc, позволяющая находить минимум функции нескольких переменных без ограничений. Ее можно использовать вместо вручную написанной Matlab-функции для градиентного спуска (см. лекцию №6 из курса Andrew Ng. Machine Learning (online class), 2012. Stanford University, www.coursera.org/course/ml)!

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 36

Многоклассовая классификация
36
Бинарная классификация
Многоклассовая классификация
x2
x1
x2
x1
2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru
Методы машинного обучения
Российский университет

транспорта (МИИТ)

Слайд 37

Многоклассовая классификация. Подход «один против всех» (One-vs-all)
37
x2
x1
x2
x1
x2
x1
x2
x1
Класс 1
Класс 3
Класс 2
h1Q(x)
h2Q(x)
h3Q(x)
hiQ(x) =

P(y = i|x; Q), где i = 1, 2, 3

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 38

Многоклассовая классификация. Подход «один против всех» (One-vs-all)
38
Обучаем классификаторы основанные на логистической

регрессии hiQ(x) для каждого i-го класса для того, чтобы предсказать вероятность y = i
Для нового входа x выполнить предсказание и выбрать класс i с максимальным значением hiQ(x)
Возможной альтернативой решения задачи многоклассовой классификации может являться
подход «один против одного» (One-vs-one)
Обучаем логистическую регрессию для каждой пары классов
Каждый классификатор голосует за классы
Выбираем класс с наибольшим числом голосов

2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Методы машинного обучения
Российский университет транспорта (МИИТ)

Слайд 39

Обучение и переобучение
39
2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

Слайд 40

Системы искусственного интеллекта презентация

Содержание

План лекцииЛинейная регрессия со множеством переменныхМетод градиентного спуска для нескольких переменных.

Линейная регрессия с одной переменнойТренировочное множество данных (скажем, всего m)Обозначения: m

Линейная регрессия с одной переменнойТренировочное множество данных (скажем, всего m)Обозначения: m

Линейная регрессия со множеством переменныхТренировочное множество данных (скажем, всего m)Обозначения: n

Обозначения: n = число свойств/признаков/дескрипторов x(i) = «вход»/свойства i-го тренировочного примера

Градиентный спуск для линейной регрессии со множеством переменныхrepeat until convergence{}(j =

Градиентный спуск на практике!Масштабирование признаковИдея: привести все свойства к одному и

Нормализация на математическое ожиданиеИдея: замена xj на, xj – μj с

Градиентный спуск на практике!10Отладка. Как убедиться в том, что градиентный спуск

Полиномиальная регрессия11Предскажем цену на дом с использованием следующей гипотезы:hQ(x) = QTx

Полиномиальная регрессия12Полиномиальная регрессия – это тот инструмент, который близко связан с

Аналитическое решение13Метод аналитического поиска параметров QРассмотрим стоимостную функцию J(Q)Вычислим частные производные

Нормальные уравненияТренировочное множество данных (скажем, всего m = 4)14Масштабирование свойств не

15Когда, что лучше использовать?Пусть есть m тренировочных примеров и n свойствГрадиентный

Классификация. ПримерыКлассификация (предсказание дискретной выходной величины, например, 0 или 1)Примеры задач

КлассификацияРазмер опухолиЗлокачественная опухоль?0 (N)1 (P)17Рак молочной железы (злокачественный или доброкачественный)0.52019, Максим

КлассификацияРазмер опухолиЗлокачественная опухоль?0 (N)1 (P)18Рак молочной железы (злокачественный или доброкачественный)Воспользуемся для

КлассификацияРазмер опухолиЗлокачественная опухоль?0 (N)1 (P)19Рак молочной железы (злокачественный или доброкачественный)Пусть порог

КлассификацияРазмер опухолиЗлокачественная опухоль?0 (N)1 (P)20Рак молочной железы (злокачественный или доброкачественный)Пусть порог

Классификация21Проблемы классификации на основе линейной регрессии с одной переменнойВыход (y) задачи

Логистическая регрессия22Необходимо сделать так, чтобы 0 ≤ hQ(x) ≤ 1Для решения

Интерпретация гипотезы в логистической регрессии23hQ(x) = оценке вероятности того, что y

Граница решения (Decision Boundary)24zg(z)010.5Пусть порог классификатора hQ(x) находится в точке 0.5:Если

Граница решения (Decision Boundary)25Пусть классификатор имеет вид: hQ(x) = g(Q0

Нелинейные границы решения26Пусть классификатор имеет вид: hQ(x) = g(Q0 +

Стоимостная функция (Cost Function)27Дана тренировочная выборка {(x(1), y(1)), (x(2), y(2)), …,

Стоимостная функция (Cost Function)28Дана тренировочная выборка {(x(1), y(1)), (x(2), y(2)), …,

Стоимостная функция (Cost Function)29Дана тренировочная выборка {(x(1), y(1)), (x(2), y(2)), …,

Стоимостная функция (Cost Function)30Выбор стоимостной функции. Вариант первый!Возьмем абсолютно такую же

Стоимостная функция (Cost Function)31Выбор стоимостной функции. Вариант второй!Пусть стоимостная функция имеет

Стоимостная функция (Cost Function)32Выбор стоимостной функции. Вариант второй!Немного пояснений!-ln(z)zЕсли y =

Стоимостная функция (Cost Function)33Для дальнейшего анализа стоимостную функцию для логистической регрессии

Градиентный спуск для лог. регрессии 34repeat until convergence{}Вычислив производные получимrepeat until

Градиентный спуск для лог. регрессии 35repeat until convergence{}(j = 0, …,

Многоклассовая классификация. Подход «один против всех» (One-vs-all)37x2x1x2x1x2x1x2x1Класс 1Класс 3Класс 2h1Q(x)h2Q(x)h3Q(x)hiQ(x) =

Многоклассовая классификация. Подход «один против всех» (One-vs-all)38Обучаем классификаторы основанные на логистической

Обучение и переобучение392019, Максим Кулагин e-mail: maksimkulagin06@yandex.ru

402019, Максим Кулагин e-mail: maksimkulagin06@yandex.ruОбучение и переобучение

Похожие презентации

План лекции
Линейная регрессия со множеством переменных
Метод градиентного спуска для нескольких переменных.

Линейная регрессия с одной переменной
Тренировочное множество данных (скажем, всего m)
Обозначения: m

Линейная регрессия с одной переменной
Тренировочное множество данных (скажем, всего m)
Обозначения: m

Линейная регрессия со множеством переменных
Тренировочное множество данных (скажем, всего m)
Обозначения: n

Обозначения: n = число свойств/признаков/дескрипторов
x(i) = «вход»/свойства i-го тренировочного примера

Градиентный спуск для линейной регрессии со множеством переменных
repeat until convergence
{
}
(j =

Градиентный спуск на практике!
Масштабирование признаков
Идея: привести все свойства к одному и

Нормализация на математическое ожидание
Идея: замена xj на, xj – μj с

Градиентный спуск на практике!
10
Отладка. Как убедиться в том, что градиентный спуск

Полиномиальная регрессия
11
Предскажем цену на дом с использованием следующей гипотезы:
hQ(x) = QTx

Полиномиальная регрессия
12
Полиномиальная регрессия – это тот инструмент, который близко связан с

Аналитическое решение
13
Метод аналитического поиска параметров Q
Рассмотрим стоимостную функцию J(Q)
Вычислим частные производные

Нормальные уравнения
Тренировочное множество данных (скажем, всего m = 4)
14
Масштабирование свойств не

15
Когда, что лучше использовать?
Пусть есть m тренировочных примеров и n свойств
Градиентный

Классификация. Примеры
Классификация (предсказание дискретной выходной величины, например, 0 или 1)
Примеры задач

Классификация
Размер опухоли
Злокачественная опухоль?
0 (N)
1 (P)
17
Рак молочной железы
(злокачественный или
доброкачественный)
0.5
2019, Максим

Классификация
Размер опухоли
Злокачественная опухоль?
0 (N)
1 (P)
18
Рак молочной железы
(злокачественный или
доброкачественный)
Воспользуемся для

Классификация
Размер опухоли
Злокачественная опухоль?
0 (N)
1 (P)
19
Рак молочной железы
(злокачественный или
доброкачественный)
Пусть порог

Классификация
Размер опухоли
Злокачественная опухоль?
0 (N)
1 (P)
20
Рак молочной железы
(злокачественный или
доброкачественный)
Пусть порог

Классификация
21
Проблемы классификации на основе линейной регрессии с одной переменной
Выход (y) задачи

Логистическая регрессия
22
Необходимо сделать так, чтобы 0 ≤ hQ(x) ≤ 1
Для решения

Интерпретация гипотезы
в логистической регрессии
23
hQ(x) = оценке вероятности того, что y

Граница решения (Decision Boundary)
24
z
g(z)
0
1
0.5
Пусть порог классификатора hQ(x) находится в точке 0.5:
Если

Граница решения (Decision Boundary)
25
Пусть классификатор имеет вид:
hQ(x) = g(Q0

Нелинейные границы решения
26
Пусть классификатор имеет вид:
hQ(x) = g(Q0 +

Стоимостная функция (Cost Function)
27
Дана тренировочная выборка {(x(1), y(1)), (x(2), y(2)), …,

Стоимостная функция (Cost Function)
28
Дана тренировочная выборка {(x(1), y(1)), (x(2), y(2)), …,

Стоимостная функция (Cost Function)
29
Дана тренировочная выборка {(x(1), y(1)), (x(2), y(2)), …,

Стоимостная функция (Cost Function)
30
Выбор стоимостной функции. Вариант первый!
Возьмем абсолютно такую же

Стоимостная функция (Cost Function)
31
Выбор стоимостной функции. Вариант второй!
Пусть стоимостная функция имеет

Стоимостная функция (Cost Function)
32
Выбор стоимостной функции. Вариант второй!
Немного пояснений!
-ln(z)
z
Если y =

Стоимостная функция (Cost Function)
33
Для дальнейшего анализа стоимостную функцию для логистической регрессии

Градиентный спуск для лог. регрессии
34
repeat until convergence
{
}
Вычислив производные получим
repeat until

Градиентный спуск для лог. регрессии
35
repeat until convergence
{
}
(j = 0, …,

Многоклассовая классификация. Подход «один против всех» (One-vs-all)
37
x2
x1
x2
x1
x2
x1
x2
x1
Класс 1
Класс 3
Класс 2
h1Q(x)
h2Q(x)
h3Q(x)
hiQ(x) =

Многоклассовая классификация. Подход «один против всех» (One-vs-all)
38
Обучаем классификаторы основанные на логистической

Обучение и переобучение
39
2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru

40
2019, Максим Кулагин
e-mail: maksimkulagin06@yandex.ru
Обучение и переобучение