Оценка качества подгонки линии регрессии к имеющимся данным презентация

Июль 23, 2021

Главная
Без категории
Оценка качества подгонки линии регрессии к имеющимся данным

Содержание

2. Темы лекции. Коэффициент детерминации. Свойства коэффициента детерминации. Скорректированный коэффициент детерминации. Свойства скорректированного коэффициента детерминации.
3. Как понять, насколько наша модель «хороша» Первое, что приходит на ум – «похожесть» реальных и прогнозных
4. Насколько хорошо нам удалось объяснить изменение переменной Y нашей моделью. Разложим вариацию Y на две части.
5. Почему не все Yi одинаковые? X
6. Может Y зависит от X? X
7. И эта зависимость линейная? X
8. X
9. X
10. Отклонение значения переменной Y от среднего Раскладывается на две части объясненная рассматриваемой моделью + необъяснённая часть
11. Возведем обе части в квадрат и просуммируем по всем наблюдениям Раскроем скобки I II III В
12. Разложение общей вариации переменной Y
13. TSS – total sum of squares – вся дисперсия или вариация Y, характеризует степень случайного разброса
14. Коэффициент детерминации Коэффициентом детерминации или долей объясненной нашим уравнением дисперсии называется величина
15. Свойства коэффициента детерминации в силу определения
16. в этом случае все точки (Xi, Yi) лежат на одной прямой (RSS = 0). Новые точки
17. в этом случае ESS = 0, наша регрессия ничего не объясняет, ничего не дает по сравнению
19. X и Y независимы
20. Нелинейная корреляция
21. Другая статистическая связь
22. в этом случае чем ближе R2 к 1, тем лучше качество подгонки кривой к нашим данным,
23. Недостаток коэффициента детерминации R2, вообще говоря, возрастает при добавлении еще одного регрессора, поэтому для выбора между
24. Скорректированный коэффициент детерминации Попыткой устранить эффект, связанный с ростом R2 при увеличении числа регрессоров, является коррекция
25. Скорректированный коэффициент детерминации
26. Свойства скорректированного коэффициента детерминации , но может быть и
27. Упражнение Показать, что статистика увеличится при добавлении новой переменной тогда и только тогда, когда t-статистика коэффициента
29. Скачать презентацию

Слайд 2

Темы лекции.
Коэффициент детерминации.
Свойства коэффициента детерминации.
Скорректированный коэффициент детерминации.
Свойства скорректированного

коэффициента детерминации.

Слайд 3

Как понять, насколько наша модель «хороша»
Первое, что приходит на ум –

«похожесть» реальных и прогнозных значений, качество подгонки.
Второе – наша модель должна хорошо объяснять имеющиеся данные, мы должны понять, как образуются значения переменной Y.
Первое и второе не одно и тоже.
Модель может обладать хорошим качеством подгонки и совсем не обладать объясняющей способностью

Слайд 4

Насколько хорошо нам удалось объяснить изменение переменной Y нашей моделью.
Разложим

вариацию Y на две части. Насколько наше уравнение объясняет вариацию Y и какова часть Y, которую мы не можем объяснить нашим уравнением.

Слайд 5

Почему не все Yi одинаковые?
X

Слайд 6

Может Y зависит от X?
X

Слайд 7

И эта зависимость линейная?
X

Слайд 8

X

Слайд 9

X

Слайд 10

Отклонение значения переменной Y от среднего
Раскладывается на две части
объясненная

рассматриваемой моделью +
необъяснённая часть (остаток)
чем модель лучше, тем остаток меньше.

Слайд 11

Возведем обе части в квадрат и просуммируем по всем наблюдениям
Раскроем скобки
I

II III
В этой сумме II = 0, если в уравнении есть свободный
коэффициент

Слайд 12

Разложение общей вариации переменной Y

Слайд 13

TSS – total sum of squares – вся дисперсия или вариация

Y, характеризует степень случайного разброса значений функции регрессии около среднего значения Y
RSS – residual sum of squares – есть сумма квадратов остатков регрессии, та величина, которую мы минимизируем при построении прямой, часть дисперсии, которая нашим уравнением не объясняется
ESS – equation sum of squares – объясненная часть общей вариации

Слайд 14

Коэффициент детерминации
Коэффициентом детерминации или долей объясненной нашим уравнением дисперсии называется величина

Слайд 15

Свойства коэффициента детерминации
в силу определения

Слайд 16

в этом случае все точки (Xi, Yi) лежат на одной прямой

(RSS = 0).
Новые точки будут лежать на этой прямой?

Слайд 17

в этом случае ESS = 0,
наша регрессия ничего не объясняет,

ничего не дает по сравнению с тривиальным прогнозом

Слайд 18

Слайд 19

X и Y независимы

Слайд 20

Нелинейная корреляция

Слайд 21

Другая статистическая связь

Слайд 22

в этом случае чем ближе R2 к 1, тем лучше качество

подгонки кривой к нашим данным, тем точнее аппроксимирует Y

Слайд 23

Недостаток коэффициента детерминации
R2, вообще говоря, возрастает при добавлении еще одного регрессора,

поэтому для выбора между несколькими регрессионными уравнениями не следует полагаться только на R2

Слайд 24

Скорректированный коэффициент детерминации
Попыткой устранить эффект, связанный с ростом R2 при увеличении

числа регрессоров, является коррекция R2 на число регрессоров - наложение "штрафа" за увеличение числа независимых переменных.

Слайд 25

Скорректированный коэффициент детерминации

Слайд 26

Свойства скорректированного коэффициента детерминации
, но может быть и < 0

Слайд 27

Упражнение
Показать, что статистика увеличится при добавлении новой переменной тогда и только

тогда, когда t-статистика коэффициента при этой переменной по модулю больше 1.
Следовательно, если в результате регрессии с новой переменной увеличился, это еще не означает, что коэффициент при этой переменной значимо отличается от нуля, поэтому мы не можем сказать, что спецификация модели улучшилась

Оценка качества подгонки линии регрессии к имеющимся данным презентация

Содержание

Темы лекции.Коэффициент детерминации. Свойства коэффициента детерминации. Скорректированный коэффициент детерминации. Свойства скорректированного

Как понять, насколько наша модель «хороша»Первое, что приходит на ум –

Насколько хорошо нам удалось объяснить изменение переменной Y нашей моделью. Разложим

Почему не все Yi одинаковые?X

Может Y зависит от X?X

И эта зависимость линейная?X

X

X

Отклонение значения переменной Y от среднего Раскладывается на две части объясненная

Возведем обе части в квадрат и просуммируем по всем наблюдениямРаскроем скобкиI