Слайд 2
![Темы лекции. Коэффициент детерминации. Свойства коэффициента детерминации. Скорректированный коэффициент детерминации. Свойства скорректированного коэффициента детерминации.](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/72976/slide-1.jpg)
Темы лекции.
Коэффициент детерминации.
Свойства коэффициента детерминации.
Скорректированный коэффициент детерминации.
Свойства скорректированного
коэффициента детерминации.
Слайд 3
![Как понять, насколько наша модель «хороша» Первое, что приходит на](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/72976/slide-2.jpg)
Как понять, насколько наша модель «хороша»
Первое, что приходит на ум –
«похожесть» реальных и прогнозных значений, качество подгонки.
Второе – наша модель должна хорошо объяснять имеющиеся данные, мы должны понять, как образуются значения переменной Y.
Первое и второе не одно и тоже.
Модель может обладать хорошим качеством подгонки и совсем не обладать объясняющей способностью
Слайд 4
![Насколько хорошо нам удалось объяснить изменение переменной Y нашей моделью.](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/72976/slide-3.jpg)
Насколько хорошо нам удалось объяснить изменение переменной Y нашей моделью.
Разложим
вариацию Y на две части. Насколько наше уравнение объясняет вариацию Y и какова часть Y, которую мы не можем объяснить нашим уравнением.
Слайд 5
![Почему не все Yi одинаковые? X](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/72976/slide-4.jpg)
Почему не все Yi одинаковые?
X
Слайд 6
![Может Y зависит от X? X](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/72976/slide-5.jpg)
Слайд 7
![И эта зависимость линейная? X](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/72976/slide-6.jpg)
И эта зависимость линейная?
X
Слайд 8
![X](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/72976/slide-7.jpg)
Слайд 9
![X](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/72976/slide-8.jpg)
Слайд 10
![Отклонение значения переменной Y от среднего Раскладывается на две части](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/72976/slide-9.jpg)
Отклонение значения переменной Y от среднего
Раскладывается на две части
объясненная
рассматриваемой моделью +
необъяснённая часть (остаток)
чем модель лучше, тем остаток меньше.
Слайд 11
![Возведем обе части в квадрат и просуммируем по всем наблюдениям](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/72976/slide-10.jpg)
Возведем обе части в квадрат и просуммируем по всем наблюдениям
Раскроем скобки
I
II III
В этой сумме II = 0, если в уравнении есть свободный
коэффициент
Слайд 12
![Разложение общей вариации переменной Y](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/72976/slide-11.jpg)
Разложение общей вариации переменной Y
Слайд 13
![TSS – total sum of squares – вся дисперсия или](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/72976/slide-12.jpg)
TSS – total sum of squares – вся дисперсия или вариация
Y, характеризует степень случайного разброса значений функции регрессии около среднего значения Y
RSS – residual sum of squares – есть сумма квадратов остатков регрессии, та величина, которую мы минимизируем при построении прямой, часть дисперсии, которая нашим уравнением не объясняется
ESS – equation sum of squares – объясненная часть общей вариации
Слайд 14
![Коэффициент детерминации Коэффициентом детерминации или долей объясненной нашим уравнением дисперсии называется величина](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/72976/slide-13.jpg)
Коэффициент детерминации
Коэффициентом детерминации или долей объясненной нашим уравнением дисперсии называется величина
Слайд 15
![Свойства коэффициента детерминации в силу определения](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/72976/slide-14.jpg)
Свойства коэффициента детерминации
в силу определения
Слайд 16
![в этом случае все точки (Xi, Yi) лежат на одной](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/72976/slide-15.jpg)
в этом случае все точки (Xi, Yi) лежат на одной прямой
(RSS = 0).
Новые точки будут лежать на этой прямой?
Слайд 17
![в этом случае ESS = 0, наша регрессия ничего не](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/72976/slide-16.jpg)
в этом случае ESS = 0,
наша регрессия ничего не объясняет,
ничего не дает по сравнению с тривиальным прогнозом
Слайд 18
![](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/72976/slide-17.jpg)
Слайд 19
![X и Y независимы](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/72976/slide-18.jpg)
Слайд 20
![Нелинейная корреляция](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/72976/slide-19.jpg)
Слайд 21
![Другая статистическая связь](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/72976/slide-20.jpg)
Другая статистическая связь
Слайд 22
![в этом случае чем ближе R2 к 1, тем лучше](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/72976/slide-21.jpg)
в этом случае чем ближе R2 к 1, тем лучше качество
подгонки кривой к нашим данным, тем точнее аппроксимирует Y
Слайд 23
![Недостаток коэффициента детерминации R2, вообще говоря, возрастает при добавлении еще](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/72976/slide-22.jpg)
Недостаток коэффициента детерминации
R2, вообще говоря, возрастает при добавлении еще одного регрессора,
поэтому для выбора между несколькими регрессионными уравнениями не следует полагаться только на R2
Слайд 24
![Скорректированный коэффициент детерминации Попыткой устранить эффект, связанный с ростом R2](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/72976/slide-23.jpg)
Скорректированный коэффициент детерминации
Попыткой устранить эффект, связанный с ростом R2 при увеличении
числа регрессоров, является коррекция R2 на число регрессоров - наложение "штрафа" за увеличение числа независимых переменных.
Слайд 25
![Скорректированный коэффициент детерминации](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/72976/slide-24.jpg)
Скорректированный коэффициент детерминации
Слайд 26
![Свойства скорректированного коэффициента детерминации , но может быть и](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/72976/slide-25.jpg)
Свойства скорректированного коэффициента детерминации
, но может быть и < 0
Слайд 27
![Упражнение Показать, что статистика увеличится при добавлении новой переменной тогда](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/72976/slide-26.jpg)
Упражнение
Показать, что статистика увеличится при добавлении новой переменной тогда и только
тогда, когда t-статистика коэффициента при этой переменной по модулю больше 1.
Следовательно, если в результате регрессии с новой переменной увеличился, это еще не означает, что коэффициент при этой переменной значимо отличается от нуля, поэтому мы не можем сказать, что спецификация модели улучшилась