Слайд 2
![Регрессионный анализ Впервые термин употреблен в работе Pearson (1908) Анализ](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/275464/slide-1.jpg)
Регрессионный анализ
Впервые термин употреблен в работе Pearson (1908)
Анализ связи между несколькими
независимыми переменными (регрессорами или предикторами) и зависимой переменной
Слайд 3
![Цели регрессионного анализа Определение наличия и характера (математического уравнения, описывающего](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/275464/slide-2.jpg)
Цели регрессионного анализа
Определение наличия и характера (математического уравнения, описывающего зависимость) связи
между переменными
Определение степени детерминированности вариации критеральной переменной предикторами
Предсказать значение зависимой переменной с помощью независимой
Определить вклад независимых переменных в вариацию зависимой
Слайд 4
![Условия применения Использование метрических переменных Равенство условных дисперсий: D(Y /](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/275464/slide-3.jpg)
Условия применения
Использование метрических переменных
Равенство условных дисперсий: D(Y / X) =
const;
Независимость ошибок от предикторов и нормального их распределения с нулевым средним и постоянной дисперсией;
Попарное нормальное распределение всех признаков модели;
Независимость предикторов между собой
Достаточное количество наблюдений (обычно >15, в зависимости от конкретного характера распределений наблюдений и сложности искомой зависимости)
Слайд 5
![Уравнение регрессии Y=a+b*X; где: Y – зависимая переменная, a -](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/275464/slide-4.jpg)
Уравнение регрессии
Y=a+b*X; где:
Y – зависимая переменная,
a - константа
b - угловой
коэффициент
X – независимая переменная
Для многомерной регрессии:
Y = a + b1*X1 + b2*X2 + ... + bp*Xp
Слайд 6
![Метод наименьших квадратов Цель - минимизировать квадраты отклонений линии регрессии](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/275464/slide-5.jpg)
Метод наименьших квадратов
Цель - минимизировать квадраты отклонений линии регрессии от наблюдаемых
точек.
По этим данным строим диаграмму рассеяния
Слайд 7
![Диаграмма рассеяния](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/275464/slide-6.jpg)
Слайд 8
![Регрессионные коэффициенты (B-коэффициенты) Это независимые вклады каждой независимой переменной в](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/275464/slide-7.jpg)
Регрессионные коэффициенты (B-коэффициенты)
Это независимые вклады каждой независимой переменной в предсказание
зависимой переменной:
переменная X1 коррелирует с переменной Y после учета влияния всех других независимых переменных (частная корреляция)
Слайд 9
![Пример Успеваемость = 1+.02*IQ, где: а = 1 b =](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/275464/slide-8.jpg)
Пример
Успеваемость = 1+.02*IQ, где:
а = 1
b = 0,02
IQ – независимая переменная
При
IQ=130:
Успеваемость = 1+.02*130 = 3,6
Слайд 10
![Остаток Отклонение отдельной точки от линии регрессии (от предсказанного значения)](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/275464/slide-9.jpg)
Остаток
Отклонение отдельной точки от линии регрессии (от предсказанного значения) называется остатком.
Чем меньше разброс значений (дисперсия) остатков около линии регрессии по отношению к общему разбросу значений, тем лучше прогноз
Слайд 11
![Остаточная дисперсия и коэффициент детерминации R-квадрат Если связь между переменными](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/275464/slide-10.jpg)
Остаточная дисперсия и коэффициент детерминации
R-квадрат
Если связь между переменными X и
Y отсутствует, то отношение остаточной изменчивости переменной Y к исходной дисперсии равно 1.0.
Если X и Y жестко связаны, то остаточная изменчивость отсутствует, и отношение дисперсий будет равно 0.0.
В большинстве случаев отношение будет лежать между экстремальными значениями, т.е. между 0.0 и 1.0.
1.0 минус это отношение называется R-квадратом или коэффициентом детерминации
Слайд 12
![Коэффициент множественной корреляции R Это неотрицательная величина, принимающая значения между](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/275464/slide-11.jpg)
Коэффициент множественной корреляции R
Это неотрицательная величина, принимающая значения между 0
и 1.
Если B-коэффициент положителен, то связь этой переменной с зависимой переменной положительна
Если B-коэффициент отрицателен, то и связь носит отрицательный характер.
Конечно, если B-коэффициент равен 0, связь между переменными отсутствует.