Регрессионный анализ презентация

Август 5, 2022

Главная
Математика
Регрессионный анализ

Содержание

2. r=0.7: если Петя высокий, то, скорее всего, Гриша тоже высокий. Но можем ли мы предсказать, насколько
3. Регрессионный анализ предсказывает значение одной переменной на основании другой. Для этого в линейной регрессии строится прямая
4. То есть, РЕГРЕССИЯ (regression) – предсказание одной переменной на основании другой. Одна переменная – независимая (independent),
5. Мы изучаем поведение бегемотов в Африке. Мы хотим узнать, как связана длительность кормления со скоростью набора
6. Мы ищем прямую, которая наилучшим образом будет предсказывать значения Y на основании значений Х. прибавка в
7. Простая линейная регрессия (linear regression) Y – зависимая переменная X – независимая переменная a и b
8. Задача сводится к поиску коэффициентов a и b. коэффициент корреляции Пирсона! стандартные отклонения для X и
9. Длительность кормления Прибавка в весе в день X Y
10. Если r=0.0, линия регрессии всегда горизонтальна. Чем ближе r к нулю, тем труднее на глаз провести
11. Линия регрессии в стандартной форме a = 0, b = r (математическое объяснение регрессии к среднему)
12. Ошибка предсказания (residual) = «остатки» прибавка в весе в день длительность кормления e положительно для точек
13. Метод наименьших квадратов: линию регрессии подбирают такую, чтобы общая сумма квадратов ошибок (residuals) была наименьшей. -
14. Насколько хорошо «лучшая» линия регрессии предсказывает Y? Чем меньше стандартное отклонение ошибок ei (standard error of
15. Чем больше коэффициент корреляции, тем меньше стандартное отклонение ошибки, и наоборот. Важное требование к выборке: размер
16. Для любого значения Xi Y должна иметь нормальное распределение То есть прибавка в весе для всех
17. Требования к выборке для построения линии регрессии Ожидаемая зависимость переменной Y от X должна быть линейной.
18. Тестирование гипотезы в регрессионном анализе: отличен ли от нуля наклон линии регрессии? Н0: bpopulation = 0
19. linear regression
20. linear regression У бегемотов прибавка в весе положительно зависела от длительности кормления
21. Коэффициент наклона в стандартной форме Коэффициенты a и b Часто «остатки» используют как самостоятельную переменную
24. Сравнение двух линий регрессии Сравнение коэффициентов наклона b1 b2 Сравнение коэффициентов сдвига a1 и a2 Сравнение
26. Скачать презентацию

Слайд 2

r=0.7: если Петя высокий, то, скорее всего, Гриша тоже высокий. Но

можем ли мы предсказать, насколько высокий? Сам коэффициент корреляции этого нам не скажет.
Ответ нам даст РЕГРЕССИОННЫЙ АНАЛИЗ.

Рост братьев.

Петя

Гриша

РЕГРЕССИОННЫЙ АНАЛИЗ

Слайд 3

Регрессионный анализ предсказывает значение одной переменной на основании другой.
Для этого в

линейной регрессии строится прямая – линия регрессии.
Линейная регрессия:
Даёт нам правила, определяющие линию регрессии, которая лучше других предсказывает одну переменную на основании другой.

По оси Y располагают переменную, которую мы хотим предсказать, а по оси Х – переменную, на основе которой будем предсказывать.
Предсказанное значение Y обычно обозначают как

Слайд 4

То есть,
РЕГРЕССИЯ (regression) – предсказание одной переменной на основании

другой. Одна переменная – независимая (independent), а другая – зависимая (dependent).
Пример: скорость набора веса у бегемота растёт с увеличением продолжительности кормления; долго кормившийся бегемот быстрее набирает вес
КОРРЕЛЯЦИЯ (correlation) – показывает, в какой степени две переменные СОВМЕСТНО ИЗМЕНЯЮТСЯ. Нет зависимой и независимой переменных, они эквивалентны.
Пример: длина хвоста у суслика коррелирует положительно с его массой тела

ЭТО НЕ ОДНО И ТО ЖЕ!

Слайд 5

Мы изучаем поведение бегемотов в Африке. Мы хотим узнать, как связана

длительность кормления со скоростью набора веса у этих зверей?

У нас две переменные – 1. длительность кормления в день (independent); 2. скорость набора веса в день (dependent)

1 час в день

5 часов в день

20 часов в день

Слайд 6

Мы ищем прямую, которая наилучшим образом будет предсказывать значения Y на

основании значений Х.

прибавка в весе в день

длительность кормления

прибавка в весе в день

длительность кормления

прибавка в весе в день

длительность кормления

Слайд 7

Простая линейная регрессия (linear regression)
Y – зависимая переменная
X – независимая переменная
a

и b - коэффициенты регрессии

b – характеризует НАКЛОН прямой; это самый важный коэффициент;
a – определяет точку пересечения прямой с осью OY; не столь существенный (intercept).

Пояснить размерность b и a

Слайд 8

Задача сводится к поиску коэффициентов a и b.
коэффициент корреляции Пирсона!
стандартные отклонения

для X и Y

Линия регрессии всегда проходит через точку , то есть через середину графика.
b – определяет, насколько изменится Y на единицу X; имеет тот же знак, что и r.

Пример с кол-вом удобрения на каждый кг помидоров

Слайд 9

Длительность кормления
Прибавка в весе в день
X
Y

Слайд 10

Если r=0.0, линия регрессии всегда горизонтальна. Чем ближе r к нулю,

тем труднее на глаз провести линию регрессии. А чем больше r, тем лучше предсказание.
Важная особенность нашего предсказания: предсказанное значение Y всегда ближе к среднему значению, чем то значение X, на основе которого оно было предсказано – регрессия к среднему.

Пример про Dr. Nostat, который отобрал 100 самых глупых учеников, подверг их специальной программе и потом протестировал повторно, и их IQ оказался в среднем выше.
Пример про очень умную 5-летнюю девочку

Слайд 11

Линия регрессии в стандартной форме
a = 0, b = r
(математическое объяснение

регрессии к среднему)

Слайд 12

Ошибка предсказания (residual) = «остатки»
прибавка в весе в день
длительность кормления
e положительно

для точек над прямой и отрицательно для точек под прямой.

«Лучшая» линия регрессии

Слайд 13

Метод наименьших квадратов:
линию регрессии подбирают такую, чтобы общая сумма квадратов ошибок

(residuals) была наименьшей.

- минимальна

Как определить «лучшую» линию регрессии?

Слайд 14

Насколько хорошо «лучшая» линия регрессии предсказывает Y?
Чем меньше стандартное отклонение ошибок

ei (standard error of estimate), тем точнее предсказание (потому, что оно напрямую зависит от размера самих ошибок).

зависит от квадрата коэффициента корреляции

Слайд 15

Чем больше коэффициент корреляции, тем меньше стандартное отклонение ошибки, и наоборот.
Важное

требование к выборке: размер этой стандартной ошибки должен быть независимым от Х.

Квадрат коэффициента корреляции Пирсона называется коэффициент детерминации (coefficient of determination) - r2 или R2. Определяет, какую долю изменчивости зависимой переменной объясняет независимая переменная (т.е., насколько точно предсказание).

Насколько велик или мал коэффициент корреляции 0.3?
0.32 = 0.09, независимая переменная объясняет только около 1/10 изменчивости зависимой переменной.

Слайд 16

Для любого значения Xi Y должна иметь нормальное распределение
То есть прибавка

в весе для всех бегемотов, кормившихся по 20 часов в день имеет нормальное распределение

Слайд 17

Требования к выборке для построения линии регрессии
Ожидаемая зависимость переменной Y от

X должна быть линейной.
Для любого значения Xi Y должна иметь нормальное распределение.
Для любого значения Xi выборки для Y должны иметь одинаковую дисперсию (homoscedasticity).
Для любого значения Xi выборки для Y должны быть независимы друг от друга.

Слайд 18

Тестирование гипотезы в регрессионном анализе: отличен ли от нуля наклон линии

регрессии?

Н0: bpopulation = 0

Если r достоверно отличается от нуля, то и b ≠ 0!
То есть, если мы отвергаем H0 о том, что r=0, то эта гипотеза отвергается автоматически.

bpopulation часто обозначается как , в т.ч. в Statistica

Слайд 19

linear regression

Слайд 20

linear regression
У бегемотов прибавка в весе положительно зависела от длительности кормления

Слайд 21

Коэффициент наклона в стандартной форме
Коэффициенты a и b
Часто «остатки» используют

как самостоятельную переменную

Слайд 22

Слайд 23

Слайд 24

Сравнение двух линий регрессии
Сравнение коэффициентов наклона b1 b2
Сравнение коэффициентов сдвига a1

и a2
Сравнение двух линий регрессии в целом
(предполагается, что если линии для 2-х выборок у нас сильно различаются, и мы объединим выборки, то общая линия по этим двум выборкам будет хуже описывать изменчивость, остаточная дисперсия будет больше) –
на основе F-критерия

На основе критерия Стьюдента

линии регрессии

Регрессионный анализ презентация

Содержание

r=0.7: если Петя высокий, то, скорее всего, Гриша тоже высокий. Но

Регрессионный анализ предсказывает значение одной переменной на основании другой.Для этого в

То есть, РЕГРЕССИЯ (regression) – предсказание одной переменной на основании

Мы изучаем поведение бегемотов в Африке. Мы хотим узнать, как связана

Мы ищем прямую, которая наилучшим образом будет предсказывать значения Y на

Простая линейная регрессия (linear regression)Y – зависимая переменнаяX – независимая переменнаяa

Задача сводится к поиску коэффициентов a и b.коэффициент корреляции Пирсона!стандартные отклонения

Длительность кормленияПрибавка в весе в деньXY

Если r=0.0, линия регрессии всегда горизонтальна. Чем ближе r к нулю,

Линия регрессии в стандартной формеa = 0, b = r(математическое объяснение

Ошибка предсказания (residual) = «остатки»прибавка в весе в деньдлительность кормленияe положительно

Метод наименьших квадратов:линию регрессии подбирают такую, чтобы общая сумма квадратов ошибок

Насколько хорошо «лучшая» линия регрессии предсказывает Y?Чем меньше стандартное отклонение ошибок

Чем больше коэффициент корреляции, тем меньше стандартное отклонение ошибки, и наоборот.Важное

Для любого значения Xi Y должна иметь нормальное распределениеТо есть прибавка

Требования к выборке для построения линии регрессииОжидаемая зависимость переменной Y от

Тестирование гипотезы в регрессионном анализе: отличен ли от нуля наклон линии

linear regression

linear regressionУ бегемотов прибавка в весе положительно зависела от длительности кормления

Коэффициент наклона в стандартной формеКоэффициенты a и b Часто «остатки» используют

Сравнение двух линий регрессииСравнение коэффициентов наклона b1 b2Сравнение коэффициентов сдвига a1

Похожие презентации

Регрессионный анализ предсказывает значение одной переменной на основании другой.
Для этого в

То есть,
РЕГРЕССИЯ (regression) – предсказание одной переменной на основании

Простая линейная регрессия (linear regression)
Y – зависимая переменная
X – независимая переменная
a

Задача сводится к поиску коэффициентов a и b.
коэффициент корреляции Пирсона!
стандартные отклонения

Длительность кормления
Прибавка в весе в день
X
Y

Линия регрессии в стандартной форме
a = 0, b = r
(математическое объяснение

Ошибка предсказания (residual) = «остатки»
прибавка в весе в день
длительность кормления
e положительно

Метод наименьших квадратов:
линию регрессии подбирают такую, чтобы общая сумма квадратов ошибок

Насколько хорошо «лучшая» линия регрессии предсказывает Y?
Чем меньше стандартное отклонение ошибок

Чем больше коэффициент корреляции, тем меньше стандартное отклонение ошибки, и наоборот.
Важное

Для любого значения Xi Y должна иметь нормальное распределение
То есть прибавка

Требования к выборке для построения линии регрессии
Ожидаемая зависимость переменной Y от

linear regression
У бегемотов прибавка в весе положительно зависела от длительности кормления

Коэффициент наклона в стандартной форме
Коэффициенты a и b
Часто «остатки» используют

Сравнение двух линий регрессии
Сравнение коэффициентов наклона b1 b2
Сравнение коэффициентов сдвига a1