Мультиколлинеарность презентация

Содержание

Слайд 2

2

Три переменные отображаются в виде линейных графиков выше. Рассматривая данные, невозможно определить, вызваны

ли изменения в Y изменениями X2, изменениями в X3 или совместно изменениями X2 и X3.

Y

X3

X2

МУЛЬТИКОЛЛИНЕАРНОСТЬ

Слайд 3

3

Численно Y увеличивается на 5 в каждом наблюдении. X2 изменяется на 1.

МУЛЬТИКОЛЛИНЕАРНОСТЬ

X2 X3 Y X2

X3 Y
изменение от предыдущего наблюдения
10 19 51
11 21 56 1 2 5
12 23 61 1 2 5
13 25 66 1 2 5
14 27 71 1 2 5
15 29 76 1 2 5

Слайд 4

4

Следовательно, истинное соотношение могло бы быть Y = 1 + 5X2.

МУЛЬТИКОЛЛИНЕАРНОСТЬ

Y

X2

Y = 1

+ 5X2 ?

X3

Слайд 5

5

Однако также можно видеть, что X3 увеличивается на 2 в каждом наблюдении.

МУЛЬТИКОЛЛИНЕАРНОСТЬ

X2 X3 Y X2

X3 Y
изменение от предыдущего наблюдения
10 19 51
11 21 56 1 2 5
12 23 61 1 2 5
13 25 66 1 2 5
14 27 71 1 2 5
15 29 76 1 2 5

Слайд 6

6

Следовательно, истинная связь могла бы быть Y = 3,5 + 2,5X3.

Y = 3.5

+ 2.5X3 ?

МУЛЬТИКОЛЛИНЕАРНОСТЬ

Y

X2

X3

Слайд 7

7

Эти две возможности являются частными случаями Y = 3,5 - 2,5p + 5pX2

+ 2,5 (1 - p) X3, которые соответствовали бы соотношению для любого значения p.

МУЛЬТИКОЛЛИНЕАРНОСТЬ

Y

X3

X2

Y = 3.5 – 2.5p + 5pX2 + 2.5(1 – p)X3

Слайд 8

8

Нет никакого способа, чтобы регрессионный анализ или любая другая техника могли определять истинную

связь из этого бесконечного множества возможностей, учитывая данные выборки.

МУЛЬТИКОЛЛИНЕАРНОСТЬ

Y

X3

X2

Y = 3.5 – 2.5p + 5pX2 + 2.5(1 – p)X3

Слайд 9

9

Что произойдет, если вы попытаетесь запустить регрессию, когда существует точная линейная зависимость между

объясняющими переменными?

МУЛЬТИКОЛЛИНЕАРНОСТЬ

Слайд 10

10

Мы исследуем, используя модель с двумя объясняющими переменными, показанными выше. [Примечание: термин «нарушение»

теперь включен в истинную модель, но это не имеет никакого значения для анализа.]

МУЛЬТИКОЛЛИНЕАРНОСТЬ

Слайд 11

Выражение для коэффициента множественной регрессии b2 показано выше. Мы заменим X3, используя его

связь с X2.

МУЛЬТИКОЛЛИНЕАРНОСТЬ

11

Слайд 12

Во-первых, мы заменим термины, выделенные.

МУЛЬТИКОЛЛИНЕАРНОСТЬ

12

Слайд 13

Мы сделали замену.

МУЛЬТИКОЛЛИНЕАРНОСТЬ

13

Слайд 14

Далее, термины, выделенные сейчас.

МУЛЬТИКОЛЛИНЕАРНОСТЬ

14

Слайд 15


Мы сделали замену.

МУЛЬТИКОЛЛИНЕАРНОСТЬ

15

Слайд 16


Наконец, этот термин.

МУЛЬТИКОЛЛИНЕАРНОСТЬ

16

Слайд 17

Опять же, мы сделали замену.

МУЛЬТИКОЛЛИНЕАРНОСТЬ

17

Слайд 18

Оказывается, что числитель и знаменатель равны нулю. Коэффициент регрессии не определен.

МУЛЬТИКОЛЛИНЕАРНОСТЬ

18

Слайд 19

Необычно, что существует точная взаимосвязь между объясняющими переменными в регрессии. Когда это происходит,

это типично, потому что в спецификации есть логическая ошибка.

МУЛЬТИКОЛЛИНЕАРНОСТЬ

19

Слайд 20

20

Однако часто бывает, что существует приблизительная взаимосвязь. Мы будем использовать уравнение заработной платы

в качестве иллюстрации.

МУЛЬТИКОЛЛИНЕАРНОСТЬ

. reg EARNINGS S EXP
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 2, 497) = 35.24
Model | 8735.42401 2 4367.712 Prob > F = 0.0000
Residual | 61593.5422 497 123.930668 R-squared = 0.1242
-----------+------------------------------ Adj R-squared = 0.1207
Total | 70328.9662 499 140.939812 Root MSE = 11.132
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.877563 .2237434 8.39 0.000 1.437964 2.317163
EXP | .9833436 .2098457 4.69 0.000 .5710495 1.395638
_cons | -14.66833 4.288375 -3.42 0.001 -23.09391 -6.242752
----------------------------------------------------------------------------

Слайд 21

21

Когда вы связываете заработную плату с учебой и опытом работы, она, если часто

разумно предположить, что влияние опыта работы подлежит уменьшению.

МУЛЬТИКОЛЛИНЕАРНОСТЬ

. reg EARNINGS S EXP
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 2, 497) = 35.24
Model | 8735.42401 2 4367.712 Prob > F = 0.0000
Residual | 61593.5422 497 123.930668 R-squared = 0.1242
-----------+------------------------------ Adj R-squared = 0.1207
Total | 70328.9662 499 140.939812 Root MSE = 11.132
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.877563 .2237434 8.39 0.000 1.437964 2.317163
EXP | .9833436 .2098457 4.69 0.000 .5710495 1.395638
_cons | -14.66833 4.288375 -3.42 0.001 -23.09391 -6.242752
----------------------------------------------------------------------------

Слайд 22

22

Стандартный способ разрешить это - включить EXPSQ, квадрат EXP, в спецификацию. Согласно гипотезе

о снижении доходности, коэффициент EXPSQ должен быть отрицательным.

МУЛЬТИКОЛЛИНЕАРНОСТЬ

. reg EARNINGS S EXP
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 2, 497) = 35.24
Model | 8735.42401 2 4367.712 Prob > F = 0.0000
Residual | 61593.5422 497 123.930668 R-squared = 0.1242
-----------+------------------------------ Adj R-squared = 0.1207
Total | 70328.9662 499 140.939812 Root MSE = 11.132
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.877563 .2237434 8.39 0.000 1.437964 2.317163
EXP | .9833436 .2098457 4.69 0.000 .5710495 1.395638
_cons | -14.66833 4.288375 -3.42 0.001 -23.09391 -6.242752
----------------------------------------------------------------------------

Слайд 23

23

Мы вписываем эту спецификацию с помощью набора данных 21

МУЛЬТИКОЛЛИНЕАРНОСТЬ

. reg EARNINGS S EXP

EXPSQ
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 3, 496) = 23.63
Model | 8793.741 3 2931.247 Prob > F = 0.0000
Residual | 61535.2252 496 124.062954 R-squared = 0.1250
-----------+------------------------------ Adj R-squared = 0.1197
Total | 70328.9662 499 140.939812 Root MSE = 11.138
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.869284 .2241882 8.34 0.000 1.428809 2.30976
EXP | 1.427853 .6814907 2.10 0.037 .0888882 2.766817
EXPSQ | -.0328379 .047896 -0.69 0.493 -.126942 .0612662
_cons | -15.7658 4.57953 -3.44 0.001 -24.76347 -6.76813
----------------------------------------------------------------------------

Слайд 24

24

Школьный компонент результатов регрессии мало влияет на включение термина EXPSQ. Коэффициент S указывает,

что дополнительный год обучения увеличивается почасовой заработок на 1,88 доллара. В спецификации без EXPSQ было 1,87.

МУЛЬТИКОЛЛИНЕАРНОСТЬ

. reg EARNINGS S EXP EXPSQ
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.869284 .2241882 8.34 0.000 1.428809 2.30976
EXP | 1.427853 .6814907 2.10 0.037 .0888882 2.766817
EXPSQ | -.0328379 .047896 -0.69 0.493 -.126942 .0612662
_cons | -15.7658 4.57953 -3.44 0.001 -24.76347 -6.76813
----------------------------------------------------------------------------

. reg EARNINGS S EXP
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.877563 .2237434 8.39 0.000 1.437964 2.317163
EXP | .9833436 .2098457 4.69 0.000 .5710495 1.395638
_cons | -14.66833 4.288375 -3.42 0.001 -23.09391 -6.242752
----------------------------------------------------------------------------

Слайд 25

25

МУЛЬТИКОЛЛИНЕАРНОСТЬ

Аналогично, стандартная ошибка 0.22 в спецификации без EXPSQ также мало изменилась, и коэффициент

остается очень значительным.

. reg EARNINGS S EXP EXPSQ
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.869284 .2241882 8.34 0.000 1.428809 2.30976
EXP | 1.427853 .6814907 2.10 0.037 .0888882 2.766817
EXPSQ | -.0328379 .047896 -0.69 0.493 -.126942 .0612662
_cons | -15.7658 4.57953 -3.44 0.001 -24.76347 -6.76813
----------------------------------------------------------------------------

. reg EARNINGS S EXP
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.877563 .2237434 8.39 0.000 1.437964 2.317163
EXP | .9833436 .2098457 4.69 0.000 .5710495 1.395638
_cons | -14.66833 4.288375 -3.42 0.001 -23.09391 -6.242752
----------------------------------------------------------------------------

Слайд 26

26

МУЛЬТИКОЛЛИНЕАРНОСТЬ

В спецификации без EXPSQ коэффициент EXP значителен на уровне 0,1 процента. Когда добавляется

EXPSQ, это значимо только на уровне 5 процентов.

. reg EARNINGS S EXP EXPSQ
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.869284 .2241882 8.34 0.000 1.428809 2.30976
EXP | 1.427853 .6814907 2.10 0.037 .0888882 2.766817
EXPSQ | -.0328379 .047896 -0.69 0.493 -.126942 .0612662
_cons | -15.7658 4.57953 -3.44 0.001 -24.76347 -6.76813
----------------------------------------------------------------------------

. reg EARNINGS S EXP
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.877563 .2237434 8.39 0.000 1.437964 2.317163
EXP | .9833436 .2098457 4.69 0.000 .5710495 1.395638
_cons | -14.66833 4.288375 -3.42 0.001 -23.09391 -6.242752
----------------------------------------------------------------------------

Слайд 27

27

МУЛЬТИКОЛЛИНЕАРНОСТЬ

Это связано главным образом с тем, что стандартная ошибка увеличилась с 0,21 до

0,68, что свидетельствует о значительной потере точности.

. reg EARNINGS S EXP EXPSQ
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.869284 .2241882 8.34 0.000 1.428809 2.30976
EXP | 1.427853 .6814907 2.10 0.037 .0888882 2.766817
EXPSQ | -.0328379 .047896 -0.69 0.493 -.126942 .0612662
_cons | -15.7658 4.57953 -3.44 0.001 -24.76347 -6.76813
----------------------------------------------------------------------------

. reg EARNINGS S EXP
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.877563 .2237434 8.39 0.000 1.437964 2.317163
EXP | .9833436 .2098457 4.69 0.000 .5710495 1.395638
_cons | -14.66833 4.288375 -3.42 0.001 -23.09391 -6.242752
----------------------------------------------------------------------------

Слайд 28

28

МУЛЬТИКОЛЛИНЕАРНОСТЬ

В исходной спецификации 95-процентный доверительный интервал для коэффициента EXP составлял от 0,57 до

1,40, что уже достаточно свободно. Теперь это от 0.09 до 2.76.

. reg EARNINGS S EXP EXPSQ
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.869284 .2241882 8.34 0.000 1.428809 2.30976
EXP | 1.427853 .6814907 2.10 0.037 .0888882 2.766817
EXPSQ | -.0328379 .047896 -0.69 0.493 -.126942 .0612662
_cons | -15.7658 4.57953 -3.44 0.001 -24.76347 -6.76813
----------------------------------------------------------------------------

. reg EARNINGS S EXP
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.877563 .2237434 8.39 0.000 1.437964 2.317163
EXP | .9833436 .2098457 4.69 0.000 .5710495 1.395638
_cons | -14.66833 4.288375 -3.42 0.001 -23.09391 -6.242752
----------------------------------------------------------------------------

Имя файла: Мультиколлинеарность.pptx
Количество просмотров: 20
Количество скачиваний: 0