Слайд 2
![МНК и основные гипотезы Применение МНК даёт систему k+1 линейных](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-1.jpg)
МНК и основные гипотезы
Применение МНК
даёт систему k+1
линейных алгебраических
уравнений с
k+1 неизвестными (систему нормальных
уравнений): ,
откуда:
Гипотезы гомоскедастичности и
независимости:
Слайд 3
![Оценка дисперсии ошибок Несмещённая оценка равна: Числа степеней свободы (df)](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-2.jpg)
Оценка дисперсии ошибок
Несмещённая оценка равна:
Числа степеней свободы (df)
Пусть n –
число наблюдений, k – число факторов. Разность называется числом степеней свободы
(разность между числом наблюдений и числом оцененных параметров).
Для надёжной оценки формулы связи требуется: (как минимум)
Слайд 4
![Если , то коэффициенты регрессии оцениваются единственным образом. Если ,](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-3.jpg)
Если , то коэффициенты регрессии оцениваются единственным образом.
Если
, то нельзя найти точную формулу связи, а необходимо выбрать наилучшее приближение для имеющихся наблюдений – устойчивую формулу связи.
Слайд 5
![Коэффициент детерминации Для модели регрессии со свободным членом справедливо соотношение: или откуда](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-4.jpg)
Коэффициент детерминации
Для модели регрессии со свободным членом справедливо соотношение:
или
откуда
Слайд 6
![Свойства коэффициента детерминации: При добавлении фактора (регрессора) в модель величина](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-5.jpg)
Свойства коэффициента детерминации:
При добавлении фактора (регрессора) в модель величина R2 не
убывает.
При преобразовании зависимой переменной R2 изменяется.
Для устранения эффекта возрастания R2
при увеличении числа регрессоров исполь-
зуют скорректированный (adjusted) ( )
Слайд 7
![Индекс корреляции R R характеризует тесноту связи между набором всех](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-6.jpg)
Индекс корреляции R
R характеризует тесноту связи между набором всех факторов
xj и результативным признаком у:
Данная формула не зависит от вида уравнения и от факторов xj .
Слайд 8
![Особенности спецификации множественной регрессии Отбор факторов Выбор вида уравнения Отбор](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-7.jpg)
Особенности спецификации множественной регрессии
Отбор факторов
Выбор вида уравнения
Отбор – I стадия:
на основе качественного теоретико-экономического анализа, исходя из природы взаимосвязи изучаемых явлений.
Отбор – II стадия: анализ взаимосвязи всех
признаков и целесообразности их включения в модель.
Условие качественной регрессии: независимость
факторов между собой (анализируется матрица
попарных коэффициентов корреляции )
Слайд 9
![Отбор факторов. Коллинеар-ность и мультиколлинеарность Коллинеарность – линейная взаимосвязь двух](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-8.jpg)
Отбор факторов. Коллинеар-ность и мультиколлинеарность
Коллинеарность – линейная взаимосвязь двух регрессоров (выявляется
с помощью матрицы парных корреляций: )
Мультиколлинеарность – линейная связь (корреляция) более 2х регрессоров (определяется с помощью матрицы межфакторной корреляции:
– критерий наличия мультиколлинеарности:
чем ближе к нулю, тем сильнее
мультиколлинеарность.
Слайд 10
![Матрица межфакторной корреляции](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-9.jpg)
Матрица межфакторной корреляции
Слайд 11
![Последствия мультиколлинеарности При наличии мультиколлинеар-ности матрица является вырожденной (обратная матрица](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-10.jpg)
Последствия мультиколлинеарности
При наличии мультиколлинеар-ности матрица является вырожденной (обратная матрица не
существует)
МНК-оценки имеют большую вариацию и являются ненадёжными
Интерпретация параметров затрудняет-ся, они теряют экономический смысл
Слайд 12
![Внешние признаки наличия мультиколлинеарности Некоторые из МНК-оценок имеют непра-вильные (с](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-11.jpg)
Внешние признаки наличия мультиколлинеарности
Некоторые из МНК-оценок имеют непра-вильные (с точки зрения
экономической теории) значения или знаки
Небольшое изменение исходных данных приводит к существенному изменению оценок
Большинство оценок параметров являются статистически незначимыми, а модель в целом – значимой
Слайд 13
![Методы устранения мультиколлинеарности Удаление из модели факторов, ответст-венных за мультиколлинеарность](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-12.jpg)
Методы устранения мультиколлинеарности
Удаление из модели факторов, ответст-венных за мультиколлинеарность (задача их
выявления)
Преобразование факторов, уменьшающее корреляцию между ними
Построение совмещённого уравнения регрессии, например:
Слайд 14
![Выявление факторов, ответст-венных за мультиколлинеарность Экпериментальные методы отбора (перебора) факторов](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-13.jpg)
Выявление факторов, ответст-венных за мультиколлинеарность
Экпериментальные методы отбора (перебора) факторов (
в 6-7 раз)
Использование индексов детерминации
(переменные, ответственные за мультиколлинеарность, дают значения
, близкие к 1)
Слайд 15
![Отбор факторов с помощью частных корреляций Парные коэффициенты корреляции могут](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-14.jpg)
Отбор факторов с помощью частных корреляций
Парные коэффициенты корреляции могут давать завышенные
оценки связи из-за взаимосвязи факторов.
Частные корреляции элиминируют влияние других факторов, т.е. оценивают парные связи в «чистом» виде:
- коэффициент (k-1)-го порядка
Слайд 16
![Так как при включении в уравнение связи нового фактора величина](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-15.jpg)
Так как при включении в уравнение связи нового фактора величина
увеличивается, то следовательно величина остаточной дисперсии будет уменьшаться.
Показатель частной корреляции выражается отношением уменьшения остаточной дисперсии к её величине, рассчитанной до этого.
Если , то в частности:
Слайд 17
![Коэффициенты частной корреляции различных порядков связаны рекуррентным соотношением:](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-16.jpg)
Коэффициенты частной корреляции различных порядков связаны рекуррентным соотношением:
Слайд 18
![В частности:](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-17.jpg)
Слайд 19
![Фиктивные переменные используются, когда в модель необходимо включить качественные признаки,](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-18.jpg)
Фиктивные переменные
используются, когда в модель необходимо включить качественные признаки, оценить
их влияние на у, исследовать структурные изменения и т. п.
Если качественный признак z имеет два значения, то их обозначают числами
0 и 1 (бинарная переменная).
Если качественный признак имеет несколько значений (L градаций), то для его описания используют несколько бинарных переменных (L – 1).
Слайд 20
![Пример: Модель 1: Модель 2: где - з/плата, - количественные](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-19.jpg)
Пример:
Модель 1:
Модель 2:
где - з/плата, - количественные
объясняющие переменные.
Проверяя
гипотезу ,
можно ответить на вопрос: влияет ли наличие высшего образования на размер з/платы.
Слайд 21
![Интерпретация результатов регрессии с фиктивными переменными Коэффициент регрессии (в линейной](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-20.jpg)
Интерпретация результатов регрессии с фиктивными переменными
Коэффициент регрессии (в линейной модели)
отражает величину
эффекта (прироста) соответст-
вующей градации качественного фактора.
Фиктивная переменная может выступать в
роли результативного признака у. При этом
(в вероятностной модели) значение признака
интерпретируется как доля (вероятность)
осуществления соответствующей альтернативы.
Слайд 22
![Уравнение регрессии в стандартизированной форме. - коэффициенты Пусть . Применяя](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-21.jpg)
Уравнение регрессии в стандартизированной форме.
- коэффициенты
Пусть . Применяя к
исходным данным у, х, нормирующее преобразование (центрирование и нормирование):
получим уравнение:
, где
Слайд 23
![Аналогично строится множественное уравнение с бета-коэффициентами: Связь между бета-коэффициентами и](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-22.jpg)
Аналогично строится множественное уравнение с бета-коэффициентами:
Связь между бета-коэффициентами и коэффициентами «чистой»
регрессии:
позволяет перейти от одной формы к другой. При этом
– сравнимы между собой,
- не сравнимы.
Слайд 24
![Связь индекса детерминации с бета-коэффициентами – частный индекс детерминации. Он](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-23.jpg)
Связь индекса детерминации
с бета-коэффициентами
– частный индекс детерминации. Он характеризует вклад
каждого фактора в общий индекс детерминации.
(справедливо для линейной регрессии)
Слайд 25
![Анализ качества регрессионной модели Содержательная часть Статистическая часть Проверка статистического](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-24.jpg)
Анализ качества регрессионной модели
Содержательная часть
Статистическая часть
Проверка статистического качества
уравнения регрессии:
проверка статистической
значимости каждого коэффициента регрессии
(t-критерий)
2) проверка значимости регрессии в целом
(F-критерий)
3) проверка выполнения основных гипотез (предпосылок МНК)
Слайд 26
![Содержательная проверка качества модели Интерпретация коэффициентов регрессии: коэффициент регрессии bj](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-25.jpg)
Содержательная проверка качества модели
Интерпретация коэффициентов регрессии:
коэффициент регрессии bj показывает, на
сколько единиц изменяется в среднем у при изменении хj на 1 единицу (при неизменности остальных факторов).
Сравнение факторов между собой
с помощью коэффициентов эластичности Ej
и бета-коэффициентов :
Прогнозирование по уравнению регрессии
Слайд 27
![Точечный и интервальный прогнозы по уравнению регрессии Точечный прогноз определяется](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-26.jpg)
Точечный и интервальный прогнозы
по уравнению регрессии
Точечный прогноз определяется
подстановкой значений вектора
в уравнение.
Интервальный прогноз:
Слайд 28
![Проверка статистической значимости Проверка гипотезы Гипотеза отвергается, если Доверительный интервал: 2) Проверка гипотезы Гипотеза отвергается, если](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-27.jpg)
Проверка статистической значимости
Проверка гипотезы
Гипотеза отвергается,
если
Доверительный интервал:
2) Проверка гипотезы
Гипотеза отвергается, если
Слайд 29
![Проверка выполнения предпосылок МНК Основные гипотезы (1-5) касаются поведения остатков](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-28.jpg)
Проверка выполнения предпосылок МНК
Основные гипотезы (1-5) касаются поведения остатков .
При их выполнении МНК-оценки коэффициентов регрессии являются:
несмещёнными
состоятельными
эффективными
Если характер остатков не соответствует некоторым гипотезам, модель следует корректировать
Слайд 30
![Гипотеза случайности остатков и равенства нулю их средней величины гарантирует](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-29.jpg)
Гипотеза случайности остатков и равенства нулю их средней величины гарантирует несмещённость
МНК-оценок
Гетероскедастичность сказывается на уменьшении эффективности МНК-оценок
Выполнение гипотезы независимости обеспечивает состоятельность и эффективность МНК-оценок
Несмещённость оценок обеспечивается также независимостью случайных остатков
и переменных х
Слайд 31
![Графический способ проверки гипотез Определяются оценки случайных остатков: Строится график](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-30.jpg)
Графический способ проверки гипотез
Определяются оценки случайных остатков:
Строится график зависимости остатков
от теоретических значений результативного признака либо от значений факторов х
Если расположение точек на графике не имеет определённой направленности (т.е. точки можно поместить в горизонтальную полосу), то проверяемая гипотеза выполняется
Слайд 32
![Проверка случайности остатков и их гомоскедастичности осуществляется по графику в](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-31.jpg)
Проверка случайности остатков и их гомоскедастичности осуществляется по графику в системе
координат
Проверка независимости остатков от регрессоров осуществляется по графику в системе координат
Проверка независимости остатков – отсутствия автокорреляции соседних наблюдений – осуществляется
с помощью расчёта и
оценки значимости парных коэффициентов корреляции:
Слайд 33
![Нарушение гипотезы гомоскедастичности Этап 1: визуальная проверка наличия гетероскедастичности (график](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-32.jpg)
Нарушение гипотезы гомоскедастичности
Этап 1: визуальная проверка наличия гетероскедастичности (график остатков)
Этап 2:
статистическая проверка наличия гетероскедастичности
(тест Гольфельда-Квандта: упорядоченные по х наблюдения разбивают на две группы; по критерию Фишера проверяют гипотезу о равенстве дисперсий остатков в этих группах)
оценка зависимости остатков от значений х с помощью ранговой корреляции Спирмена
Этап 3: построение регрессии с учётом гетероскедастичности (обобщённый метод наименьших квадратов)
Слайд 34
![Обобщённый метод наименьших квадратов (ОМНК) При нарушении гомоскедастичности имеем: Тогда](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-33.jpg)
Обобщённый метод наименьших квадратов (ОМНК)
При нарушении гомоскедастичности имеем:
Тогда можно записать:
где - коэффициент неоднородности дисперсии; - неизвестно.
Это приводит к взвешенному МНК (ОМНК):
Слайд 35
![В частности, парную линейную модель с гетероскедастичными остатками можно привести](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-34.jpg)
В частности, парную линейную модель
с гетероскедастичными остатками
можно
привести к уравнению с гомоскедастичными остатками ( )
и новыми переменными .
Необходимо определить величины
и внести поправки в исходные данные.
Часто предполагается, что остатки пропорциональны значениям фактора.
Слайд 36
![Пример: у – издержки производства х1 – объём продукции х2](/_ipx/f_webp&q_80&fit_contain&s_1440x1080/imagesDir/jpg/13308/slide-35.jpg)
Пример:
у – издержки производства
х1 – объём продукции
х2
– основные фонды
х3 – численность работников
Пусть новые факторы:
- производите- - фондовоо-
льность труда ружённость
Пусть новые факторы :
- фондоёмкость и - трудоёмкость продукции