Современные методы статистического анализа кадастровых данных. Этапы построения моделей презентация

Содержание

Слайд 2

Этапы построения моделей

Этапы построения моделей

Слайд 3

Регрессионный анализ заключается в определении аналитического выражения связи (в определении

Регрессионный анализ заключается в определении аналитического выражения связи (в определении функции),

в котором изменение одной величины (результативного признака) обусловлено влиянием независимой величины (факторного признака).

Количественно оценить данную взаимосвязь можно с помощью построения уравнения регрессии или регрессионной функции.

Слайд 4

Слайд 5

Задачи регрессионного анализа

Задачи регрессионного анализа

Слайд 6

Линейная регрессия — используемая в статистике регрессионная модель зависимости одной

Линейная регрессия  — используемая в статистике регрессионная модель зависимости одной (объясняемой, зависимой) переменной y

от другой или нескольких других переменных (факторов, регрессоров, независимых переменных) x с линейной функцией зависимости.
Слайд 7

Линейная парная модель наблюдений если α и β— «истинные» значения

Линейная парная модель наблюдений

если α и β— «истинные» значения параметров

линейной модели связи, то
ε представляет собой случайный член или ошибку в i-ом наблюдении
Слайд 8

Случайная величина ε характеризует отклонение реального значения результативного признака от

Случайная величина ε характеризует отклонение реального значения результативного признака от теоретического.


Влияет на не учтённые в модели факторы, случайных ошибок и особенностей измерений.
Слайд 9

Невключение объясняющих переменных. Т.е. существуют другие факторы, влияющие на у,

Невключение объясняющих переменных. Т.е. существуют другие факторы, влияющие на у, которые

не учтены в уравнении. Влияние их приводит к тому, что точки не лежат на одной прямой.
Агрегирование переменных. Рассматриваемая зависимость является попыткой объединить некоторое число объектов, которые, возможно, обладают различными характеристиками.
Неправильное описание структуры модели. Т.е., если зависимость относится к данным о временном ряде, то значение у может зависеть не от фактического значения x, а от значения, которое ожидалось в предыдущем периоде. Если ожидаемое и фактическое значение тесно связаны, то будет казаться, что между y и x существует зависимость, но это будет лишь аппроксимация, и расхождение вновь будет связанно с наличием случайного члена.
Неправильная функциональная спецификация. Т.е. функциональное соотношение между y и x может быть определено неправильно.
Ошибки измерения. Если в измерении одной или более взаимосвязанных переменных имеются ошибки, то наблюдаемые значения не соответствуют такому соотношению, и существующие расхождения будут увеличивать значения остаточного члена.

Причины возникновения случайной ошибки:

Слайд 10

Параметр β - коэффициент регрессии - на сколько в среднем

Параметр β - коэффициент регрессии - на сколько в среднем изменится

результативный признак y при изменении факторного признака x на единицу своего измерения.
Знак параметра β в уравнении парной регрессии указывает на направление связи.

Если, β > 0, то связь между изучаемыми показателями прямая, т. е. с увеличением факторного признака x увеличивается и результативный признак, и наоборот.

Если β < 0, то связь между изучаемыми показателями обратная, т. е. с увеличением фактора x результат уменьшается, и наоборот.

Слайд 11

Значение параметра α в уравнении парной регрессии трактуется как среднее

Значение параметра α в уравнении парной регрессии трактуется как среднее значение

результативного признака y при условии, что факторный признак x равен нулю. Такая трактовка параметра α возможна только в том случае, если значение x = 0 имеет смысл.
Слайд 12

.

 

.

Слайд 13

Для линейных и нелинейных уравнений, приводимых к линейным, решается следующая система относительно a и b.

Для линейных и нелинейных уравнений, приводимых к линейным, решается следующая система

относительно
a и b.
Слайд 14

Нелинейная регрессия — это вид регрессионного анализа, в котором экспериментальные

Нелинейная регрессия — это вид регрессионного анализа, в котором экспериментальные данные моделируются функцией,

являющейся нелинейной комбинацией параметров модели и зависящей от одной и более независимых переменных
Слайд 15

Классы нелинейных регрессий полиномы разных степеней равносторонняя гипербола степенная показательная экспоненциальная

Классы нелинейных регрессий

полиномы разных степеней

равносторонняя гипербола

степенная

показательная

экспоненциальная

 

Слайд 16

Оценка значимости построенной модели парной регрессии Адекватность модели (качество) Значимость коэффициентов уравнения регрессии

Оценка значимости построенной модели парной регрессии

Адекватность модели (качество)

Значимость коэффициентов уравнения регрессии

Слайд 17

Адекватность модели (качество) 1) коэффициент апроксимации – среднее отклонение расчетных

Адекватность модели (качество)

1) коэффициент апроксимации – среднее отклонение расчетных значений от

фактических:

Допустимый предел значений – не более 8-10%.

Слайд 18

2) доля дисперсии, объясняемую регрессией, в общей дисперсии результативного признака

2) доля дисперсии, объясняемую регрессией, в общей дисперсии результативного признака y

характеризует индекс детерминации R2:

 

Адекватность модели (качество)

чем ближе к 1, тем лучше качество модели

Слайд 19

3) F-тест – оценивание качества уравнения регрессии – состоит в

3) F-тест – оценивание качества уравнения регрессии – состоит в проверке

гипотезы Ho о статистической незначимости уравнения регрессии и показателя тесноты связи.

где n – число единиц совокупности,
m – число параметров при переменных x.

Адекватность модели (качество)

Для этого выполняется сравнение фактического Fфакт и критического (табличного) Fтабл значений F-критерия Фишера.

Слайд 20

Слайд 21

Значимость коэффициентов уравнения регрессии 1) t-критерий Стьюдента. Выдвигается гипотеза о

Значимость коэффициентов уравнения регрессии

1) t-критерий Стьюдента. Выдвигается гипотеза о случайной природе

показателей, т.е. о незначимом их отличии от нуля.

t-критерия Стьюдента рассчитываются для параметров линейной регрессии и коэффициента корреляции

Случайные ошибки параметров линейной регрессии и коэффициента корреляции

Слайд 22

Оценка значимости коэффициентов регрессии и корреляции с помощью t-критерия Стьюдента

Оценка значимости коэффициентов регрессии и корреляции с помощью t-критерия Стьюдента проводится

путем сопоставления их значений с величиной случайной ошибки
Слайд 23

2) Доверительный интервал – предельные значения статистической величины, которая с

2) Доверительный интервал – предельные значения статистической величины, которая с заданной доверительной

вероятностью будет находится в этом интервале при выборке большего объема. 

Значимость коэффициентов уравнения регрессии

определяем предельную ошибку ∆ для каждого показателя

Слайд 24

расчет доверительных интервалов Значимость коэффициентов уравнения регрессии , , .

расчет доверительных интервалов

Значимость коэффициентов уравнения регрессии

,

,

.

Слайд 25

Значимость коэффициентов уравнения регрессии . Если в границы доверительного интервала

Значимость коэффициентов уравнения регрессии

.

Если в границы доверительного интервала попадает ноль, т.е.

нижняя граница отрицательная, а верхняя положительна, то оцениваемый параметр принимается нулевым, так как он не может одновременно принимать и положительное, и отрицательное значения.
Слайд 26

. Множественная регрессия - изучение связи между тремя и более

.

Множественная регрессия - изучение связи между тремя и более связанными между

собой признаками. Требуется определить аналитическое выражение связи между признаком y и объясняющими переменными x1, x2, …, xn в виде y = f(x1, x2, …, xn).
Слайд 27

. Этапы построения модели множественной регрессии

.

Этапы построения модели множественной регрессии

Слайд 28

Линейная множественная модель наблюдений α - значения параметров линейной модели связи

Линейная множественная модель наблюдений

α - значения параметров линейной модели связи

Слайд 29

. Оценка значимости построенной модели 1) Коэффициент множественной детерминации квадрат

.

Оценка значимости построенной модели

1) Коэффициент множественной детерминации

квадрат индекса множественной корреляции


где n – число наблюдений,
m – число факторов

Слайд 30

. 4) Мультиколлинеарность – понятие, которое используется для описания проблемы,

.

4) Мультиколлинеарность – понятие, которое используется для описания проблемы, когда нестрогая

линейная зависимость между факторами приводит к получению ненадежных оценок регрессии
Слайд 31

. 4) F-критерий Фишера

.

4) F-критерий Фишера

Слайд 32

Значимость коэффициентов уравнения регрессии 1) t-критерий Стьюдента. Выдвигается гипотеза о

Значимость коэффициентов уравнения регрессии

1) t-критерий Стьюдента. Выдвигается гипотеза о случайной природе

показателей, т.е. о незначимом их отличии от нуля.

где
mbi - средняя квадратическая ошибка коэффициента регрессии bi,

Слайд 33

Нелинейные множественные регрессионные модели Степенная: Параболическая: Гиперболическая: Показательная

Нелинейные множественные регрессионные модели

Степенная:

Параболическая:

Гиперболическая:

Показательная

Имя файла: Современные-методы-статистического-анализа-кадастровых-данных.-Этапы-построения-моделей.pptx
Количество просмотров: 65
Количество скачиваний: 0