Статистические методы обработки экспериментальных данных презентация

Содержание

Слайд 2

Математическая статистика – раздел математики, посвященный математическим методам систематизации, обработки

Математическая статистика – раздел математики, посвященный математическим методам систематизации, обработки

и использования статистических данных для научных и практических выводов
А.Н. Колмогорови Ю.В. Прохоров
Слайд 3

Источники изменчивости

Источники изменчивости

Слайд 4

Закон больших чисел – это объективный математический закон, согласно которому

Закон больших чисел – это объективный математический закон, согласно которому совместное

действие большого числа случайных факторов приводит к результату, почти не зависящему от случая
Статистический подход – это выявление закономерной изменчивости на фоне случайных факторов и причин
Слайд 5

Основные понятия

Основные понятия

Слайд 6

Совокупность – исходное понятие математической статистики, объединяющее обычно какое-либо множество

Совокупность – исходное понятие математической статистики, объединяющее обычно какое-либо множество

испытуемых (учащихся) по одному или нескольким интересующим признакам.

Генеральная и выборочная совокупности

Слайд 7

Слайд 8

Репрезентативность правильная представимость в выборке пропорций генеральной совокупности

Репрезентативность
правильная представимость в выборке пропорций генеральной совокупности

Слайд 9

Описательная статистика

Описательная статистика

Слайд 10

Переменная (variable) - это параметр измерения, который можно контролировать или которым можно манипулировать в исследовании.

Переменная (variable) -  это параметр измерения, который можно контролировать или которым

можно манипулировать в исследовании.
Слайд 11

Относительное значение параметра - отношение числа объектов, имеющих этот показатель,

Относительное значение параметра - отношение числа объектов, имеющих этот показатель, к

величине выборки. Выражается относительным числом или в процентах (процентное значение)
Слайд 12

Удельное значение данного признака - расчетная величина, показывающая количество объектов

Удельное значение данного признака - расчетная величина, показывающая количество объектов с

данным показателем, которое содержалось бы в условной выборке, состоящей из 10, или 100, 1000 и т. д. объектов.

 

Слайд 13

Минимум и максимум —минимальное и максимальное значения перемен­ной

Минимум и максимум —минимальное и максимальное значения перемен­ной

Слайд 14

Среднее (оценка среднего, выборочное среднее) — сумма значений переменной, деленная на n (число значений перемен­ной)

Среднее (оценка среднего, выборочное среднее) — сумма значений переменной, деленная на

n (число значений перемен­ной)

 

Слайд 15

Пример Результаты контроля посещаемости внеклассных мероприятий

Пример

Результаты контроля посещаемости внеклассных мероприятий

Слайд 16

Выборочное среднее является той точкой, сумма отклонений наблюдений от которой

Выборочное среднее является той точкой, сумма отклонений наблюдений от которой равна

0
(`х  - х1) + (`х  - х2) + ... + (`х  - хn) =0
Слайд 17

 

 

Слайд 18

Пример Результаты контроля посещаемости внеклассных мероприятий

Пример

Результаты контроля посещаемости внеклассных мероприятий

Слайд 19

 

Слайд 20

Пример Результаты контроля посещаемости внеклассных мероприятий

Пример

Результаты контроля посещаемости внеклассных мероприятий

Слайд 21

Медиана разбивает выборку на две равные части. Половина значений переменной

Медиана разбивает выборку на две равные части. Половина значений переменной лежит

ниже медианы, половина — выше
   Квартили представляют собой значения, которые делят две половины выборки (разбитые медианой) еще раз пополам
Слайд 22

Мода представляет собой максимально часто встречающееся значение пере­менной

Мода представляет собой максимально часто встречающееся значение пере­менной

Слайд 23

Пример

Пример

Слайд 24

 

Слайд 25

 

Слайд 26

Понятие нулевой и альтернативной гипотезы

Понятие нулевой и альтернативной гипотезы

Слайд 27

Статистическая гипотеза – это предположение о свойствах случайных величин или

Статистическая гипотеза – это предположение о свойствах случайных величин или событий,

которое мы хотим проверить по имеющимся данным.
Слайд 28

Пример Гипотеза 1. Успеваемость класса стохастически (вероятностно) зависит от уровня

Пример

Гипотеза 1. Успеваемость класса стохастически (вероятностно) зависит от уровня обучаемости учащихся.


Гипотеза 2. Усвоение начального курса математики не имеет существенных различий у учащихся, начавших обучение с 6 или 7 лет.
Гипотеза 3. Проблемное обучение в первом классе эффективнее по сравнению с традиционной методикой обучения в отношении общего развития учащихся
Слайд 29

Нулевая гипотеза – это основное проверяемое предположение, которое обычно формулируется

Нулевая гипотеза – это основное проверяемое предположение, которое обычно формулируется как

отсутствие различий, отсутствие влияние фактора, отсутствие эффекта, равенство нулю значений выборочных характеристик и т.п.
Альтернативная гипотеза – альтернативное проверяемое предположение(не всегда строго противоположное или обратное первому).
Слайд 30

Пример H0: Различие в результатах выполнения двумя группами учащихся одной

Пример

H0: Различие в результатах выполнения двумя группами учащихся одной и той

же контрольной работы вызвано лишь случайными причинами
H1: Уровни выполнения работы в двух группах учащихся различны и это различие определяется влиянием неслучайных факторов, например, тех или других методов обучения
Слайд 31

— можно отвергнуть нулевую гипотезу, когда она на самом деле

— можно отвергнуть нулевую гипотезу, когда она на самом деле верна

(так называемая ошибка первого рода)
— можно принять нулевую гипотезу, когда она на самом деле не верна (так называемая ошибка второго рода)

Ошибки при проверке гипотез

Слайд 32

— можно отвергнуть нулевую гипотезу, когда она на самом деле

— можно отвергнуть нулевую гипотезу, когда она на самом деле верна

(так называемая ошибка первого рода)
— можно принять нулевую гипотезу, когда она на самом деле не верна (так называемая ошибка второго рода)

Ошибки при проверке гипотез

Слайд 33

Уровень значимости – это вероятность ошибки первого рода при принятии

Уровень значимости – это вероятность ошибки первого рода при принятии решения

(вероятность ошибочного отклонения нулевой гипотезы).

Ошибки при проверке гипотез

Слайд 34

Допустимая вероятность ошибки первого рода (Ркр) может быть равна 5%

Допустимая вероятность ошибки первого рода (Ркр) может быть равна 5% или

1% (0.05 или 0.01).

Ошибки при проверке гипотез

Слайд 35

Статистика критерия (Т) — некоторая функция от исходных данных, по значению которой проверяется нулевая гипотеза

Статистика критерия (Т) — некоторая функция от исходных данных, по значению

которой проверяется нулевая гипотеза
Слайд 36

Критическая область – совокупность значений критерия, при котором нулевую гипотезу

Критическая область – совокупность значений критерия, при котором нулевую гипотезу отвергают

Область принятия нулевой гипотезы (область допустимых значений) – совокупность значений критерия, при котором нулевую гипотезу принимают
Слайд 37

Общие принципы проверки статистических гипотез

Общие принципы проверки статистических гипотез

Слайд 38

задается допустимая вероятность ошибки первого рода (Ркр=0,05) выбирается статистика критерия

  задается допустимая вероятность ошибки первого рода (Ркр=0,05)
выбирается статистика критерия (Т)
ищется

область допустимых значений
по исходным данным вычисляется значение статистики Т
если Т (статистика критерия) принадлежит области принятия нулевой гипотезы, то нулевая гипотеза принимается, в противном случае нулевая гипотеза отвергается и принимается альтернативная гипотеза

Процедура проверки нулевой гипотезы

Слайд 39

Слайд 40

Слайд 41

Выбор критерия

Выбор критерия

Слайд 42

Выбор критерия

Выбор критерия

Слайд 43

Данные подчиняются закону нормального распределения? Да Нет Независимые Связанные С

Данные подчиняются закону нормального распределения?

Да

Нет

Независимые

Связанные

С заданным значением

Независимые

Связанные

С заданным значением

2


T-критерий Стьюдента для независимых выборок, Критерий Крамера-Уэлча (при различиях в дисперсии)

Однофакторный дисперсионный анализ, t-критерий Стьюдента с поправкой Бонферрони

≥3

2

≥3

2

≥3

2

≥3

1

1

T-критерий Стьюдента для парных выборок

Дисперсионный анализ для повторных наблюдений

T-критерий Стьюдента для одной выборки

Критерий Манна-Уитни, Q-Критерий Розенбаума

Критерий Краскела-Уоллиса

Критерий Уилкоксона G-Критерий знаков,

Критерий Фридмана

Критерий Уилкоксона

Группы независимые, связанные или проводится сравнение с заданным значением?

Сколько групп сравниваем?

Алгоритм выбора переменных для анализа количественных данных*

Слайд 44

Группы независимые, связанные или проводится сравнение с заданным значением? Независимые

Группы независимые, связанные или проводится сравнение с заданным значением?

Независимые

Связанные

С заданным значением

2

Точный критерий Фишера, Критерий хи-квадрат  Пирсона, Критерий хи-квадрат  с поправкой Йетса

Критерий хи-квадрат  Пирсона, Критерий хи-квадрат  с поправкой на правдоподобие

≥3

2

≥3

1

Тест Мак-Немара

Критерий Q Кохрена

Критерий Z

Сколько групп сравниваем?

Алгоритм выбора переменных для анализа качественных данных*

Слайд 45

Какой тип данных анализируем? Ненормальный Нормальный ≤2 Коэффициент корреляции Спирмена,

Какой тип данных анализируем?

Ненормальный

Нормальный

≤2

Коэффициент корреляции Спирмена, Коэффициент корреляции Кендалла

Коэффициент

корреляции Спирмена, Факторный анализ, Коэффициент корреляции Кендалла

≥3

Алгоритм выбора переменных для анализа корреляции

≤2

Коэффициент корреляции Пирсона

Коэффициент корреляции Пирсона, Факторный анализ

≥3

Любой

≤2

Отношение шансов , Критерий V Крамера, Критерий К Чупрова

Критерий V Крамера, Критерий К Чупрова

≥3

Количественные

Качественные

Тип распределения

Сколько групп сравниваем?

Слайд 46

Слайд 47

Слайд 48

Слайд 49

Слайд 50

Слайд 51

Критерий Стьюдента (t-критерий)

 

Критерий Стьюдента (t-критерий)

Слайд 52

Критерий Стьюдента (t-критерий)

 

Критерий Стьюдента (t-критерий)

Слайд 53

Критерий Стьюдента (t-критерий)

 

Критерий Стьюдента (t-критерий)

Слайд 54

Нулевая гипотеза принимается, если tэмп Критерий Стьюдента (t-критерий) tкрит Область принятия нулевой гипотезы Критическая область

Нулевая гипотеза принимается, если
tэмп

Критерий Стьюдента (t-критерий)

tкрит

Область принятия нулевой гипотезы


Критическая область

Слайд 55

Критерий Стьюдента (t-критерий) n1=11, n2=9 Хср=13,636; Yср=9,444 σx=2,346; σ y=2,061

Критерий Стьюдента (t-критерий)

n1=11, n2=9

Хср=13,636; Yср=9,444

σx=2,346; σ y=2,061

Слайд 56

Критерий Стьюдента (t-критерий)

Критерий Стьюдента (t-критерий)

 

Слайд 57

Критерий Стьюдента (t-критерий)

Критерий Стьюдента (t-критерий)

 

Слайд 58

Критерий Стьюдента (t-критерий)

Критерий Стьюдента (t-критерий)

Слайд 59

Критерий Стьюдента (t-критерий)

Критерий Стьюдента (t-критерий)

 

Слайд 60

Критерий Фишера

 

Критерий Фишера

Слайд 61

Нулевая гипотеза принимается, если Fэмп >Fкрит Критерий Фишера Fкрит Область принятия нулевой гипотезы Критическая область

Нулевая гипотеза принимается, если
Fэмп >Fкрит

Критерий Фишера

Fкрит

Область принятия нулевой гипотезы


Критическая область

Слайд 62

Чис­ло степеней свободы: k1=nl - 1 для первой выборки (т.е.

Чис­ло степеней свободы:
k1=nl - 1 для первой выборки (т.е. для той

выборки, величина дисперсии которой больше) и k2=n2 - 1 для второй выборки.

Критерий Фишера

Слайд 63

Критерий Фишера

 

Критерий Фишера

Слайд 64

Критерий Фишера

Критерий Фишера

Слайд 65

Критерий Фишера

Критерий Фишера

 

Слайд 66

Критерий Фишера

 

Критерий Фишера

Слайд 67

Критерий Фишера

Критерий Фишера

Слайд 68

Критерий Фишера Fкрит=3,23 Fэмп=3,25 Fкрит Область принятия нулевой гипотезы Критическая область

Критерий Фишера

Fкрит=3,23
Fэмп=3,25

Fкрит

Область принятия нулевой гипотезы

Критическая область

Слайд 69

Имеется две серии наблюдений над случайными переменными X и У,

Имеется две серии наблюдений над случайными переменными X и У, полученные

при рассмотрении двух зависимых выборок. На их основе составлено N пар вида (хi, уi), где хi, уi — результаты двукратного измерения одного и того же свойства у одного и того же объекта.
Элементы каждой пары хi, уi сравниваются между собой по величине, и паре присваивается знак «+», ес­ли хi < уi , знак «—», если хi > уi и «0», если хi = уi.

Критерий знаков (G-критерий)

Слайд 70

Имеется две серии наблюдений над случайными переменными X и У,

Имеется две серии наблюдений над случайными переменными X и У, полученные

при рассмотрении двух зависимых выборок. На их основе составлено N пар вида (хi, уi), где хi, уi — результаты двукратного измерения одного и того же свойства у одного и того же объекта.
Элементы каждой пары хi, уi сравниваются между собой по величине, и паре присваивается знак «+», ес­ли хi < уi , знак «—», если хi > уi и «0», если хi = уi.

Критерий знаков (G-критерий)

Слайд 71

Ста­тистика критерия (Т) определяется следую­щим образом: Допустим, что из N

Ста­тистика критерия (Т) определяется следую­щим образом:
Допустим, что из N пар

(х, у,) нашлось несколько пар, в которых значения хi и уi равны. Такие пары обозначаются знаком «0» и при подсчете значения ве­личины Т не учитываются. Предположим, что за вы­четом из числа N числа пар, обозначенных знаком «0», осталось всего n пар. Среди оставшихся n пар подсчита­ем число пар, обозначенных знаком «-», т.е, пары, в которых xiНулевая гипотеза принимается на уровне значимости 0,05, если наблю­даемое значение T

Критерий знаков (G-критерий)

Слайд 72

Критерий знаков (G-критерий)

Критерий знаков (G-критерий)

Слайд 73

Критерий знаков (G-критерий) Т=10 N = 12

Критерий знаков (G-критерий)

Т=10
N = 12

Слайд 74

Критерий знаков (G-критерий) n-ta = 9

Критерий знаков (G-критерий)

n-ta = 9

Слайд 75

Критерий знаков (G-критерий) n-ta Область принятия нулевой гипотезы Критическая область n-ta = 9 Т=10

Критерий знаков (G-критерий)

n-ta

Область принятия нулевой гипотезы

Критическая область

n-ta = 9

Т=10

Слайд 76

Критерий не рекомендуется использовать, если: 1) сумма объемов двух выборок

Критерий не рекомендуется использовать, если:
1)      сумма объемов двух выборок меньше

20;
2)      хотя бы одна из абсолютных частот в таблице 2X2, составленной на основе экспериментальных данных, меньше 5.

Критерий χ2 (хи-квадрат)

Слайд 77

Критерий χ2 (хи-квадрат)

Критерий χ2 (хи-квадрат)

Слайд 78

Критерий χ2 (хи-квадрат)

Критерий χ2 (хи-квадрат)

 

Слайд 79

Критерий χ2 (хи-квадрат)

Критерий χ2 (хи-квадрат)

Слайд 80

Критерий χ2 (хи-квадрат)

Критерий χ2 (хи-квадрат)

 

Слайд 81

Критерий χ2 (хи-квадрат)

Критерий χ2 (хи-квадрат)

Слайд 82

Критерий χ2 (хи-квадрат) Ткритич = 3,84 T = 1,86 Ткритич Область принятия нулевой гипотезы Критическая область

Критерий χ2 (хи-квадрат)

Ткритич = 3,84
T = 1,86

Ткритич

Область принятия нулевой гипотезы

Критическая

область
Слайд 83

Критерий χ2 (хи-квадрат)

Критерий χ2 (хи-квадрат)

Слайд 84

Критерий χ2 (хи-квадрат) k=С—1

Критерий χ2 (хи-квадрат)

 

k=С—1

Слайд 85

Ссылки Гржибовский А. М. Выбор статистического критерия для проверки гипотез

Ссылки

Гржибовский А. М. Выбор статистического критерия для проверки гипотез // Экология

человека. 2008. №11. URL: https://cyberleninka.ru/article/n/vybor-statisticheskogo-kriteriya-dlya-proverki-gipotez (дата обращения: 16.06.2018).
Сайт Медицинская статистика: http://medstatistic.ru/index.php
Имя файла: Статистические-методы-обработки-экспериментальных-данных.pptx
Количество просмотров: 139
Количество скачиваний: 0