Статистические методы обработки экспериментальных данных презентация

Содержание

Слайд 2

Математическая статистика – раздел математики, посвященный математическим методам систематизации, обработки

Математическая статистика – раздел математики, посвященный математическим методам систематизации, обработки и использования статистических
и использования статистических данных для научных и практических выводов
А.Н. Колмогорови Ю.В. Прохоров

Слайд 3

Источники изменчивости

Источники изменчивости

Слайд 4

Закон больших чисел – это объективный математический закон, согласно которому совместное

Закон больших чисел – это объективный математический закон, согласно которому совместное действие большого
действие большого числа случайных факторов приводит к результату, почти не зависящему от случая
Статистический подход – это выявление закономерной изменчивости на фоне случайных факторов и причин

Слайд 5

Основные понятия

Основные понятия

Слайд 6

Совокупность – исходное понятие математической статистики, объединяющее обычно какое-либо множество

Совокупность – исходное понятие математической статистики, объединяющее обычно какое-либо множество испытуемых (учащихся) по
испытуемых (учащихся) по одному или нескольким интересующим признакам.

Генеральная и выборочная совокупности

Слайд 8

Репрезентативность
правильная представимость в выборке пропорций генеральной совокупности

Репрезентативность правильная представимость в выборке пропорций генеральной совокупности

Слайд 9

Описательная статистика

Описательная статистика

Слайд 10

Переменная (variable) -  это параметр измерения, который можно контролировать или которым

Переменная (variable) - это параметр измерения, который можно контролировать или которым можно манипулировать в исследовании.
можно манипулировать в исследовании.

Слайд 11

Относительное значение параметра - отношение числа объектов, имеющих этот показатель, к

Относительное значение параметра - отношение числа объектов, имеющих этот показатель, к величине выборки.
величине выборки. Выражается относительным числом или в процентах (процентное значение)

Слайд 12

Удельное значение данного признака - расчетная величина, показывающая количество объектов с

Удельное значение данного признака - расчетная величина, показывающая количество объектов с данным показателем,
данным показателем, которое содержалось бы в условной выборке, состоящей из 10, или 100, 1000 и т. д. объектов.

 

Слайд 13

Минимум и максимум —минимальное и максимальное значения перемен­ной

Минимум и максимум —минимальное и максимальное значения перемен­ной

Слайд 14

Среднее (оценка среднего, выборочное среднее) — сумма значений переменной, деленная на

Среднее (оценка среднего, выборочное среднее) — сумма значений переменной, деленная на n (число значений перемен­ной)
n (число значений перемен­ной)

 

Слайд 15

Пример

Результаты контроля посещаемости внеклассных мероприятий

Пример Результаты контроля посещаемости внеклассных мероприятий

Слайд 16

Выборочное среднее является той точкой, сумма отклонений наблюдений от которой равна

Выборочное среднее является той точкой, сумма отклонений наблюдений от которой равна 0 (`х
0
(`х  - х1) + (`х  - х2) + ... + (`х  - хn) =0

Слайд 18

Пример

Результаты контроля посещаемости внеклассных мероприятий

Пример Результаты контроля посещаемости внеклассных мероприятий

Слайд 20

Пример

Результаты контроля посещаемости внеклассных мероприятий

Пример Результаты контроля посещаемости внеклассных мероприятий

Слайд 21

Медиана разбивает выборку на две равные части. Половина значений переменной лежит

Медиана разбивает выборку на две равные части. Половина значений переменной лежит ниже медианы,
ниже медианы, половина — выше
   Квартили представляют собой значения, которые делят две половины выборки (разбитые медианой) еще раз пополам

Слайд 22

Мода представляет собой максимально часто встречающееся значение пере­менной

Мода представляет собой максимально часто встречающееся значение пере­менной

Слайд 23

Пример

Пример

Слайд 26

Понятие нулевой и альтернативной гипотезы

Понятие нулевой и альтернативной гипотезы

Слайд 27

Статистическая гипотеза – это предположение о свойствах случайных величин или событий,

Статистическая гипотеза – это предположение о свойствах случайных величин или событий, которое мы
которое мы хотим проверить по имеющимся данным.

Слайд 28

Пример

Гипотеза 1. Успеваемость класса стохастически (вероятностно) зависит от уровня обучаемости учащихся.

Пример Гипотеза 1. Успеваемость класса стохастически (вероятностно) зависит от уровня обучаемости учащихся. Гипотеза

Гипотеза 2. Усвоение начального курса математики не имеет существенных различий у учащихся, начавших обучение с 6 или 7 лет.
Гипотеза 3. Проблемное обучение в первом классе эффективнее по сравнению с традиционной методикой обучения в отношении общего развития учащихся

Слайд 29

Нулевая гипотеза – это основное проверяемое предположение, которое обычно формулируется как

Нулевая гипотеза – это основное проверяемое предположение, которое обычно формулируется как отсутствие различий,
отсутствие различий, отсутствие влияние фактора, отсутствие эффекта, равенство нулю значений выборочных характеристик и т.п.
Альтернативная гипотеза – альтернативное проверяемое предположение(не всегда строго противоположное или обратное первому).

Слайд 30

Пример

H0: Различие в результатах выполнения двумя группами учащихся одной и той

Пример H0: Различие в результатах выполнения двумя группами учащихся одной и той же
же контрольной работы вызвано лишь случайными причинами
H1: Уровни выполнения работы в двух группах учащихся различны и это различие определяется влиянием неслучайных факторов, например, тех или других методов обучения

Слайд 31

— можно отвергнуть нулевую гипотезу, когда она на самом деле верна

— можно отвергнуть нулевую гипотезу, когда она на самом деле верна (так называемая
(так называемая ошибка первого рода)
— можно принять нулевую гипотезу, когда она на самом деле не верна (так называемая ошибка второго рода)

Ошибки при проверке гипотез

Слайд 32

— можно отвергнуть нулевую гипотезу, когда она на самом деле верна

— можно отвергнуть нулевую гипотезу, когда она на самом деле верна (так называемая
(так называемая ошибка первого рода)
— можно принять нулевую гипотезу, когда она на самом деле не верна (так называемая ошибка второго рода)

Ошибки при проверке гипотез

Слайд 33

Уровень значимости – это вероятность ошибки первого рода при принятии решения

Уровень значимости – это вероятность ошибки первого рода при принятии решения (вероятность ошибочного
(вероятность ошибочного отклонения нулевой гипотезы).

Ошибки при проверке гипотез

Слайд 34

Допустимая вероятность ошибки первого рода (Ркр) может быть равна 5% или

Допустимая вероятность ошибки первого рода (Ркр) может быть равна 5% или 1% (0.05
1% (0.05 или 0.01).

Ошибки при проверке гипотез

Слайд 35

Статистика критерия (Т) — некоторая функция от исходных данных, по значению

Статистика критерия (Т) — некоторая функция от исходных данных, по значению которой проверяется нулевая гипотеза
которой проверяется нулевая гипотеза

Слайд 36

Критическая область – совокупность значений критерия, при котором нулевую гипотезу отвергают

Критическая область – совокупность значений критерия, при котором нулевую гипотезу отвергают Область принятия
Область принятия нулевой гипотезы (область допустимых значений) – совокупность значений критерия, при котором нулевую гипотезу принимают

Слайд 37

Общие принципы проверки статистических гипотез

Общие принципы проверки статистических гипотез

Слайд 38

  задается допустимая вероятность ошибки первого рода (Ркр=0,05)
выбирается статистика критерия (Т)
ищется

задается допустимая вероятность ошибки первого рода (Ркр=0,05) выбирается статистика критерия (Т) ищется область
область допустимых значений
по исходным данным вычисляется значение статистики Т
если Т (статистика критерия) принадлежит области принятия нулевой гипотезы, то нулевая гипотеза принимается, в противном случае нулевая гипотеза отвергается и принимается альтернативная гипотеза

Процедура проверки нулевой гипотезы

Слайд 41

Выбор критерия

Выбор критерия

Слайд 42

Выбор критерия

Выбор критерия

Слайд 43

Данные подчиняются закону нормального распределения?

Да

Нет

Независимые

Связанные

С заданным значением

Независимые

Связанные

С заданным значением

2

Данные подчиняются закону нормального распределения? Да Нет Независимые Связанные С заданным значением Независимые

T-критерий Стьюдента для независимых выборок, Критерий Крамера-Уэлча (при различиях в дисперсии)

Однофакторный дисперсионный анализ, t-критерий Стьюдента с поправкой Бонферрони

≥3

2

≥3

2

≥3

2

≥3

1

1

T-критерий Стьюдента для парных выборок

Дисперсионный анализ для повторных наблюдений

T-критерий Стьюдента для одной выборки

Критерий Манна-Уитни, Q-Критерий Розенбаума

Критерий Краскела-Уоллиса

Критерий Уилкоксона G-Критерий знаков,

Критерий Фридмана

Критерий Уилкоксона

Группы независимые, связанные или проводится сравнение с заданным значением?

Сколько групп сравниваем?

Алгоритм выбора переменных для анализа количественных данных*

Слайд 44

Группы независимые, связанные или проводится сравнение с заданным значением?

Независимые

Связанные

С заданным значением

Группы независимые, связанные или проводится сравнение с заданным значением? Независимые Связанные С заданным
2

Точный критерий Фишера, Критерий хи-квадрат  Пирсона, Критерий хи-квадрат  с поправкой Йетса

Критерий хи-квадрат  Пирсона, Критерий хи-квадрат  с поправкой на правдоподобие

≥3

2

≥3

1

Тест Мак-Немара

Критерий Q Кохрена

Критерий Z

Сколько групп сравниваем?

Алгоритм выбора переменных для анализа качественных данных*

Слайд 45

Какой тип данных анализируем?

Ненормальный

Нормальный

≤2

Коэффициент корреляции Спирмена, Коэффициент корреляции Кендалла

Коэффициент

Какой тип данных анализируем? Ненормальный Нормальный ≤2 Коэффициент корреляции Спирмена, Коэффициент корреляции Кендалла
корреляции Спирмена, Факторный анализ, Коэффициент корреляции Кендалла

≥3

Алгоритм выбора переменных для анализа корреляции

≤2

Коэффициент корреляции Пирсона

Коэффициент корреляции Пирсона, Факторный анализ

≥3

Любой

≤2

Отношение шансов , Критерий V Крамера, Критерий К Чупрова

Критерий V Крамера, Критерий К Чупрова

≥3

Количественные

Качественные

Тип распределения

Сколько групп сравниваем?

Слайд 51

 

Критерий Стьюдента (t-критерий)

Критерий Стьюдента (t-критерий)

Слайд 52

 

Критерий Стьюдента (t-критерий)

Критерий Стьюдента (t-критерий)

Слайд 53

 

Критерий Стьюдента (t-критерий)

Критерий Стьюдента (t-критерий)

Слайд 54

Нулевая гипотеза принимается, если
tэмп

Критерий Стьюдента (t-критерий)

tкрит

Область принятия нулевой гипотезы

Нулевая гипотеза принимается, если tэмп Критерий Стьюдента (t-критерий) tкрит Область принятия нулевой гипотезы Критическая область

Критическая область

Слайд 55

Критерий Стьюдента (t-критерий)

n1=11, n2=9

Хср=13,636; Yср=9,444

σx=2,346; σ y=2,061

Критерий Стьюдента (t-критерий) n1=11, n2=9 Хср=13,636; Yср=9,444 σx=2,346; σ y=2,061

Слайд 56

Критерий Стьюдента (t-критерий)

 

Критерий Стьюдента (t-критерий)

Слайд 57

Критерий Стьюдента (t-критерий)

 

Критерий Стьюдента (t-критерий)

Слайд 58

Критерий Стьюдента (t-критерий)

Критерий Стьюдента (t-критерий)

Слайд 59

Критерий Стьюдента (t-критерий)

 

Критерий Стьюдента (t-критерий)

Слайд 60

 

Критерий Фишера

Критерий Фишера

Слайд 61

Нулевая гипотеза принимается, если
Fэмп >Fкрит

Критерий Фишера

Fкрит

Область принятия нулевой гипотезы

Нулевая гипотеза принимается, если Fэмп >Fкрит Критерий Фишера Fкрит Область принятия нулевой гипотезы Критическая область

Критическая область

Слайд 62

Чис­ло степеней свободы:
k1=nl - 1 для первой выборки (т.е. для той

Чис­ло степеней свободы: k1=nl - 1 для первой выборки (т.е. для той выборки,
выборки, величина дисперсии которой больше) и k2=n2 - 1 для второй выборки.

Критерий Фишера

Слайд 63

 

Критерий Фишера

Критерий Фишера

Слайд 64

Критерий Фишера

Критерий Фишера

Слайд 65

Критерий Фишера

 

Критерий Фишера

Слайд 66

 

Критерий Фишера

Критерий Фишера

Слайд 67

Критерий Фишера

Критерий Фишера

Слайд 68

Критерий Фишера

Fкрит=3,23
Fэмп=3,25

Fкрит

Область принятия нулевой гипотезы

Критическая область

Критерий Фишера Fкрит=3,23 Fэмп=3,25 Fкрит Область принятия нулевой гипотезы Критическая область

Слайд 69

Имеется две серии наблюдений над случайными переменными X и У, полученные

Имеется две серии наблюдений над случайными переменными X и У, полученные при рассмотрении
при рассмотрении двух зависимых выборок. На их основе составлено N пар вида (хi, уi), где хi, уi — результаты двукратного измерения одного и того же свойства у одного и того же объекта.
Элементы каждой пары хi, уi сравниваются между собой по величине, и паре присваивается знак «+», ес­ли хi < уi , знак «—», если хi > уi и «0», если хi = уi.

Критерий знаков (G-критерий)

Слайд 70

Имеется две серии наблюдений над случайными переменными X и У, полученные

Имеется две серии наблюдений над случайными переменными X и У, полученные при рассмотрении
при рассмотрении двух зависимых выборок. На их основе составлено N пар вида (хi, уi), где хi, уi — результаты двукратного измерения одного и того же свойства у одного и того же объекта.
Элементы каждой пары хi, уi сравниваются между собой по величине, и паре присваивается знак «+», ес­ли хi < уi , знак «—», если хi > уi и «0», если хi = уi.

Критерий знаков (G-критерий)

Слайд 71

Ста­тистика критерия (Т) определяется следую­щим образом:
Допустим, что из N пар

Ста­тистика критерия (Т) определяется следую­щим образом: Допустим, что из N пар (х, у,)
(х, у,) нашлось несколько пар, в которых значения хi и уi равны. Такие пары обозначаются знаком «0» и при подсчете значения ве­личины Т не учитываются. Предположим, что за вы­четом из числа N числа пар, обозначенных знаком «0», осталось всего n пар. Среди оставшихся n пар подсчита­ем число пар, обозначенных знаком «-», т.е, пары, в которых xiНулевая гипотеза принимается на уровне значимости 0,05, если наблю­даемое значение T

Критерий знаков (G-критерий)

Слайд 72

Критерий знаков (G-критерий)

Критерий знаков (G-критерий)

Слайд 73

Критерий знаков (G-критерий)

Т=10
N = 12

Критерий знаков (G-критерий) Т=10 N = 12

Слайд 74

Критерий знаков (G-критерий)

n-ta = 9

Критерий знаков (G-критерий) n-ta = 9

Слайд 75

Критерий знаков (G-критерий)

n-ta

Область принятия нулевой гипотезы

Критическая область

n-ta = 9

Т=10

Критерий знаков (G-критерий) n-ta Область принятия нулевой гипотезы Критическая область n-ta = 9 Т=10

Слайд 76

Критерий не рекомендуется использовать, если:
1)      сумма объемов двух выборок меньше

Критерий не рекомендуется использовать, если: 1) сумма объемов двух выборок меньше 20; 2)
20;
2)      хотя бы одна из абсолютных частот в таблице 2X2, составленной на основе экспериментальных данных, меньше 5.

Критерий χ2 (хи-квадрат)

Слайд 77

Критерий χ2 (хи-квадрат)

Критерий χ2 (хи-квадрат)

Слайд 78

Критерий χ2 (хи-квадрат)

 

Критерий χ2 (хи-квадрат)

Слайд 79

Критерий χ2 (хи-квадрат)

Критерий χ2 (хи-квадрат)

Слайд 80

Критерий χ2 (хи-квадрат)

 

Критерий χ2 (хи-квадрат)

Слайд 81

Критерий χ2 (хи-квадрат)

Критерий χ2 (хи-квадрат)

Слайд 82

Критерий χ2 (хи-квадрат)

Ткритич = 3,84
T = 1,86

Ткритич

Область принятия нулевой гипотезы

Критическая

Критерий χ2 (хи-квадрат) Ткритич = 3,84 T = 1,86 Ткритич Область принятия нулевой гипотезы Критическая область
область

Слайд 83

Критерий χ2 (хи-квадрат)

Критерий χ2 (хи-квадрат)

Слайд 84

Критерий χ2 (хи-квадрат)

 

k=С—1

Критерий χ2 (хи-квадрат) k=С—1

Слайд 85

Ссылки

Гржибовский А. М. Выбор статистического критерия для проверки гипотез // Экология

Ссылки Гржибовский А. М. Выбор статистического критерия для проверки гипотез // Экология человека.
человека. 2008. №11. URL: https://cyberleninka.ru/article/n/vybor-statisticheskogo-kriteriya-dlya-proverki-gipotez (дата обращения: 16.06.2018).
Сайт Медицинская статистика: http://medstatistic.ru/index.php
Имя файла: Статистические-методы-обработки-экспериментальных-данных.pptx
Количество просмотров: 115
Количество скачиваний: 0