Методы многомерного анализа в психологии презентация

Содержание

Слайд 3

Лекция 1. Введение в многомерный статистический анализ

Слайд 4

Общее представление о многомерном анализе данных
Выборка и шкалы измерений
Числовые характеристики распределений. Визуальный анализ

данных
4. Краткий обзор методов многомерного анализа статистических данных

http://statosphere.ru/books-arch/statistica-books/85-halafyan.html
http://www.statcats.ru/2016/03/blog-post.html
http://statistica.ru/textbook/elementarnye-ponyatiya-statistiki/#23

Слайд 5

1890 – из послесловия Ф.Гальтона к книге Джеймса Кеттела (Cattell J.) Mental Test

and Measurements: «Психология не может стать прочной и точной, как физические науки, если не будет основываться на эксперименте и измерении»

Г. Галилей: «Измеряй все, поддающееся измерению, и сделай таким все, не поддающееся измерению»

Слайд 6

Измерение в психологии:
диагностические процедуры, направленные на определение количественной выраженности тех или иных психологических

феноменов;
используются шкалы, представляющие собой некоторое множество символов, прежде всего математических, которые ставятся в определенное соответствие с психологическими элементами

Слайд 7

Многомерным статистическим анализом называется раздел математической статистики, изучающий методы сбора и обработки многомерных

статистических данных, их систематизации и обработки с целью выявления характера и структуры взаимосвязей между компонентами исследуемого многомерного признака, получения практических выводов
Калинина, Введение в многомерный статистический анализ

Слайд 8

Многомерный статистический анализ дает возможность получить общие выводы относительно всей совокупности данных.
Учитывая,

что анализируемые данные являются стохастическими, т.е. ограниченными и неполными, использование методов многомерного анализа является не только оправданным, но и существенно необходимым.
Халафян, Учебник STATISTICA 6. Статистический анализ данных

Слайд 9

http://statosphere.ru/books-arch/statistica-books/85-halafyan.html
Многомерный статистический анализ -
раздел математической статистики, посвященный математическим методам построения оптимальных планов

сбора, систематизации и обработки многомерных статистических данных, направленных на выявление характера и структуры взаимосвязей между компонентами исследуемого многомерного признака и предназначенных для получения научных и практических выводов.

Слайд 10

Под многомерным признаком понимается р-мерный вектор X = (х1,х2 …, хр) показателей

(признаков, переменных) х1, x2...,хр, среди которых могут быть количественные, т.е. скалярно измеряющие в определенной шкале степень проявления изучаемого свойства объекта; порядковые (или ординальные), т.е. позволяющие упорядочить анализируемые объекты по степени проявления в них изучаемого свойства; и классификационные (или номинальные), т.е. позволяющие разбивать исследуемую совокупность объектов на однородные (по анализируемым свойствам) классы.

Слайд 11

Стивенс, 1946, 1951: измерение как «приписывание чисел объектам или событиям согласно правилам»
4

шкалы измерений:
Наименований (один объект отличается от другого)
Порядковая (один объект в чем-то превосходит другой)
Интервальная (один объект на сколько-то больше другого)
Отношений (один объект в какое-то количество раз отличается от другого, есть нулевая точка – «абсолютный ноль»)
Интервальные измерения: истинная разность последовательных единиц шкалы равна разности двух любых последовательных целых единиц этой шкалы.
Какой тип шкалы?
Школьные оценки
Шкала Цельсия
Шкала Лайкерта (Ликерта)
Шкала Терстоуна (шкала равнокажущихся интервалов)

Слайд 12

По материалам Википедии от 08.02.2017
Шкала Лайкерта, или Ликерта (Likert scale /'lɪkərt/, шкала суммарных оценок) -

испытуемый оценивает степень своего согласия с каждым суждением, от «полностью согласен» до «полностью не согласен». Сумма оценок отдельных сужений позволяет выявить установку испытуемого по какому-либо вопросу. Предполагается, что отношение к исследуемому предмету основано на простых непротиворечивых суждениях и представляет собой континуум от одной критической точки через нейтральную к противоположной критической.
«Шкала Лайкерта» может означать два разных понятия: (1) суммативный психометрический конструкт, то есть свойство, измеряемое суммой баллов от всех пунктов, относимых к этому свойству; (2) балльная оценочная (рейтинговая) шкала для каждого отдельного пункта.
Рейтинговые шкалы типа лайкертовских (2) более корректно считать порядковыми, а не интервальными по уровню измерения, однако на практике их часто принимают за интервальные, так как методов обработки интервальных данных больше и они проще. Суммативная шкала Лайкерта — поскольку она суммирует баллы — трактует рейтинговую шкалу пунктов как интервальную (порядковые данные суммировать невозможно)

Слайд 13

Генеральная совокупность – это любая совокупность объектов, относительно которой исследователь делает вывод. Теоретически

генеральная совокупность неограниченна.
Выборка – любая подгруппа элементов (испытуемых,
респондентов) выделенная из генеральной совокупности для проведения эксперимента. Оптимально, если каждый участник генеральной совокупности имеет равную вероятность быть включенным в исследование
Выборочное исследование – исследование, при котором производится выбор ограниченного числа элементов из изучаемой генеральной совокупности.

Слайд 14

Требования к выборке:
1. Однородность. Выбор осуществляется на основаниях: возраст, уровень интеллекта, национальность, заболевания.
2.

Репрезентативность. Качество выборки, позволяющее распространять полученные на ней выводы на всю генеральную совокупность. Состав экспериментальной выборки - это модель генеральной совокупности.
Любая выборка может быть репрезентативной лишь в каких-то определенных, но не всех отношениях. Например, если выборка сделана по социально-образовательному признаку, это не значит, что она будет репрезентативна и для возрастной структуры населения или для разных типов семьи и т.д.
Рекомендуемый объем выборки: не менее 30-35 человек в изучаемой группе.
При использовании методов многомерного анализа объем выборки должен быть существенно больше: от 100-150 испытуемых.

Слайд 15


Числовые характеристики распределений
Мода – это числовое значение, встречающееся в выборке наиболее часто. Обозначается

через Мo.
Медиана – это значение, которое делит упорядоченный ряд пополам. Обозначается через Ме.
Среднее арифметическое – это сумма всех элементов, деленная на их количество.
Дисперсия – мера разброса данных относительно
среднего значения. Стандартное отклонение – корень квадратный из дисперсии.

Слайд 16

http://www.statcats.ru/2016/03/blog-post.html
Владимир Савельев: Статистика и котики

Слайд 19

Среднее значение и среднеквадратическое отклонение очень часто совместно используются для описания той или иной группы

котиков. Как правило, около 68% котиков, находятся в пределе одногосреднеквадратического   отклонения от среднего. Эти котики обладают нормальным размером. Оставшиеся 32% либо очень большие, либо очень маленькие. В целом же, для большинства котиковых признаков картина выглядит вот так:

Слайд 20

Нормальное распределение
Нормальное распределение вероятностей особенно часто используется в статистике.
Нормальное распределение дает

хорошую модель для реальных явлений, в которых:
1) имеется сильная тенденция данных группироваться вокруг центра;
2) положительные и отрицательные отклонения от центра равновероятны;
3) частота отклонений быстро падает, когда отклонения от центра становятся большими.
Механизм, лежащий в основе нормального распределения, объясняется с помощью
центральной предельной теоремы:

Слайд 21

Центральная предельная теорема
Основная идея: при суммировании большого числа независимых величин в

определенных разумных условиях получаются именно нормально распределенные величины.
Иными словами, если на некоторую переменную воздействует множество факторов, эти воздействия независимы, относительно малы и слагаются друг с другом, то получаемая в итоге величина имеет нормальное распределение.
Визуально график нормальной плотности - знаменитая колоколообразная кривая.
Нормальное распределение описывается двумя параметрами:
mean — среднее;
stantard deviation — стандартное отклонение

Слайд 22

Меры различий для несвязанных выборок

Параметрический метод - Стьюдента

Непараметрический метод – Манна-Уитни

Слайд 23

Статистическая гипотеза – научная гипотеза, допускающая статистическую проверку.
Примеры:
Исследование интеллекта у подростков

из полных и неполных семей. Можно ли сделать вывод о том, что неполная семью ведет к снижению интеллекта у подростков?
Неработающие женщины имеют показатели самооценки ниже, чем работающие женщины. Можно ли утверждать, что трудовая занятость способствует повышению самооценки? Эти решения всегда вероятностны.
Выделяют нулевую и альтернативную гипотезы. Пример:
Нулевая гипотеза (H0) – гипотеза об отсутствии связи в генеральной совокупности.
Альтернативная (H1) – гипотеза о наличии связи.
Уровень значимости – вероятность ошибочного отклонения нулевой гипотезы.

Слайд 25

Двухмерный - 2М визуальный анализ
Визуальный анализ данных на плоскости. В двухмерном визуальном

анализе используются разнообразные гистограммы, диаграммы рассеяния, вероятностные графики, линейные графики, диаграммы диапазонов, размахов, круговые диаграммы, столбчатые диаграммы, последовательные графики (графики последовательных значений) и т. д., позволяющие увидеть специфику данных.

Слайд 26

Термин гистограмма ввел Карл Пирсон в 1895 году. Гистограммы позволяют увидеть, как

распределены значения переменных по интервалам группировки, то есть как часто переменные принимают значения из различных интервалов.
Наглядно показывают, какие значения или диапазоны значений исследуемой переменной являются наиболее частыми, насколько сильно они различаются между собой, как сконцентрировано большинство наблюдений вокруг среднего, является распределение симметричным или нет, имеет ли оно одну моду или несколько мод, то есть является мультимодальным.

Слайд 27

Гистограмма, или распределение частот значений переменной по интервалам, представляет интерес по следующим

причинам:
 по форме распределения можно охарактеризовать природу исследуемой переменной (например, наличие двух мод - наиболее высоких столбцов гистограммы, иначе говоря - бимодальность распределения может означать, что выборка неоднородна и состоит из наблюдений, принадлежащих двум различным генеральным совокупностям);
 многие статистики критериев основаны на определенных предположениях о виде распределения, например, на предположении нормальности; гистограммы помогают визуально проверить выполнение этих предположений. 

Слайд 28

Краткий обзор
методов многомерного анализа данных

Слайд 29

Корреляционный анализ. Корреляционные плеяды, корреляционные графы.
Корреляция –согласованное изменение признаков. Если при изменении одной

величины изменяется другая, то между их показателями будет наблюдаться корреляция. Наличие корреляции двух переменных не говорит о причинно-следственных зависимостях между ними, однако дает возможность выдвинуть такую гипотезу.
Регрессионный анализ - количественное представление связи или зависимости между X и Y. Множественная регрессия (предикторы, зависимая переменная)
Дисперсионный анализ (анализ изменчивости признака под влиянием каких-либо контролируемых переменных факторов)
Кластерный анализ (группировка данных)
Факторный анализ (метод сокращения данных)
Имя файла: Методы-многомерного-анализа-в-психологии.pptx
Количество просмотров: 28
Количество скачиваний: 0