Математическая биостатистика. Основные понятия и принципы обработки презентация

Содержание

Слайд 2

1.Основные понятия биостатистики

Биостатистика (Biostatistics) - научная отрасль, связанная с разработкой и использованием статистических

методов в научных исследованиях в медицине, здравоохранении и эпидемиологии.
Два раздела: Описательная и Аналитическая.
Цель описательной биостатистики - сбор, систематизация данных, получение обобщенных показателей о предмете исследования;
Задача аналитической биостатистики - получение статистических выводов на основе собранной и систематизированной информации об объекте исследования.

1.Основные понятия биостатистики Биостатистика (Biostatistics) - научная отрасль, связанная с разработкой и использованием

Слайд 3

Во многом успехи, достигнутые биологией, связаны с планированием эксперимента и использованием методов статистической

обработки полученных данных, т. е. с использованием биометрии.
С помощью биометрии можно сделать обоснованные выводы о процессах, протекающих в живой природе, проверить достоверность гипотез, выявить биологические закономерности.
Данные, не обработанные математически, в большинстве случаев не имеют научной ценности и практической значимости.
Более того, игнорирование возможностей статистической обработки полученных данных может привести к ошибочным заключениям.

Во многом успехи, достигнутые биологией, связаны с планированием эксперимента и использованием методов статистической

Слайд 4

Биометрия – это наука о математическом анализе групповых свойств в биологии.
Групповые свойства –

это такие особенности, признаки, которые проявляются только у группы объектов; отдельные объекты групповыми свойствами не обладают.
Н/п, яйценоскость кур за месяц составила 25,5 яйца, однако, ни одна курица пол-яйца не снесла.
Статистическая совокупность - множество объектов, обладающих определенными групповыми свойствами. Может иметь разный объем.
Выделяют генеральную и выборочную совокупность.

Биометрия – это наука о математическом анализе групповых свойств в биологии. Групповые свойства

Слайд 5

Генеральная совокупность

охватывает всех членов данного множества, ее объем может быть конечным, а чаще

– бесконечным.
Например, стадо коров учхоза представляет собой новую породную группу. Значит, коровы учхоза являются генеральной совокупностью, но они являются составной частью другой, более обширной генеральной совокупности всех коров, объем которой бесконечен.
Генеральную совокупность можно создать искусственно. Ее объем зависит от цели исследования.

Генеральная совокупность охватывает всех членов данного множества, ее объем может быть конечным, а

Слайд 6

Выборочная совокупность

- это группа объектов, взятая из генеральной совокупности для характеристики генеральной

совокупности.
Выборочная совокупность определяется следующим образом.
берем генеральную совокупность (г.с.);
выбираем достаточное количество объектов из г.с., чаще всего случайным образом.
При этом необходимо, чтобы в.с. была репрезентативной – представительной.
Уже по трем объектам можно судить о параметрах г.с. с определенной точностью и надежностью.

Выборочная совокупность - это группа объектов, взятая из генеральной совокупности для характеристики генеральной

Слайд 7

Биостатистика изучает признаки, которые могут быть качественными и количественными.
Качественные признаки воспринимаются непосредственно

органами чувств (цвет, консистенция и т.п.). Качественные признаки выступают в форме альтернативных, взаимоисключающих признаков (белый – не белый).
Количественные признаки требуют счета (счетные) или меры (мерные). Счетные признаки дискретны и выражаются целыми числами. Мерные признаки требуют измерения (размеры, вес и т.п.), при этом могут получиться любые числа.

Биостатистика изучает признаки, которые могут быть качественными и количественными. Качественные признаки воспринимаются непосредственно

Слайд 8

Любой признак в группе у разных объектов проявляется по-разному – варьирует.

Например, разный вес

одновозрастных животных.

Любой признак в группе у разных объектов проявляется по-разному – варьирует. Например, разный вес одновозрастных животных.

Слайд 9

2. Получение и первичная обработка материала

После составления выборочной совокупности производится исследование (измерение) материала.


Точность, определенный способ, одни и те же инструменты, одинаковые условия.
Затем проводится анализ выборочных показателей для оценки параметров г.с.
Полученные данные могут быть представлены в виде статистических таблиц.

2. Получение и первичная обработка материала После составления выборочной совокупности производится исследование (измерение)

Слайд 10


Из таблицы можно сделать простой вывод, что сорт А дает урожай во все

годы больше, чем сорт Б.
Но для полного анализа чаще нужна дальнейшая обработка.

Из таблицы можно сделать простой вывод, что сорт А дает урожай во все

Слайд 11

Допустим, что величины признаков были:
5,2,1,5,7,9,3,5,4,10,4,5,7,3,5,9,4,12,7,7.
По данному ряду чисел сделать какие-то выводы трудно, а

иногда и невозможно.
Поэтому в некоторых случаях проводится ранжирование – значение признаков (варианты или даты) распределяются по величине в убывающем или возрастающем порядке в ранжированный ряд:
12,10,9,9,7,7,7,7,5,5,5,5,5,4,4,4,3,3,2,1.
В ранжированном ряду видно максимальное или минимальное значение признака, какое значение встречается чаще, реже и т.п.

Допустим, что величины признаков были: 5,2,1,5,7,9,3,5,4,10,4,5,7,3,5,9,4,12,7,7. По данному ряду чисел сделать какие-то выводы

Слайд 12

Однако, при многочисленных датах ранжирование трудоемко, да и результаты незначительны. Поэтому чаще строится

простой или сложный вариационный ряд.
Простой вариационный ряд представлен в виде двух строк: в первой - значения вариант (V) по убыванию, во второй – частота их встречаемости (f).
12,10,9,9,7,7,7,7,5,5,5,5,5,4,4,4,3,3,2,1
Общее количество дат (n) равно сумме частот:
n=∑ f = 20

Однако, при многочисленных датах ранжирование трудоемко, да и результаты незначительны. Поэтому чаще строится

Слайд 13

В случаях, когда дат много, их разбивают на классы – группы, включающие несколько

дат. Величина классов или классовый промежуток определяется следующим образом.
Число классов (r) вычисляется по формуле r=1+3,3 lg n или по таблице:

В случаях, когда дат много, их разбивают на классы – группы, включающие несколько

Слайд 14

Классовый промежуток определяется по
формуле:

где K – классовый промежуток,
r – число классов,
Vmax

- максимальное значение дат,
Vmin - минимальное значение дат.
Величину классового промежутка можно округлить, желательно до четного числа.
В первой половине сложного вариационного ряда записываются границы классов, во второй – их середины или вариации. В колонке «разноска дат» условными значками обозначается число дат, входящих в тот или иной класс:

Классовый промежуток определяется по формуле: где K – классовый промежуток, r – число

Слайд 15

В следующую колонку записывается число дат, входящих в данный класс (частота – f).
За

середину первого класса (W) обычно принимают максимальную дату или близкое к ней число.
Начало класса определяют по формуле:

Конец класса:

где

- принятая точность.

При составлении границ классов необходимо учитывать, чтобы:
Конец первого класса был не меньше максимальной даты;
Начало предшествующего класса было больше конца последующего класса на единицу измерения;
Разница между началами (концами) соседних классов была постоянной и равной величине классового промежутка;
Начало последнего класса было не меньше минимальной даты.

В следующую колонку записывается число дат, входящих в данный класс (частота – f).

Слайд 16

Пример. Составить сложный вариационный ряд из следующих чисел

413 419 427 404 421 414 428 397 418 429
416 427 417 424 401 411 380 406 429
409 430 426 400 425 432 418 388 415
402 410 436 424 412 444 411 394 411
433 439 437 394 424 408 407 422 423
412 435 430 399 386 441 417 414 417

407 428 398 420 424 426 419 419 406
416 403 407 423 391 409 418 421 417
434 431 405 405 405 413 392 428 431 422
420 398 422 416 434 443 421 410 409
n=100, Vmax =450, Vmin =380
r=1+3,3lg n =1+3,3 lg 100= 1+3,3*2=7,6

Пример. Составить сложный вариационный ряд из следующих чисел 413 419 427 404 421

Слайд 17

f=n=100
Вариационные ряды используются для расчетов многих биометрических показателей. Кроме того, они сами показывают

распределение признака в группе.

f=n=100 Вариационные ряды используются для расчетов многих биометрических показателей. Кроме того, они сами

Слайд 18

3. Обработка данных в статистических пакетах

Обработку полученных данных можно провести как в пакетах

общего назначения, так и в специализированных пакетах.
Наиболее популярным пакетом общего назначения является электронная таблица Excel, из специализированных пакетов специалисты предпочитают программу Statistica. 
Полученные в результате обработки значения биометрических характеристик необходимо проанализировать. Для этого необходимо знать основы биометрии. 

3. Обработка данных в статистических пакетах Обработку полученных данных можно провести как в

Слайд 19

Статистическая обработка данных в Excel

Хотя Excel существенно уступает специализированным статпакетам обработки данных, тем

не менее этот раздел математики представлен в нем наиболее полно.
В Excel включены основные, наиболее часто используемые статистические процедуры: средства описательной статистики, критерии различия, корреляционные и другие методы, позволяющие проводить необходимый статистический анализ биологических, экономических, социологических и других типов данных.

Статистическая обработка данных в Excel Хотя Excel существенно уступает специализированным статпакетам обработки данных,

Слайд 20

Статистические функции Excel

В мастере функций Excel имеется ряд статистических функций, предназначенных для статистической

обработки данных, вычисления выборочных характеристик.
Примеры статистических функций:
СРЗНАЧ - вычисляет среднее арифметическое (невзвешенное) из нескольких массивов (аргументов) чисел.
СЧЁТ - подсчитывает количество ячеек, содержащих числа.
СЧЕТЕСЛИ – подсчитывает ячейки, удовлетворящих заданному критерию.
МАКС – находит наибольшее число из аргументов.
МИН – находит наименьшее число из аргументов.
ДИСП - позволяет оценить дисперсию по выборочным данным.
СТАНДОТКЛОН - вычисляет стандартное отклонение.
МОДА - определяет наиболее часто встречающееся значение в выборке.
МЕДИАНА - позволяет получать медиану заданной выборки. Медиана - это центральный элемент выборки: число элементов выборки со значениями больше медианы и меньше равно.
КОРРЕЛ – оценивает степень и характер зависимости между различными наборами данных и др.

Статистические функции Excel В мастере функций Excel имеется ряд статистических функций, предназначенных для

Слайд 21

В пакете Excel помимо мастера функций имеется набор более мощных инструментов для работы

с несколькими выборками и углубленного анализа данных, называемый Пакет анализа, который может быть использован для решения задач статистической обработки выборочных данных.

В пакете Excel помимо мастера функций имеется набор более мощных инструментов для работы

Слайд 22

Пакет Анализ данных

Рассмотрим некоторые из инструментов, входящих в пакет анализа.

Пакет Анализ данных Рассмотрим некоторые из инструментов, входящих в пакет анализа.

Слайд 23

Описательная статистика

выводит на экран статистический отчет для входных данных.
Выходная таблица содержит

два столбца информации для каждого набора данных.
Левый столбец содержит названия статистических характеристик, а правый столбец – их значения.

Описательная статистика выводит на экран статистический отчет для входных данных. Выходная таблица содержит

Слайд 24

В этой таблице будут содержаться следующие характеристики: среднее, стандартная ошибка, мода, медиана, стандартное

отклонение, дисперсия, эксцесс, асимметрия, размах варьирования интервала, минимальное и максимальное значения, сумма всех элементов выборки, объем выборки.
Инструмент Описательная статистика существенно упрощает статистический анализ тем, что нет необходимости вызывать каждую функцию для расчета статистических характеристик отдельно.

В этой таблице будут содержаться следующие характеристики: среднее, стандартная ошибка, мода, медиана, стандартное

Слайд 25

Гистограмма

вычисляет частоты появления данных.
Числовой промежуток между наибольшим и наименьшим значениями данных делится

на интервалы, называемые карманами. Под частотой понимается количество значений, попавших в один такой карман.
Данный инструмент также позволяет представить результаты анализа в графическом виде, построив гистограмму частот: интервалы разбиения откладываются по оси абсцисс гистограммы, на каждом из интервалов в виде столбцов изображается частота.

Гистограмма вычисляет частоты появления данных. Числовой промежуток между наибольшим и наименьшим значениями данных

Слайд 26

Генерация случайных чисел

используется как вспомогательный инструмент для получения набора случайно выбранных элементов

из генеральной совокупности (т.е. для выборки).

Генерация случайных чисел используется как вспомогательный инструмент для получения набора случайно выбранных элементов

Слайд 27

Корреляция

является количественной характеристикой взаимосвязи двух признаков, позволяет найти показатель силы связи между

ними.
Результатом использования инструмента Корреляция является таблица (матрица) с коэффициентами корреляции для каждой пары переменных измерений.

Корреляция является количественной характеристикой взаимосвязи двух признаков, позволяет найти показатель силы связи между

Слайд 28

Связь между переменными величинами X и Y можно определить при соотношении числовых значений одной из них с

соответствующими значениями другой. Если при увеличении одной переменной увеличивается (уменьшается) другая, это свидетельствует о положительной (отрицательной) связи между этими величинами.
Зависимость между переменными, которым соответствуют средние величины, называется корреляцией. Таким образом, коэффициент корреляции может варьировать в пределах от –1 до +1.
r < 0,30 – слабая связь, 0,31 < r < 0,50 – умеренная, 0,51 < r < 0,70 – значительная, 0,71 < r < 0,90 – сильная; от 0,91 < r < до 0,99 – очень сильная.

Связь между переменными величинами X и Y можно определить при соотношении числовых значений

Слайд 29

Слайд 30

Имя файла: Математическая-биостатистика.-Основные-понятия-и-принципы-обработки.pptx
Количество просмотров: 15
Количество скачиваний: 0