Автор работы: Пользователь скрыл имя, 02 Декабря 2013 в 20:07, реферат
Термин употребляется многими представителями
биомедицинской науки для обозначения применения статистики для решения
проблем именно медицины, однако истинное значение
его шире.
АО «Медицинский университет Астана»
Кафедра:
СРС
На тему:
«Введение. Основы биостатистики».
Астана 2013 год
Содержание
Введение
1.
Введение
Биостатистика(biostatistics) -применение статистики для решения
биологических задач. Термин употребляется многими представителями
биомедицинской науки для обозначения применения статистики для решения
проблем именно медицины, однако истинное значение
его шире. Биостатистика–это раздел доказательной медицины, который
занимается организацией, описанием и анализом данных исследования,
позволяющий с заданным уровнем
доказательности подтвердить
отвергнуть гипотезы, выдвигаемые в ходе исследования.
Зачем нужен статистический анализ
Популяция (population) совокупность всех субъектов, обладающих
интересующим исследователя признаком (признаками) или
свойством (свойствами).
Выборка (sample) – это часть популяции, которая
исследуется на практике, и результаты оценки которой исследователь
распространяет на всю популяцию.
Вероятность (probability) p – это отношение числа случаев одного изучаемого
исхода к общему числу случаев всех возможных.
История развития биостатистики
Гален (второй век н.э.): «Нечто может быть принято и считаться верным
только, если это было замечено очень много раз и каждый раз в том же виде»
Пьер-Шарль-Александр Луи (1787–1872) ввел «числовой метод» в медицину
Жиль Гаваррэ (1809 – 1890) – «отец медицинской статистики», впервые
совместно с математиком Пуассоном вычислил вероятность смерти при
кровопускании.
Место биостатистики в научной работе
Изучение литературы (методология);формулирование гипотезы;дизайн
исследования; расчет необходимого количеств наблюдений (пациентов) и
составление плана статистического анализа; набор материала;
статистический анализ данных ; клиническая интерпретация ;
формулирование новых гипотез. Наиболее популярные статистические
программы: MedCalc (.13 000 руб) , NCSS (.24 000 руб) , Statistica (от 32 000
руб) , PASW (от 50 000 руб) , Stata (38 240 руб + доставка из США) , SAS (.200
000 рублей в год) , R (бесплатно!) .
Общая схема статистического анализа
Заполнение таблицы данными, обработка выбросов ,обработка
пропущенных данных ,описательная статистика ,сравнительная статистика ,
корреляционный и
методы.
Наблюдение и переменная.
Элемент или наблюдение (element, observation) X – это конкретное
численное значение изучаемого признака у отдельно взятого
представителя популяции или выборки.
Переменная или варианта (variable, variant) – это совокупность всех
значений элементов в выборке или популяции это численные данные для
статистического анализа. Требования к названиям переменных : Только
латинские буквы и арабские цифр. Без пробелов, без символов
Примеры: pol, vozrast, group, grup, day1 ,Но не: пол, возраст, группа, день1
или day 1. Порядок переменных : Num – порядковый номер в электронной
таблице (базе данных) ,Nib или IdN – номер истории болезни или
идентификационный номер ,FIO – инициалы фамилии, имени и отчества ,
согласно закону №152 «О защите персональных данных» нельзя
указывать полностью ни фамилию, ни имя, ни отчество! , Group – параметр
группировки ,антропометрические данные и исходные данные (пол, возраст,
код МКБ и т.п.) ,данные осмотра, обследования (наличие жалоб, результаты
клинического , лабораторного и
инструментального
если параметр исследовался в динамике, то переменные располагаются
рядом и маркируются индексами: 0 – исходно, 1,2,3.. ,Outcome – параметр(ы)
исхода (летальность, осложнения, койко-день).
Шкала-(scale) – это совокупность правил, по которым результатам
наблюдениям присваиваются числовые значения.
Четыре вида шкал: Номинальная (nominal scale) ,порядковая (ordinal scale)
интервальная (interval scale), шкала отношений (ratio scale).Отличия шкал:
Номинальная(именная). Только обозначение
признака. Можно только указать количество
признака. Порядковая (ординарная). Появляется смысл последовательности
(порядка) расположения чисел. Интервальная. Появляется смысл интервала
и возможность количественно
появляется абсолютный ноль возможность количественно сравнивать сами
значения.
Типы данных
Качественные – принадлежат номинальной шкале , порядковые –
принадлежат порядковой шкале , количественные – принадлежат
интервальной и относительной шкале, Дискретные данные (discrete data) –
это тип данных, которые по своей природе могут принимать только
отдельные значения в пределах своего диапазона. Непрерывные данные
(continuous data) -это тип данных, которые могут принимать любые
значения в пределах своего диапазона, точность которых
ограничена только точностью их изменения.
Распределения
Эмпирическое распределение –
это распределение
Эмпирические распределения
Теоретическое распределение -это распределение вероятностей.
Теоретическое распределение распределения изучает теория
вероятности. Нормальный закон -Центральная предельная теорема (теорема
А.М.Ляпунова): если случайная величина представляет собой сумму очень
большого числа взаимно
из которых на всю сумму ничтожно мало, то величина имеет распределение
близкое к нормальному.
Асимметрия и эксцесс
Асимметрия – отношение центрального момента третьего порядка к кубу
квадратичного отклонения. Для нормального распределения асимметрия
равна нулю.
Эксцесс – величина, которая определяется равенством. Для нормального
распределения эксцесс равен нулю.
Статистические критерии нормальности
Критерии Д Агостино – Пирсона – обобщённая оценка асимметрии и
эксцесса распределения .
Критерий Шапиро –Уилка - самый мощный критерий коэффициенты и
критические значения для W находятся по таблицам .При выборке свыше 50
наблюдений применяется его модификация, критерий Шапиро-Франчиа.
Нормальность отклоняется при p<0.05. Алгоритм оценки нормальности
распределения случайной величины : 1. Построить гистограмму и график
нормальности. Если отклонения от нормальности явные – отклонить
нормальность. 2. Рассчитать значения асимметрии и эксцесса.
Отклонить нормальность, если p<0.05 3. Проверить распределение одним из
критериев нормальности, предпочтительно Шапиро-Уилка.
Отклонить нормальность, если p<0.05
Трансформация данных
Логарифмическая - рекомендуется при неоднородности дисперсий (для
дисперсионного анализа) и асимметричном
распределение (больше значений справа) .
Квадратный корень - рекомендуется когда распределение похоже на
распределение Пуассона (количество событий за определенное время,
звонки по дежурству).
Квадратные числа- рекомендуется при асимметричном распределение
(больше значений слева).
Распределения ,основанные на нормальном
Хи квадрат - Пусть xi (i=1,2, … n) – стандартные нормальные
независимые случайные величины.
Стьюдента- Пусть Z– стандартная нормальная случайная величина, а
V – независимая от Z велечина, которая распределена по
закону Хи-квадрат с k степенями свободы.
Фишера –Снедекора- Пусть U и V – независимые случайные величины,
которые распределены по закону Хи-квадрат с k1 и k2 степенями свободы.
Заключение
Биостатистика(biostatistics) -применение статистики для решения
биологических задач. Термин употребляется многими представителями
биомедицинской науки для обозначения применения статистики для решения
проблем именно медицины, однако истинное значение
его шире.
Литература
1. Теория биостатистики . Под редакцией профессора Шмойловой :М.Финансы и статистика.1998.
2. Социальная статистика. И.И.Елисеева М:финансы и статистика.1997.
3. Математические методы в экономике. Замков О.О.,Толстопятенко А.В.,Черемных Ю.Н..М:изд.ДИС.1998 г.