Основы математической статистики

Автор работы: Пользователь скрыл имя, 17 Ноября 2013 в 12:45, лекция

Краткое описание

Математическая статистика – наука, изучающая методы раскрытия закономерностей, свойственных большим совокупностям однородных объектов, на основании их выборочного обследования. Математическая статистика является связующим звеном между теорией вероятностей и явлениями реального мира. Математическая статистика исходит из понятия генеральной совокупности – конечного или бесконечного множества объектов, каждый из которых характеризуется качественным признаком или обладает количественной характеристикой. При этом исследуется не вся совокупность объектов, а только случайно отобранная часть ее.

Вложенные файлы: 1 файл

5 Основы математической статистики.doc

— 389.00 Кб (Скачать файл)

5 Основы математической статистики

 

Математическая статистика – наука, изучающая методы раскрытия  закономерностей, свойственных большим  совокупностям однородных объектов, на основании их выборочного обследования. Математическая статистика является связующим звеном между теорией вероятностей и явлениями реального мира. Математическая статистика исходит из понятия генеральной совокупности – конечного или бесконечного множества объектов, каждый из которых характеризуется качественным признаком или обладает количественной характеристикой. При этом исследуется не вся совокупность объектов, а только случайно отобранная часть ее.

Основу теории математической статистики составляет закон больших  чисел, представляющий собой совокупность лемм и теорем, при помощи которых устанавливается оценка связи между измеренными и истинными значениями.

 

5.1 Закон больших  чисел

 

Закон больших чисел позволяет  найти пределы, к которым стремятся  вероятностные количественные оценки случайных величин при росте  их числа. Законом больших чисел называют несколько математических теорем, каждая из которых в определенных условиях устанавливает факт приближения средних характеристик, полученных на опыте, к некоторым определенным постоянным. Основными из них являются: теорема Чебышева и теорема Бернулли.

Теорема Чебышева. При достаточно большом числе независимых опытов среднее арифметическое из опытных данных сходится по вероятности к математическому ожиданию случайной величины.

Пусть a – истинное значение измеряемой величины, - среднее арифметическое ряда измерений, - максимальное значение квадрата отклонения в произведенных измерениях, n – число измерений. Теорема Чебышева утверждает, что

.                                                                           (5.1)

Для доказательства теоремы обратим  внимание на то, что математическое ожидание любого измерения  , где a – неизвестное истинное значение измеряемой величины. Далее, так как

, то

, т.е. математическое ожидание  среднего значения случайной  величины также равно истинному  значению a. Дисперсия величины

. Так как можно написать, что

.

Теперь после замены x на и на a легко получаем теорему Чебышева.

Из теоремы следует, что при любых конечных и будет справедливо предельное соотношение

 или эквивалентное ему  соотношение

 

.

Таким образом, теорема  Чебышева доказывает, что среднее арифметическое опытных данных (измерений) мало отличается от истинного значения при большом числе испытаний. Однако входящее в неравенство значение указывает на то, что увеличением числа измерений нельзя полностью компенсировать ошибки измерительного инструмента.

Выводы теоремы можно  распространить и на другие моменты  распределения. Например, для дисперсии получаем приближенную формулу, пригодную для практических вычислений:

,

где вместо a, согласно теореме Чебышева, можно пользоваться :

.

Неравенство и теорема Чебышева для практических задач могут использоваться в тех случаях, когда известна дисперсия, очевидно, она должна быть конечной величиной.

Теорема Бернулли. При достаточно большом числе независимых опытов n частота события A сходится по вероятности к вероятности этого события, т.е.

,                                                                             (5.2)

где - частота события A;

      p – вероятность появления события A;

      , - сколь угодно малые положительные числа.

Пусть производится n независимых опытов, в каждом из которых событие A может произойти с вероятностью p. В результате этих опытов можно сформировать ряд, состоящий из случайных величин - чисел появлений интересующего нас события в каждом из n опытов:

  .

Поскольку частота события A представляет собой среднее арифметическое случайных величин и равно

, то математическое ожидание  частоты события можно определить  как 

.

 Считая математические ожидания случайных величин одинаковыми и равными , математическое ожидание частоты события будет равно

  .

Что и следовало доказать.

Пользуясь теоремой Бернулли в виде формулы (5.2) можно определить:

вероятность того, что  при n испытаниях отклонение частоты события от вероятности не превзойдет величину ;

число испытаний n, необходимое для того, чтобы отклонение вероятности от частоты события не превышало при заданной вероятности P;

отклонение  частоты события от вероятности при данном числе испытаний n и заданной вероятности P.

Величину  называют «доверительным интервалом», а вероятность P – «надежностью» или «доверительной вероятностью».

 

5.2 Обработка  результатов измерений

 

Всякое измерение, каким бы способом и как бы тщательно оно ни проводилось, неизбежно сопровождается некоторой ошибкой. При проведении большого числа измерений какой – либо величины результаты измерений почти всегда будут отличаться друг от друга. Причины ошибок измерений могут быть самыми разнообразными.

Случайной ошибкой называют такую ошибку, которая при различных измерениях может изменять свой знак и величину, причем заранее нельзя указать, какое значение и какой знак примет ошибка в данном опыте.

При изучении тех или иных явлений  возникает задача определения вида закона  распределения случайных ошибок, сопровождающих измерения, и их параметров.

 

5.2.1 Выборка, закон распределения выборки

 

При изучении качественного  и количественного признака, характеризующего множество некоторых однородных элементов, не всегда имеется возможность исследовать каждый из них. Поэтому в целях получения информации об этом множестве исследуют только некоторую небольшую часть ее элементов, отобранных совершенно случайно. Практика подтверждает, что выводы, сделанные в результате анализа этой части элементов, бывают достаточно объективными и для всего изучаемого множества.

Множество всех элементов, подлежащих изучению, называют генеральной совокупностью. В отличие от нее выборка – конечная совокупность элементов, отбираемых из генеральной совокупности, для статистического вывода о свойствах генеральной совокупности на основании свойств отобранных элементов.

Любое статистическое исследование всегда связано с производством выборки. Выборка должна быть представительной, т.е. такой, чтобы любой элемент генеральной совокупности мог попасть в нее с вероятностью, не зависящей от характеристик подлежащих измерению.

Число элементов генеральной совокупности (выборки) называют ее объемом.

Пример 1. Из партии, содержащей 10000 деталей, отобрали случайным образом для проверки 80 деталей.

Объем генеральной совокупности в  данном примере равен 10000, а объем  выборки – 80.

Очевидно, что чем больше объем  выборки, тем более полное представление  можно получить о генеральной совокупности.

 Исследование выборки сводится к отысканию ее статистик (функций выборки), к которым относят: вариационный ряд, статистическое распределение выборки, эмпирическую функцию распределения, гистограмму, среднее арифметическое результатов наблюдений и т. п. Статистики, используемые для приближенной оценки параметров генеральной совокупности, называют также статистическими оценками.

Статистическое распределение  выборки отражает соответствие между наблюдаемыми значениями и их частотами или относительными частотами.

Пусть из генеральной совокупности извлечена выборка объема n, причем наблюдалось раз, раз, …, , где .

Наблюдаемые значения называют вариантами, последовательность же вариантов, расположенных в возрастающем порядке, - вариационным рядом.

Число , показывающее, сколько раз встречается вариант в выборке, называют частотой варианта.

Отношение частоты варианта к объему выборки n называют относительной частотой: .

С учетом этих определений  под статистическим распределением выборки понимают перечень вариант и соответствующих им частот или относительных частот .

Пример 2 Задано статистическое распределение частот (Таблица 5.1):

Таблица 5.1

2

5

7

1

3

6


 

Объем выборки n=10. Находим относительные частоты:

 и составляем статистическое  распределение относительных частот (таблица 5.2):

Таблица 5.2

2

5

7

0.1

0.3

0.6


 

В целях наглядности  соответствия между наблюдаемыми вариантами и частотами или относительными частотами распределение выборки изображают графически.

Для этого точки  последовательно соединяют отрезками прямой. Получающаяся при этом ломаная линия называется полигоном частот; если же последовательно соединить отрезками прямой точки , то – полигоном относительных частот.

Эмпирическую функцию распределения также как статистическое распределение выборки и полигон применяют для изображения дискретного вариационного ряда. Эмпирической функцией распределения называют отношение числа вариант, значения которых меньше некоторого фиксированного значения варианта, к объему выборки, т.е.

,

где - число вариант, значения которых меньше некоторого фиксированного значения варианта.

Пусть произведено n независимых опытов и по данным выборки сформирован вариационный ряд . Для построения графика эмпирической функции распределения определяют ее значения в точках следующим образом. .

Рис.5.1 – График эмпирической функции распределения 

График эмпирической функции распределения (рис.5.1) является случайным. Для уменьшения случайности  функции график сглаживают. По этому  графику приближенно определяют вид истинной функции распределения случайной величины.

Гистограмма частот или  относительных частот. Если выборочные данные относятся к непрерывной случайной величине, то интервал, в котором заключены все наблюдаемые значения, разбивают на частичные интервалы длиной h и находят для каждого частичного интервала сумму частот вариант , попавших в i – й интервал.

Затем строят ступенчатую фигуру, состоящую из прямоугольников, основаниями  которых являются частичные интервалы длиной и высотой, равной отношению или .

Отношение называют плотностью частоты, а отношение называют плотностью относительной частоты, поэтому и, построенная таким образом, ступенчатая фигура носит название гистограммы частот или гистограммы относительных частот.

Для построения гистограммы частот или относительных частот (рис.5.2) по статистическому распределению выборки необходимо составить таблицу 5.3, в которой отобразить номера и положение частичных интервалов, суммы частот вариант, плотности частот и относительных частот в этих частичных интервалах.

Таблица 5.3

Номер частичного интервала

Частичный интервал

Сумма частот вариант 

Плотность частот

Плотность относительных  частот

1

1 – 5

10

2.5

0.025

2

5 – 9

20

5

0.05

3

9 – 13

50

12.5

0.125

4

13 – 17

12

3

0.03

5

17 – 21

8

2

0.02

Информация о работе Основы математической статистики