Автор работы: Пользователь скрыл имя, 18 Декабря 2011 в 21:01, лекция
Методы несплошного наблюдения
ческих настроений большинства американских избирателей.
Обнаружение и ликвидация систематических ошибок воз-
можны только на основе прочных источниковедческих знаний,
путем качественного анализа.
Случайные ошибки присутствуют в любом выборочном об-
следовании, даже когда соблюдены все правила выборочного ме-
тода. Они зависят от методов отбора единиц наблюдения (от вида
выборки), от степени однородности генеральной совокупности, от
изменчивости признаков, а также от используемых в дальнейшем
методов обработки данных. Для каждого вида выборки в статисти-
ке разработаны свои способы вычисления случайных ошибок.
Оценить результаты выборочного исследования можно не
только с помощью математических формул, но и путем привлече-
ния дополнительной информации, сравнением с уже известны-
ми по другим источникам данными. Для этого надо иметь ре з уль-
таты изучения признаков относительно всей генеральной сово-
купности. Тогда путем сравнения средних величин и относитель-
ных показателей выборочной и генеральной совокупностей мож-
но оценить репрезентативность выборки. Чем меньше разница в
показателях, тем выше степень репрезентативности выборки.
Считается, что выборочное обследование достаточно полно отра-
жа ет исходную совокупность объектов, если разница в показате-
69л ях не превышает 5%. Однако чаще всего исследователь лишен
этой возможности и должен обращаться к сложным математиче-
ским вычислениям.
Сложнее дело обстоит тогда, когда историк встречается с
частичными данными и не имеет представления об основных ха-
рактеристиках генеральной совокупности, которую они пред-
ставляют. Встает проблема использования неполных данных.
Можно ли на основе их изучения делать обобщения и выходить
на уровень тенденций и закономерностей, характерных для всего
изучаемого явления, или надо ограничиться иллюстративным по-
казом единичных объектов?
Если из 40 тысяч личных карточек рабочих какого-либо з а-
вода за период 1900 - 1941 гг. сохранились всего 280 штук, -
можно ли их принять за выборку и для их изучения применить
методы,
разработанные для анализа
Правомерно ли будет распространить полученные на их основе
выводы на всю предполагаемую совокупность в 40 тысяч единиц?
В исторической лит ера т уре подобные неполные совокуп-
ности называются "естественными" выборками. Исследова-
тель должен доказать, отражает ли стихийно образовавшаяся вы-
борка
некую генеральную
данные обладают свойствами массового источника.
Исходя
из определения массового
должны
выполняться условия
и их независимости, случайности имеющегося набора признаков.
Первое условие достаточно большого объема в случае "естес-
твенных" выборок заменяется условием равномерности охвата
частичными
данными генеральной
равномерность охвата частичными данными изучаемой терри-
тории и временного периода.
Взяв тот же условный пример, мы должны проверить охва-
тывают ли сохранившиеся 280 документов все (или большинство)
70годы с 1900 по 1941 и имеются ли в них сведения относительно
всех (или большинства) структурных подразделений завода.
Независимость признаков проверяется анализом проис-
хождения и содержания совокупности документов. Надо доказать,
что заполнение одного документа не влияло на заполнение друго-
го, что текст одного документа не списывался с другого. Это до-
стигается изучением истории формирования документов..
Случайность признаков определяется, во-первых, охватом
каждым признаком всех (или большинства) возможных для гене-
ральной совокупности значений и, во-вторых, случайностью р а з-
личий в значениях признаков по отношению ко всем докумен-
там. Доказательство
случайности признаков
менно и доказательством случайности выборки.
В математической статистике разработан ряд приемов,
позволяющих проверить случайность выборки. Среди них метод
серий, критерий знаков, метод последовательных разностей и др.
Суть метода серий состоит в проверке случайности распо-
ложения элементов в выборке. Рассмотрим его на примере
признака возраст у группы рабочих в 16 человек: 20, 18, 25, 51,
33, 36, 28, 40, 42, 49, 32, 52, 29, 35, 34, 41. Первым делом вычислим
средний возраст для данной группы рабочих по средней а р иф-
метической Он примерно равен 35,3 лет. Теперь сравниваем
каждую варианту признака с его средним значением. Если оно
меньше или равно средней величине - записываем "нуль", если
больше - "единицу". Получаем такую последовательность: 0, 0, 0,
1, 0, 1, 0, 1, 1, 1, 0, 1, 0, 0, 0, 1. Сколько раз изменился показа-
тель? Сколько раз происходила смена "0" на " 1" и наоборот ?
Подсчет показывает, что данная последовательность имеет 10
"серий". В том случае будет доказано случайное расположение
элементов в выборке, если фактическое число "серий" будет на-
ходиться в теоретически допустимых пределах.
71определяется в
где
Фактическое число "серий" входит в теоретически опреде-
ленный предел, а это значит, что можно считать доказанным слу-
чайность расположения значений признака в совокупности.
Достаточно активно историки с той же целью применяют
метод критерия знаков. Он состоит в последовательном сравне-
нии величины признака единицы совокупности с величиной этого
же признака предыдущей единицы совокупности. Если разница
между вариантами положительная - то это фиксируется зна-
ком " + ", а если отрицательная - то " - ".
Проиллюстрируем применение метода критерия знаков на
т ех же данных о возрасте 16 рабочих, расположенных в той же
последовательности, что и в источниковом комплексе. Ре з уль т а ты
вычитания каждой последующей варианты из предыдущей да-
ют следующий ряд плюсов и минусов:
20 18
-
25
+
51
+
33
-
36
+
28
-
40
+
42
+
49
+
32
-
52
+
29
-
35
+
34
-
41
+
Далее подсчитаем число плюсов и минусов. При случайной
выборке оно не должно отличаться друг от друга на значитель-
ную величину. Повысить точность нашего вывода о х аракт ере
данных
поможет обращение к
72
Теоретическое расчетное число "серий"
пределах:
п - число единиц в совокупности.
В нашем случае п = 16.
Подставим это значение в формулу:ляющим критические границы и наименьшую погрешность в со-
ответствии с объемом выборки. Если число плюсов вписывается в
установленный по таблице интервал, то можно считать, что вы-
борка достаточно полно отражает исходную совокупность по рас-
смотренному признаку.
Метод критерия знаков успешно применялся И.Д.Коваль-
ченко
при анализе состояния
половине X IX в. по сведениям подворных описаний (см. Ко-
вальченко
И.Д. Об опыте математико-
выборочных данных о крестьянском хозяйстве в России X IX в.
// Вестник МГУ - 1966 - N 11), Б.Н.Мироновым, изучавшим ди-
намику хлебных цен в России в XVIII в. (см. Миронов Б.Н. При-
менение выборочного метода при анализе движения хлебных цен
XVIII в. // Ежегодник по аграрной истории Восточной Европы.
1964. - Кишинев, 1966).
Кроме того, исследователь не должен упускать из вида ка-
чественный, традиционно-источниковедческий анализ при про-
верке стихийно образовавшейся выборки. Надо помнить, что если
сбор и хранение документов, доставшихся историку, были пред-
намеренными, пристрастными, то данная совокупность не может
считаться репрезентативной. Следовательно, получение надежных