Статистика: конспект лекций
Шрифт:
Наряду с абсолютной величиной предельной ошибки выборки рассчитывается и относительная ошибка выборки, которая определяется как процентное отношение предельной ошибки выборки к соответствующей характеристике выборочной совокупности:
Чем больше величина предельной ошибки выборки, тем больше величина доверительного интервала и тем, следовательно, ниже точность оценки. Средняя (стандартная) ошибка выборки зависит от объема выборки и степени вариации признака в генеральной совокупности.
6.3. Определение необходимой численности выборки
Одним из научных принципов в теории выборочного метода является обеспечение достаточного числа отобранных единиц. Теоретически необходимость соблюдения этого принципа представлена в доказательствах предельных теорем теории вероятностей, которые позволяют установить, какой объем единиц следует выбрать из генеральной совокупности, чтобы он был достаточным и обеспечивал репрезентативность выборки.
Уменьшение стандартной ошибки выборки, а следовательно, увеличение точности оценки всегда связано с увеличением объема выборки, поэтому уже на стадии организации выборочного наблюдения приходится решать вопрос о том, каков должен быть объем выборочной совокупности, чтобы была обеспечена требуемая точность результатов наблюдений. Расчет необходимого объема выборки строится с помощью формул, выведенных из формул предельных ошибок выборки (А), соответствующих тому или иному виду и способу отбора. Так, для случайного повторного объема выборки (n) имеем:
Суть этой формулы – в том, что при случайном повторном отборе необходимой численности объем выборки прямо пропорционален квадрату коэффициента доверия (t2) и дисперсии вариационного признака (?2) и обратно пропорционален квадрату предельной ошибки выборки (?2). В частности, с увеличением предельной ошибки в два раза необходимая численность выборки может быть уменьшена в четыре раза. Из трех параметров два (t и ?) задаются исследователем. При этом исследователь исходя из цели
и задач выборочного обследования должен решить вопрос: в каком количественном сочетании лучше включить эти параметры для обеспечения оптимального варианта? В одном случае его может больше устраивать надежность полученных результатов (t), нежели мера точности (?), в другом – наоборот. Сложнее решить вопрос в отношении величины предельной ошибки выборки, так как этим показателем исследователь на стадии проектировки выборочного наблюдения не располагает, поэтому в практике принято задавать величину предельной ошибки выборки, как правило, в пределах до 10 % предполагаемого среднего уровня признака. К установлению предполагаемого среднего уровня можно подходить по разному: использовать данные подобных ранее проведенных обследований или же воспользоваться данными основы выборки и произвести небольшую пробную выборку.
Наиболее сложно установить при проектировании выборочного наблюдения третий параметр в формуле (5.2) – дисперсию выборочной совокупности. В этом случае необходимо использовать всю информацию, имеющуюся в распоряжении исследователя, полученную в ранее проведенных подобных и пробных обследованиях.
Вопрос об определении необходимой численности выборки усложняется, если выборочное обследование предполагает изучение нескольких признаков единиц отбора. В этом случае средние уровни каждого из признаков и их вариация, как правило, различны, и поэтому решить вопрос о том, дисперсии какого из признаков отдать предпочтение, возможно лишь с учетом цели и задач обследования.
При проектировании выборочного наблюдения предполагаются заранее заданная величина допустимой ошибки выборки в соответствии с задачами конкретного исследования и вероятность выводов по результатам наблюдения.
В целом формула предельной ошибки выборочной средней величины позволяет определять:
• величину возможных отклонений показателей генеральной совокупности от показателей выборочной совокупности;
• необходимую численность выборки, обеспечивающую требуемую точность, при которой пределы возможной ошибки не превысят некоторой заданной величины;
• вероятность того, что в проведенной выборке ошибка будет иметь заданный предел.
6.4. Способы отбора и виды выборки
В теории выборочного метода разработаны различные способы отбора и виды выборки, обеспечивающие репрезентативность. Под способом отбора понимают порядок отбора единиц из генеральной совокупности. Различают два способа отбора: повторный и бесповторный. При повторном отборе каждая отобранная в случайном порядке единица после ее обследования возвращается в генеральную совокупность и при последующем отборе может снова попасть в выборку. Этот способ отбора построен по схеме «возвращенного шара»: вероятность попасть в выборку для каждой единицы генеральной совокупности не меняется независимо от числа отбираемых единиц. При бесповторном отборе каждая единица, отобранная в случайном порядке, после ее обследования в генеральную совокупность не возвращается. Этот способ отбора построен по схеме «невозвращенного шара»: вероятность попасть в выборку для каждой единицы генеральной совокупности увеличивается по мере производства отбора.
В зависимости от методики формирования выборочной совокупности различают следующие основные виды выборки:
собственно случайную;
механическую;
типическую (стратифицированную, районированную);
серийную (гнездовую);
комбинированную;
многоступенчатую;
многофазную;
взаимопроникающую.
Собственно случайная выгборка формируется в строгом соответствии с научными принципами и правилами случайного отбора. Для получения собственно случайной выборки генеральная совокупность строго подразделяется на единицы отбора, и затем в случайном повторном или бесповторном порядке отбирается достаточное число единиц.
Случайный порядок подобен жеребьевке. На практике он чаще всего применяется при использовании специальных таблиц случайных чисел. Если, например, из совокупности, содержащей 1587 единиц, следует отобрать 40 единиц, то из таблицы отбирают 40 четырехзначных чисел, которые меньше 1587.
В том случае, когда собственно случайная выборка организуется как повторная, расчет стандартной ошибки производится в соответствии с формулой (6.1). При бесповторном способе отбора формула для расчета стандартной ошибки будет:
где 1 – n / N – доля единиц генеральной совокупности, не попавших в выборку. Так как эта доля всегда меньше единицы, то ошибка при бесповторном отборе при прочих равных условиях всегда меньше, чем при повторном. Бесповторный отбор организовать легче, чем повторный, и он применяется намного чаще. Однако величину стандартной ошибки при бесповторном отборе можно определять по более простой формуле (5.1). Такая замена возможна, если доля единиц генеральной совокупности, не попавших в выборку, большая и, следовательно, величина близка к единице.
Формировать выборку в строгом соответствии с правилами случайного отбора практически очень сложно, а иногда невозможно, так как при использовании таблиц случайных чисел необходимо пронумеровать все единицы генеральной совокупности. Довольно часто генеральная совокупность такая большая, что провести подобную предварительную работу чрезвычайно сложно и нецелесообразно, поэтому на практике применяют другие виды выборок, каждая из которых не является строго случайной. Однако организуются они так, чтобы было обеспечено максимальное приближение к условиям случайного отбора.