Интервальное оценивание центра генеральной совокупности

Рассмотрим вначале случай, когда выборка объема n извлечена из нормальной генеральной совокупности X~N(a, σ) с неизвестным параметром a и известным σ. Параметр a является математическим ожиданием (генеральным средним) случайной величины Х. В качестве точечной оценки параметра a возьмем выборочное среднее: Выборочное среднее. Для уточнения приближенного равенства построим доверительный интервал, накрывающий параметр a с заданной доверительной вероятностью γ.
Если выборка объема n извлекается из нормальной генеральной совокупности N(a,σ), то статистика имеет нормальное распределение с параметрами: . Поэтому доверительная вероятность γ удовлетворяет соотношению:
(2)

В этом соотношении неизвестной величиной является точность оценки ε. Обозначим отсюда
(3)

Значение uкр найдем с помощью таблицы функции Лапласа, учитывая, что
Доверительный интервал для генерального среднего будет иметь вид
Доверительный интервал для генерального среднего (4)

Этот метод построения доверительного интервала применяется и в случае, если генеральная совокупность Х не является нормальной. Согласно центральной предельной теореме, для выборки достаточно большого объема выборочное среднее будет иметь приближенно нормальное распределение с параметрами и где a и σ — соответствующие параметры генеральной совокупности. В этом случае для построения доверительного интервала используют формулу (4), определяя значение uкр по таблицам функции Лапласа, если n>30 При n30 значение uкр заменяют на tкр, которое определяют по таблице распределения Стьюдента, и формула (4) принимает вид:
(5)

где tкр = t(k;α), k=n-1, α=1-γ (область двусторонняя).
Если значение параметра σ неизвестно, то доверительный интервал строят по формуле (5), заменяя параметр σ с его оценкой

Величина средняя ошибка выборки называется средней ошибкой выборки и зависит от способа отбора: в случае конечной генеральной совокупности объема N вносится «поправка на бесповторность отбора», равная (табл. 1).

Таблица 1 - Средняя ошибка выборки для генерального среднего

Генеральная совокупность Бесконечная Конечная объема N
Тип отбора Повторный Бесповторный
Средняя ошибка выборки

Пример №1. Служба контроля Энергосбыта провела выборочную проверку расхода электроэнергии жителями одного из многоквартирных домов. С помощью случайного отбора было выбрано 10 квартир и определен расход электроэнергии в течение одного из летних месяцев (кВт*час): 125, 78, 102, 140, 90, 45, 50, 125, 115, 112.
С вероятностью 0.95 определите доверительный интервал для среднего расхода электроэнергии на одну квартиру во всем доме при условии, что отбор был: а) повторным; б) бесповторным, и в доме имеется 70 квартир.

Решение. По условию задачи объем выборки n=10, т.е. выборка малая. В случае повторного отбора найдем границы доверительного интервала для генерального среднего по формуле (5), считая σ≈s:

границы доверительного интервала для генерального среднего

Найдем выборочное среднее арифметическое:

и несмещенную оценку дисперсии



Тогда оценка среднего квадратического отклонения σ равна

По таблице распределения Стьюдента найдем значение tкр=t(k; α) для двусторонней критической области. Число степеней свободы k здесь равно k=n-1=9, а вероятность α=1-γ=0,05. Тогда tкр=t(k; α) = 2.26 (двусторонняя область).
При повторном случайном отборе средняя ошибка выборки равна а предельная ошибка т.е. доверительный интервал имеет границы
При условии, что отбор квартир был повторным, с вероятностью 0.95 можно ожидать, что средний расход электроэнергии на одну квартиру во всем доме находится в интервале от 75.63 (кВт*час) до 121.17 (кВт*час).
Найдем теперь границы доверительного интервала, считая отбор бесповторным. Предельную ошибку ε определим с учетом того, что генеральная совокупность конечна и имеет объем N (табл. 1).

Из условия задачи tкр= tкр(9; 0.05) = 2.26. Отсюда предельная ошибка выборки и доверительный интервал имеет границы
При условии, что отбор квартир был бесповторным, с вероятностью 0.95 можно утверждать, что средний расход электроэнергии на одну квартиру во всем доме находится в интервале от 76.93 (кВт*час) до 119.47 (кВт*час).
Формула (3) позволяет при заданной доверительной вероятности γ и требуемой точности ε определить объем выборки n, учитывая тип отбора данных.

Пример №2. С помощью случайного повторного отбора определяется средний стаж работы служащих фирмы. Предполагается, что он подчиняется нормальному закону распределения. Каким должен быть объем выборки, чтобы с доверительной вероятностью 0.95 можно было утверждать, что, принимая полученный средний стаж работы за истинный, совершается погрешность, не превышающая 0.5 года, если стандартное отклонение σ равно 2.7 года?
Решение. По условию ε=0.5, σ=2.7, γ =0.95 и требуется найти объём выборки n при повторном отборе. В этом случае 2Ф(uкр)= γ, где По таблице функции Лапласа (приложение 1) найдем, при каком uкр значение Получим uкр=1.96. Отсюда необходимый объем выборки


Учитывая, что необходимо не превышать заданную ошибку, округляем результат до большего целого: n=113.
Итак, чтобы с вероятностью 0.95 и точностью ε=0.5 года определить средний стаж работы в фирме, требуется опросить не менее 113 служащих.
загрузка...