Доверительный интервал

Доверительный интервал – предельные значения статистической величины, которая с заданной доверительной вероятностью γ будет находится в этом интервале при выборке большего объема. Обозначается как P(θ - ε < x < θ + ε) = γ. Мерой доверия оценке θ считается вероятность γ того, что погрешность оценки |θ - x| не превысит заданной точности ε: доверительная вероятность. На практике выбирают доверительную вероятность γ из достаточно близких к единице значений γ = 0.9, γ = 0.95, γ = 0.99.

Назначение сервиса. С помощью этого сервиса определяются:

  • доверительный интервал для генерального среднего, доверительный интервал для дисперсии;
  • доверительный интервал для среднего квадратического отклонения, доверительный интервал для генеральной доли;
Полученное решение сохраняется в файле Word (см. пример). Ниже представлена видеоинструкция, как заполнять исходные данные.
Среднее значение или математическое ожидание a = .
Среднее квадратическое отклонение σ = или дисперсия D =
Объем выборки n =
Выводить в отчет:
Доверительный интервал для генерального среднего.
Доверительный интервал для дисперсии и среднеквадратического отклонения
Доверительный интервал для генеральной доли d =

Вероятность попадания величины a в заданный интервал α = , β = (см. пример)
Вероятность того, что абсолютная величина X-a отклонения окажется меньше δ =
Если требуется найти доверительный интервал для вариационного ряда, то необходимо воспользоваться этим онлайн-калькулятором. Возможно, перед началом расчетов необходимо будет сгруппировать данные. Также существует возможность найти интервальный прогноз.
Пример №1. В колхозе из общего стада в 1000 голов овец выборочной контрольной стрижке подверглись 100 овец. В результате был установлен средний настриг шерсти 4,2 кг на одну овцу. Определить с вероятностью 0,99 среднюю квадратическую ошибку выборки при определении среднего настрига шерсти на одну овцу и пределы, в которых заключена величина настрига, если дисперсия равна 2,5. Выборка бесповторная. Пример №2. Из партии импортируемой продукции на посту Московской Северной таможни было взято в порядке случайной повторной выборки 20 проб продукта «А». В результате проверки установлена средняя влажность продукта «А» в выборке, которая оказалась равной 6 % при среднем квадратическом отклонении 1 %.
Определите с вероятностью 0,683 пределы средней влажности продукта во всей партии импортируемой продукции.

Классификация доверительных интервалов

По виду оцениваемого параметра:
  1. Доверительный интервал для генерального среднего (математического ожидания);
    Доверительный интервал для генерального среднего
  2. Доверительный интервал для дисперсии: Доверительный интервал для дисперсии
    где s2 - выборочная дисперсия; Χ2 - квантиль распределения Пирсона.
  3. Доверительный интервал для среднеквадратического отклонения; Доверительный интервал для среднеквадратического отклонения
  4. Доверительный интервал для генеральной доли;
    Доверительный интервал для генеральной доли

По типу выборки:

  1. Доверительный интервал для бесконечной выборки;
  2. Доверительный интервал для конечной выборки;
Генеральная совокупность Бесконечная Конечная объема N
Тип отбора Повторный Бесповторный
Средняя ошибка выборки Средняя ошибка выборки для повторного отбора Средняя ошибка выборки для бесповторного отбора
Выборка называется повторной, если отобранный объект перед выбором следующего возвращается в генеральную совокупность. Выборка называется бесповторной, если отобранный объект в генеральную совокупность не возвращается. На практике обычно имеют дело с бесповторными выборками.

Расчет средней ошибки выборки при случайном отборе

Расхождение между значениями показателей, полученных по выборке, и соответствующими параметрами генеральной совокупности называется ошибкой репрезентативности.
Обозначения основных параметров генеральной и выборочной совокупности.
ХарактеристикиГенеральная совокупность Выборочная совокупность
Объем совокупности (численность единиц) N n
Численность единиц, обладающих обследуемым качеством (признаком) M m
Доля единиц, обладающих обследуемым качеством (признаком), выборочная доля

Формулы средней ошибки выборки
повторный отбор бесповторный отбор
для средней для доли для средней для доли
Соотношение между пределом ошибки выборки (Δ), гарантируемым с некоторой вероятностью Р(t), и средней ошибкой выборки имеет вид: или Δ = t·μ, где t– коэффициент доверия, определяемый в зависимости от уровня вероятности Р(t) по таблице интегральной функции Лапласа.

Формулы расчета численности выборки при собственно-случайном способе отбора

Способ отбора Формулы определения численности выборки
для среднейдля доли
Повторный
Бесповторный
Найти численность выборки можно, использовав калькулятор.
Для средней Для доли
Доля единиц w = . Точность ε = . Вероятность γ =
Бесповторный отбор

Метод доверительных интервалов

Алгоритм нахождения доверительного интервала включает следующие шаги:
  1. задается доверительная вероятность γ (надежность).
  2. по выборке определяется оценка параметра a.
  3. из соотношения P(α1 < a < α2) = γ находится ошибка ε.
  4. рассчитывается доверительный интервал (a - ε ; a + ε).

Пример №1. При проверке годности партии таблеток (250 шт.) оказалось, что средний вес таблетки 0,3 г, а СКО веса 0,01 г. Найти доверительный интервал, в который с вероятностью 90% попадает норма веса таблетки.
Решение.
доверительный интервал для среднего значения
Определяем значение tkp по таблицам функции Лапласа.
В этом случае 2Ф(tkp) = 1 - γ
Ф(tkp) = γ/2 = (1- 0.05)/2 = 0.48
По таблице функции Лапласа найдем, при каком tkp значение Ф(tkp) = 0.48
tkp(γ) = Ф(0.48) = 2.06

(0.3 - 0.206;0.3 + 0.206) = (0.094;0.51)
С вероятностью 0.9 можно утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала.

Пример №2. На площади в 70 га, занятой пшеницей, определяется с помощью выборочного метода доля посева, пораженная насекомыми вредителями. Сколько проб надо взять в выборку, чтобы при вероятности 0,997 определить искомую величину с точностью до 4%, если пробная выборка показывает, что доля пораженной посевной площади составляет 9%?

Решение ищем по формуле определения численности выборки для повторного отбора.

Ф(tkp) = γ/2 = 0.997/2 = 0,4985 и этому значению по таблице Лапласа соответствует tkp =2.96.
w = 9% = 0,09
Δ = 4% = 0,04
Итого: n = 2.962*0,09(1-0,09)/0,042 = 448,4844 ≈ 449
загрузка...