Проверка гипотезы о виде распределения
назначение сервиса. С помощью онлайн-калькулятора проводится проверка статистической гипотезы по критерию согласия Пирсона
- нормального распределения, распределение Пуассона, биномиального распределения;
- показательного распределения (экспоненциального), равномерного распределения.
Группировка ряда.
Характеристики распределений
Основная задача анализа вариационных рядов – это выявление подлинной закономерности распределения, которая достигается увеличением объема исследуемой совокупности при одновременном уменьшении интервала ряда.Равномерное распределение
Графическое представление
![]() Функция плотности равномерного распределения ![]() ![]() | Математическое ожидание: M[X] = (a+b)/2
Дисперсия: ![]() |
Нормальное распределение
Графическое представление
![]() Плотность распределения ![]() ![]() | Математическое ожидание: M[X]=a
![]() Дисперсия: D[X] = σ2
![]() Запись Х ~ N(a; σ) означает, что случайная величина Х распределена по нормальному закону с параметрами a и σ. |
Показательное распределение
Графическое представление
![]() Плотность распределения ![]() ![]() | Математическое ожидание: M[X] = 1/λ
Дисперсия: D[X] = 1/λ2
|
Распределение Пуассона
Графическое представление
![]() Плотность распределения Pn(i) = λie-λ/i!
![]() | Математическое ожидание
![]() Дисперсия ![]() |
Биномиальное распределение
Графическое представление
![]() Плотность распределения биномиального распределения pi = CNipiqN-i (схема Бернулли)
![]() | Математическое ожидание биномиального распределения
M[X] = np Дисперсия биномиального распределения D[X] = npq |
Границы отклонений | Число деталей |
-3..-2 | 3 |
-2 -1 | 10 |
-1 0 | 15 |
0-1 | 24 |
1-2 | 25 |
2-3 | 13 |
3-4 | 7 |
4-5 | 3 |
Пример. Имеются следующие данные о количестве заявок на автомобили технической помощи по дням. Помимо общего задания, требуется построить теоретическую кривую нормального распределения и проверить соответствие эмпирического и теоретического распределений по критерию Пирсона.
Скачать решение
Пример. Дана выборка.
10 3 7 -2 6 5 5 4 6 2 6 7 5 9 8 0 -1 9
3 2 5 5 2 1 6 9 2 4 1 7 6 -1 -5 4 2 7
3 5 5 2 11 9 7 7 4 10 5 5 6 5 7 1 6 4
2 8 4 8 5 3 6 6 8 3 7 5 8 5 6 -2 7 4
3 7 5 10 4 6 6 5 4 9 4 10 3 2 9 5 1 10
3 3 5 8 3 6 3 3 5 7
- Провести группировку данных. Число интервалов k вычислить по формуле (10*n)1/3, где n – объем выборки. Записать сгруппирированный статистический ряд распределения выборки.
- Построить гистограмму относительных частот и выдвинуть гипотезу о законе распределения изучаемого признака Х.
- Провести проверку нулевой гипотезы, используя χ2 - критерий Пирсона при уровне значимости α=0.05. После принятия гипотезы построить график плотности распределения.
k = (10*100)1/3 = 10.
Ширина интервала составит:
h =(Xmax - Xmin)/n = (11 - (-5))/10 = 1.6
Xmax - максимальное значение группировочного признака в совокупности.
Xmin - минимальное значение группировочного признака.
Определим границы группы. Для каждого значения ряда подсчитаем, какое количество раз оно попадает в тот или иной интервал. Для этого сортируем ряд по возрастанию.
Номер группы | Нижняя граница | Верхняя граница |
1 | -5 | -3.4 |
2 | -3.4 | -1.8 |
3 | -1.8 | -0.2 |
4 | -0.2 | 1.4 |
5 | 1.4 | 3 |
6 | 3 | 4.6 |
7 | 4.6 | 6.2 |
8 | 6.2 | 7.8 |
9 | 7.8 | 9.4 |
10 | 9.4 | 11 |
Результаты группировки оформим в виде таблицы:
Группы | № совокупности | Частота fi |
-5 - -3.4 | 1 | 1 |
-3.4 - -1.8 | 2,3 | 2 |
-1.8 - -0.2 | 4,5 | 2 |
-0.2 - 1.4 | 6,7,8,9,10 | 5 |
1.4 - 3 | 11,12,13,14,15,16,17,18,19,20,21, 22,23,24,25,26,27,28,29,30 | 20 |
3 - 4.6 | 31,32,33,34,35,36,37,38,39,40 | 10 |
4.6 - 6.2 | 41,42,43,44,45,46,47,48,49,50,51, 52,53,54,55,56,57,58, 59,60,61,62,63, 64,65,66,67,68,69,70,71 | 31 |
6.2 - 7.8 | 72,73,74,75,76,77,78,79,80,81,82 | 11 |
7.8 - 9.4 | 83,84,85,86,87,88,89,90,91,92,93,94 | 12 |
9.4 - 11 | 95,96,97,98,99,100 | 6 |
Таблица для расчета показателей.
Группы | Середина интервала, xi | Кол-во, fi | xi * fi | Накопленная частота, S | (x - xср) * f | (x - xср)2 * f |
-5 - -3.4 | -4.2 | 1 | -4.2 | 1 | 9.02 | 81.43 |
-3.4 - -1.8 | -2.6 | 2 | -5.2 | 3 | 14.85 | 110.23 |
-1.8 - -0.2 | -1 | 2 | -2 | 5 | 11.65 | 67.84 |
-0.2 - 1.4 | 0.6 | 5 | 3 | 10 | 21.12 | 89.21 |
1.4 - 3 | 2.2 | 20 | 44 | 30 | 52.48 | 137.71 |
3 - 4.6 | 3.8 | 10 | 38 | 40 | 10.24 | 10.49 |
4.6 - 6.2 | 5.4 | 31 | 167.4 | 71 | 17.86 | 10.29 |
6.2 - 7.8 | 7 | 11 | 77 | 82 | 23.94 | 52.08 |
7.8 - 9.4 | 8.6 | 12 | 103.2 | 94 | 45.31 | 171.1 |
9.4 - 11 | 10.2 | 6 | 61.2 | 100 | 32.26 | 173.41 |
100 | 482.4 | 238.72 | 903.78 |
Показатели центра распределения.
Средняя взвешенная
Показатели вариации.
Абсолютные показатели вариации.
Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.
R = Xmax - Xmin
R = 11 - (-5) = 16
Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).
Несмещенная оценка дисперсии - состоятельная оценка дисперсии.
Каждое значение ряда отличается от среднего значения 4.82 не более, чем на 3.01
Оценка среднеквадратического отклонения.

Гистограмма относительных частот (в %).
Проверка гипотез о виде распределения.
1. Проверим гипотезу о том, что Х распределено по нормальному закону с помощью критерия согласия Пирсона.

где pi — вероятность попадания в i-й интервал случайной величины, распределенной по гипотетическому закону
Для вычисления вероятностей pi применим формулу и таблицу функции Лапласа

Интервалы группировки | Наблюдаемая частота ni | Ф(xi) | Ф(xi+1) | Вероятность pi попадания в i-й интервал | Ожидаемая частота npi | Слагаемые статистики Пирсона Ki |
-5 - -3,4 | 1 | 0.5 | 0.5 | 0,00276 | 0.28 | 1.9 |
-3,4 - -1,8 | 2 | 0.49 | 0.5 | 0,0108 | 1.08 | 0.78 |
-1,8 - -0,2 | 2 | 0.45 | 0.49 | 0,0336 | 3.36 | 0.55 |
-0,2 - 1,4 | 5 | 0.37 | 0.45 | 0,0796 | 7.96 | 1.1 |
1,4 - 3 | 20 | 0.23 | 0.37 | 0,14 | 14.38 | 2.2 |
3 - 4,6 | 10 | 0.0319 | 0.23 | 0,2 | 19.72 | 4.79 |
4,6 - 6,2 | 31 | 0.18 | 0.0319 | 0,15 | 14.53 | 18.67 |
6,2 - 7,8 | 11 | 0.34 | 0.18 | 0,16 | 16.17 | 1.65 |
7,8 - 9,4 | 12 | 0.44 | 0.34 | 0,0968 | 9.68 | 0.56 |
9,4 - 11 | 6 | 0.48 | 0.44 | 0,0446 | 4.46 | 0.53 |
100 | 32.73 |
Поэтому критическая область для этой статистики всегда правосторонняя: [Kkp;+∞).
Её границу Kkp = χ2(k-r-1;α) находим по таблицам распределения «хи-квадрат» и заданным значениям s, k (число интервалов), r=2 (параметры xcp и s оценены по выборке).
Kkp = 14.06714; Kнабл = 32.73
Наблюдаемое значение статистики Пирсона попадает в критическую область: Кнабл > Kkp, поэтому есть основания отвергать основную гипотезу. Данные выборки распределены не по нормальному закону.
