Проверка гипотезы о виде распределения. Сборник решений

Пример №1. Имеются следующие данные о количестве заявок на автомобили технической помощи по дням:
Помимо общего задания, требуется построить теоретическую кривую нормального распределения и проверить соответствие эмпирического и теоретического распределений по критерию Пирсона.
Скачать решение

Перейти к онлайн решению своей задачи

Задание 7. Дана выборка.
10 3 7 -2 6 5 5 4 6 2 6 7 5 9 8 0 -1 9
3 2 5 5 2 1 6 9 2 4 1 7 6 -1 -5 4 2 7
3 5 5 2 11 9 7 7 4 10 5 5 6 5 7 1 6 4
2 8 4 8 5 3 6 6 8 3 7 5 8 5 6 -2 7 4
3 7 5 10 4 6 6 5 4 9 4 10 3 2 9 5 1 10
3 3 5 8 3 6 3 3 5 7

  1. Провести группировку данных. Число интервалов k вычислить по формуле (10*n)1/3, где n – объем выборки. Записать сгруппирированный статистический ряд распределения выборки.
  2. Построить гистограмму относительных частот и выдвинуть гипотезу о законе распределения изучаемого признака Х.
  3. Провести проверку нулевой гипотезы, используя χ2 - критерий Пирсона при уровне значимости α=0.05. После принятия гипотезы построить график плотности распределения.
Решение.
Определение числа групп.
k = (10*100)1/3 = 10.
Ширина интервала составит:
h =(Xmax - Xmin)/n
h = (11 - (-5))/10 = 1.6
Xmax - максимальное значение группировочного признака в совокупности.
Xmin - минимальное значение группировочного признака.
Определим границы группы. Для каждого значения ряда подсчитаем, какое количество раз оно попадает в тот или иной интервал. Для этого сортируем ряд по возрастанию.

Номер группы

Нижняя граница

Верхняя граница

1

-5

-3.4

2

-3.4

-1.8

3

-1.8

-0.2

4

-0.2

1.4

5

1.4

3

6

3

4.6

7

4.6

6.2

8

6.2

7.8

9

7.8

9.4

10

9.4

11


Одно и тоже значение признака служит верхней и нижней границами двух смежных (предыдущей и последующей) групп.
Результаты группировки оформим в виде таблицы:

Группы

№ совокупности

Частота fi

-5 - -3.4

1

1

-3.4 - -1.8

2,3

2

-1.8 - -0.2

4,5

2

-0.2 - 1.4

6,7,8,9,10

5

1.4 - 3

11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30

20

3 - 4.6

31,32,33,34,35,36,37,38,39,40

10

4.6 - 6.2

41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71

31

6.2 - 7.8

72,73,74,75,76,77,78,79,80,81,82

11

7.8 - 9.4

83,84,85,86,87,88,89,90,91,92,93,94

12

9.4 - 11

95,96,97,98,99,100

6


Таблица для расчета показателей.

Группы

Середина интервала, xi

Кол-во, fi

xi * fi

Накопленная частота, S

(x - xср) * f

(x - xср)2 * f

-5 - -3.4

-4.2

1

-4.2

1

9.02

81.43

-3.4 - -1.8

-2.6

2

-5.2

3

14.85

110.23

-1.8 - -0.2

-1

2

-2

5

11.65

67.84

-0.2 - 1.4

0.6

5

3

10

21.12

89.21

1.4 - 3

2.2

20

44

30

52.48

137.71

3 - 4.6

3.8

10

38

40

10.24

10.49

4.6 - 6.2

5.4

31

167.4

71

17.86

10.29

6.2 - 7.8

7

11

77

82

23.94

52.08

7.8 - 9.4

8.6

12

103.2

94

45.31

171.1

9.4 - 11

10.2

6

61.2

100

32.26

173.41

100

482.4

238.72

903.78


Показатели центра распределения.
Средняя взвешенная


Показатели вариации.
Абсолютные показатели вариации.
Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.
R = Xmax - Xmin
R = 11 - (-5) = 16
Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).


Несмещенная оценка дисперсии - состоятельная оценка дисперсии.


Каждое значение ряда отличается от среднего значения 4.82 не более, чем на 3.01
Оценка среднеквадратического отклонения.

Гистограмма относительных частот (в %).

Проверка гипотез о виде распределения.
1. Проверим гипотезу о том, что Х распределено по нормальному закону с помощью критерия согласия Пирсона.


где pi — вероятность попадания в i-й интервал случайной величины, распределенной по гипотетическому закону
Для вычисления вероятностей pi применим формулу и таблицу функции Лапласа

Интервалы группировки

Наблюдаемая частота ni

Ф(xi)

Ф(xi+1)

Вероятность pi попадания в i-й интервал

Ожидаемая частота npi

Слагаемые статистики Пирсона Ki

-5 - -3,4

1

0.5

0.5

0,00276

0.28

1.9

-3,4 - -1,8

2

0.49

0.5

0,0108

1.08

0.78

-1,8 - -0,2

2

0.45

0.49

0,0336

3.36

0.55

-0,2 - 1,4

5

0.37

0.45

0,0796

7.96

1.1

1,4 - 3

20

0.23

0.37

0,14

14.38

2.2

3 - 4,6

10

0.0319

0.23

0,2

19.72

4.79

4,6 - 6,2

31

0.18

0.0319

0,15

14.53

18.67

6,2 - 7,8

11

0.34

0.18

0,16

16.17

1.65

7,8 - 9,4

12

0.44

0.34

0,0968

9.68

0.56

9,4 - 11

6

0.48

0.44

0,0446

4.46

0.53

100

32.73


Определим границу критической области. Так как статистика Пирсона измеряет разницу между эмпирическим и теоретическим распределениями, то чем больше ее наблюдаемое значение Kнабл, тем сильнее довод против основной гипотезы.
Поэтому критическая область для этой статистики всегда правосторонняя: [Kkp;+∞).
Её границу Kkp = χ2(k-r-1;α) находим по таблицам распределения «хи-квадрат» и заданным значениям s, k (число интервалов), r=2 (параметры xcp и s оценены по выборке).
Kkp = 14.06714; Kнабл = 32.73
Наблюдаемое значение статистики Пирсона попадает в критическую область: Кнабл > Kkp, поэтому есть основания отвергать основную гипотезу. Данные выборки распределены не по нормальному закону.

График плотности распределения

см. другие примеры
Пример N2
Пример N3
Пример N4
Пример N5
Пример N6
Пример N7
Пример N8
Пример N9
загрузка...