Пример нахождения межгрупповой дисперсии

Для решения используют калькулятор. Данные группируются по признаку-фактору. Затем по каждой группе рассчитывается среднее значение. Задача состоит в том, чтобы увидеть, есть связь между признаками или нет; прямая связь или обратная; линейная или нелинейная.
Число групп приближенно определяется по формуле Стэрджесса
n = 1 + 3,2log n
n = 1 + 3,2log 30 = 6
Тогда ширина интервала составит:


Для каждого значения ряда подсчитаем, какое количество раз оно попадает в тот или иной интервал. Для этого сортируем ряд по возрастанию.

45 45 - 53 1
48 45 - 53 2
50 45 - 53 3
50 45 - 53 4
55 53 - 61 1
60 53 - 61 2
63 61 - 69 1
64 61 - 69 2
64 61 - 69 3
65 61 - 69 4
66 61 - 69 5
66 61 - 69 6
68 61 - 69 7
70 69 - 77 1
70 69 - 77 2
75 69 - 77 3
76 69 - 77 4
77 69 - 77 5
78 77 - 85 1
80 77 - 85 2
80 77 - 85 3
80 77 - 85 4
80 77 - 85 5
86 85 - 93 1
87 85 - 93 2
88 85 - 93 3
88 85 - 93 4
90 85 - 93 5
90 85 - 93 6
94 85 - 93 7


Аналитическая группировка.

Группы Кол-во, f ∑X Xcp = ∑X / f ∑Y Ycp = ∑Y / f
45 - 53 1,2,3,4 4 193 48.25 73 18.25
53 - 61 5,6 2 115 57.5 49 24.5
61 - 69 7,8,9,10,11,12,13 7 456 65.14 137 19.57
69 - 77 14,15,16,17,18 5 368 73.6 134 26.8
77 - 85 19,20,21,22,23 5 398 79.6 162 32.4
85 - 93 24,25,26,27,28,29,30 7 623 89 270 38.57
Итого 30 2153 825


По аналитической группировке измеряют связь при помощи эмпирического корреляционного отношения. Оно основан на правиле разложения дисперсии: общая дисперсия равна сумме внутригрупповой и межгрупповой дисперсий.
1. Находим средние значения каждой группы.






Общее средние значение для всей совокупности:

2. Дисперсия внутри группы при относительном постоянстве признака-фактора возникает за счет других факторов (не связанных с изучением). Эта дисперсия называется остаточной:

Расчет для группы: 45 - 53 (1,2,3,4)

yj (yj - yср)2 Результат
15 (15 - 18.25)2 10.56
25 (25 - 18.25)2 45.56
15 (15 - 18.25)2 10.56
18 (18 - 18.25)2 0.0625
Итого 66.75


Определим групповую (частную) дисперсию для 1-ой группы:

Расчет для группы: 53 - 61 (5,6)

yj (yj - yср)2 Результат
20 (20 - 24.5)2 20.25
29 (29 - 24.5)2 20.25
Итого 40.5


Определим групповую (частную) дисперсию для 2-ой группы:

Расчет для группы: 61 - 69 (7,8,9,10,11,12,13)

yj (yj - yср)2 Результат
19 (19 - 19.57)2 0.33
18 (18 - 19.57)2 2.47
18 (18 - 19.57)2 2.47
21 (21 - 19.57)2 2.04
20 (20 - 19.57)2 0.18
20 (20 - 19.57)2 0.18
21 (21 - 19.57)2 2.04
Итого 9.71


Определим групповую (частную) дисперсию для 3-ой группы:

Расчет для группы: 69 - 77 (14,15,16,17,18)

yj (yj - yср)2 Результат
21 (21 - 26.8)2 33.64
22 (22 - 26.8)2 23.04
33 (33 - 26.8)2 38.44
32 (32 - 26.8)2 27.04
26 (26 - 26.8)2 0.64
Итого 122.8


Определим групповую (частную) дисперсию для 4-ой группы:

Расчет для группы: 77 - 85 (19,20,21,22,23)

yj (yj - yср)2 Результат
25 (25 - 32.4)2 54.76
29 (29 - 32.4)2 11.56
38 (38 - 32.4)2 31.36
28 (28 - 32.4)2 19.36
42 (42 - 32.4)2 92.16
Итого 209.2


Определим групповую (частную) дисперсию для 5-ой группы:

Расчет для группы: 85 - 93 (24,25,26,27,28,29,30)

yj (yj - yср)2 Результат
35 (35 - 38.57)2 12.76
36 (36 - 38.57)2 6.61
35 (35 - 38.57)2 12.76
42 (42 - 38.57)2 11.76
38 (38 - 38.57)2 0.33
38 (38 - 38.57)2 0.33
46 (46 - 38.57)2 55.18
Итого 99.71


Определим групповую (частную) дисперсию для 6-ой группы:

3. Внутригрупповые дисперсии объединяются в средней величине внутригрупповых дисперсий:

Средняя из частных дисперсий:

4. Межгрупповая дисперсия относится на счет изучаемого фактора, она называется факторной


Определяем общую дисперсию по всей совокупности, используя правило сложения дисперсий:

σ2 = 18.29 + 59.36 = 77.65
Проверим этот вывод путем расчета общей дисперсии обычным способом:


yi (yi - yср)2 Результат
15 (15 - 27.5)2 156.25
25 (25 - 27.5)2 6.25
15 (15 - 27.5)2 156.25
18 (18 - 27.5)2 90.25
20 (20 - 27.5)2 56.25
29 (29 - 27.5)2 2.25
19 (19 - 27.5)2 72.25
18 (18 - 27.5)2 90.25
18 (18 - 27.5)2 90.25
21 (21 - 27.5)2 42.25
20 (20 - 27.5)2 56.25
20 (20 - 27.5)2 56.25
21 (21 - 27.5)2 42.25
21 (21 - 27.5)2 42.25
22 (22 - 27.5)2 30.25
33 (33 - 27.5)2 30.25
32 (32 - 27.5)2 20.25
26 (26 - 27.5)2 2.25
25 (25 - 27.5)2 6.25
29 (29 - 27.5)2 2.25
38 (38 - 27.5)2 110.25
28 (28 - 27.5)2 0.25
42 (42 - 27.5)2 210.25
35 (35 - 27.5)2 56.25
36 (36 - 27.5)2 72.25
35 (35 - 27.5)2 56.25
42 (42 - 27.5)2 210.25
38 (38 - 27.5)2 110.25
38 (38 - 27.5)2 110.25
46 (46 - 27.5)2 342.25
Итого 2329.5



Эмпирическое корреляционное отношение измеряет, какую часть общей колеблемости результативного признака вызывает изучаемый фактор. Это отношение факторной дисперсии к общей дисперсии:

Определяем эмпирическое корреляционное отношение:

Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0.1 < η < 0.3: слабая;
0.3 < η < 0.5: умеренная;
0.5 < η < 0.7: заметная;
0.7 < η < 0.9: высокая;
0.9 < η < 1: весьма высокая;
В нашем примере связь между признаком Y фактором X высокая
Коэффициент детерминации.

Определим коэффициент детерминации:

Таким образом, на 76.45% вариация обусловлена различиями между признаками, а на 23.55% – другими факторами.
загрузка...