Пример нахождения межгрупповой дисперсии
Межгрупповая дисперсия относится на счет изучаемого фактора, она называется факторной. Находится как сумма квадратов отклонений разности средней каждой группы (yi) от общей средней (y):
Пример. Для решения используют калькулятор. Данные группируются по признаку-фактору. Затем по каждой группе рассчитывается среднее значение. Задача состоит в том, чтобы увидеть, есть связь между признаками или нет; прямая связь или обратная; линейная или нелинейная.
Число групп приближенно определяется по формуле Стэрджесса
n = 1 + 3,2log n = 1 + 3,2log 30 = 6
Тогда ширина интервала составит:
Для каждого значения ряда подсчитаем, какое количество раз оно попадает в тот или иной интервал. Для этого сортируем ряд по возрастанию.
| 45 | 45 - 53 | 1 |
| 48 | 45 - 53 | 2 |
| 50 | 45 - 53 | 3 |
| 50 | 45 - 53 | 4 |
| 55 | 53 - 61 | 1 |
| 60 | 53 - 61 | 2 |
| 63 | 61 - 69 | 1 |
| 64 | 61 - 69 | 2 |
| 64 | 61 - 69 | 3 |
| 65 | 61 - 69 | 4 |
| 66 | 61 - 69 | 5 |
| 66 | 61 - 69 | 6 |
| 68 | 61 - 69 | 7 |
| 70 | 69 - 77 | 1 |
| 70 | 69 - 77 | 2 |
| 75 | 69 - 77 | 3 |
| 76 | 69 - 77 | 4 |
| 77 | 69 - 77 | 5 |
| 78 | 77 - 85 | 1 |
| 80 | 77 - 85 | 2 |
| 80 | 77 - 85 | 3 |
| 80 | 77 - 85 | 4 |
| 80 | 77 - 85 | 5 |
| 86 | 85 - 93 | 1 |
| 87 | 85 - 93 | 2 |
| 88 | 85 - 93 | 3 |
| 88 | 85 - 93 | 4 |
| 90 | 85 - 93 | 5 |
| 90 | 85 - 93 | 6 |
| 94 | 85 - 93 | 7 |
| Группы | № | Кол-во, f | ∑X | X=∑X / f | ∑Y | Y=∑Y / f |
| 45 - 53 | 1,2,3,4 | 4 | 193 | 48.25 | 73 | 18.25 |
| 53 - 61 | 5,6 | 2 | 115 | 57.5 | 49 | 24.5 |
| 61 - 69 | 7,8,9,10,11,12,13 | 7 | 456 | 65.14 | 137 | 19.57 |
| 69 - 77 | 14,15,16,17,18 | 5 | 368 | 73.6 | 134 | 26.8 |
| 77 - 85 | 19,20,21,22,23 | 5 | 398 | 79.6 | 162 | 32.4 |
| 85 - 93 | 24,25,26,27,28,29,30 | 7 | 623 | 89 | 270 | 38.57 |
| Итого | 30 | 2153 | 825 |
1. Находим средние значения каждой группы.





Общее средние значение для всей совокупности:

2. Дисперсия внутри группы при относительном постоянстве признака-фактора возникает за счет других факторов (не связанных с изучением). Эта дисперсия называется остаточной:

Расчет для группы: 45 - 53 (1,2,3,4)
| yj | (yj - y1)2 | Результат |
| 15 | (15 - 18.25)2 | 10.56 |
| 25 | (25 - 18.25)2 | 45.56 |
| 15 | (15 - 18.25)2 | 10.56 |
| 18 | (18 - 18.25)2 | 0.0625 |
| Итого | 66.75 |

Расчет для группы: 53 - 61 (5,6)
| yj | (yj - y2)2 | Результат |
| 20 | (20 - 24.5)2 | 20.25 |
| 29 | (29 - 24.5)2 | 20.25 |
| Итого | 40.5 |

Расчет для группы: 61 - 69 (7,8,9,10,11,12,13)
| yj | (yj - y3)2 | Результат |
| 19 | (19 - 19.57)2 | 0.33 |
| 18 | (18 - 19.57)2 | 2.47 |
| 18 | (18 - 19.57)2 | 2.47 |
| 21 | (21 - 19.57)2 | 2.04 |
| 20 | (20 - 19.57)2 | 0.18 |
| 20 | (20 - 19.57)2 | 0.18 |
| 21 | (21 - 19.57)2 | 2.04 |
| Итого | 9.71 |

Расчет для группы: 69 - 77 (14,15,16,17,18)
| yj | (yj - y4)2 | Результат |
| 21 | (21 - 26.8)2 | 33.64 |
| 22 | (22 - 26.8)2 | 23.04 |
| 33 | (33 - 26.8)2 | 38.44 |
| 32 | (32 - 26.8)2 | 27.04 |
| 26 | (26 - 26.8)2 | 0.64 |
| Итого | 122.8 |

Расчет для группы: 77 - 85 (19,20,21,22,23)
| yj | (yj - y5)2 | Результат |
| 25 | (25 - 32.4)2 | 54.76 |
| 29 | (29 - 32.4)2 | 11.56 |
| 38 | (38 - 32.4)2 | 31.36 |
| 28 | (28 - 32.4)2 | 19.36 |
| 42 | (42 - 32.4)2 | 92.16 |
| Итого | 209.2 |

Расчет для группы: 85 - 93 (24,25,26,27,28,29,30)
| yj | (yj - y6)2 | Результат |
| 35 | (35 - 38.57)2 | 12.76 |
| 36 | (36 - 38.57)2 | 6.61 |
| 35 | (35 - 38.57)2 | 12.76 |
| 42 | (42 - 38.57)2 | 11.76 |
| 38 | (38 - 38.57)2 | 0.33 |
| 38 | (38 - 38.57)2 | 0.33 |
| 46 | (46 - 38.57)2 | 55.18 |
| Итого | 99.71 |

3. Внутригрупповые дисперсии объединяются в средней величине внутригрупповых дисперсий:
Средняя из частных дисперсий:

4. Межгрупповая дисперсия относится на счет изучаемого фактора, она называется факторной:

σ2=σ²i+δ2
σ2 = 18.29 + 59.36 = 77.65
Проверим этот вывод путем расчета общей дисперсии обычным способом:
| yi | (yi - y)2 | Результат |
| 15 | (15 - 27.5)2 | 156.25 |
| 25 | (25 - 27.5)2 | 6.25 |
| 15 | (15 - 27.5)2 | 156.25 |
| 18 | (18 - 27.5)2 | 90.25 |
| 20 | (20 - 27.5)2 | 56.25 |
| 29 | (29 - 27.5)2 | 2.25 |
| 19 | (19 - 27.5)2 | 72.25 |
| 18 | (18 - 27.5)2 | 90.25 |
| 18 | (18 - 27.5)2 | 90.25 |
| 21 | (21 - 27.5)2 | 42.25 |
| 20 | (20 - 27.5)2 | 56.25 |
| 20 | (20 - 27.5)2 | 56.25 |
| 21 | (21 - 27.5)2 | 42.25 |
| 21 | (21 - 27.5)2 | 42.25 |
| 22 | (22 - 27.5)2 | 30.25 |
| 33 | (33 - 27.5)2 | 30.25 |
| 32 | (32 - 27.5)2 | 20.25 |
| 26 | (26 - 27.5)2 | 2.25 |
| 25 | (25 - 27.5)2 | 6.25 |
| 29 | (29 - 27.5)2 | 2.25 |
| 38 | (38 - 27.5)2 | 110.25 |
| 28 | (28 - 27.5)2 | 0.25 |
| 42 | (42 - 27.5)2 | 210.25 |
| 35 | (35 - 27.5)2 | 56.25 |
| 36 | (36 - 27.5)2 | 72.25 |
| 35 | (35 - 27.5)2 | 56.25 |
| 42 | (42 - 27.5)2 | 210.25 |
| 38 | (38 - 27.5)2 | 110.25 |
| 38 | (38 - 27.5)2 | 110.25 |
| 46 | (46 - 27.5)2 | 342.25 |
| Итого | 2329.5 |
Эмпирическое корреляционное отношение измеряет, какую часть общей колеблемости результативного признака вызывает изучаемый фактор. Это отношение факторной дисперсии к общей дисперсии:

Определяем эмпирическое корреляционное отношение:

Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0.1 < η < 0.3: слабая;
0.3 < η < 0.5: умеренная;
0.5 < η < 0.7: заметная;
0.7 < η < 0.9: высокая;
0.9 < η < 1: весьма высокая;
В нашем примере связь между признаком Y фактором X высокая
Коэффициент детерминации.
Определим коэффициент детерминации:

Таким образом, на 76.45% вариация обусловлена различиями между признаками, а на 23.55% – другими факторами.

