Построить график функции Точки разрыва функции Построение графика методом дифференциального исчисления Создание схемы логических элементов
Примеры решений Показатели вариации Доверительный интервал
Расчет моды и медианы Группировка данных Децили
Проверка гипотез по Пирсону Корреляционная таблица Квартили

Внутригрупповые дисперсии

Внутригрупповые дисперсии σi2 объединяются в средней величине внутригрупповых дисперсий:
Пример. По данным приложения 1 с целью изучения зависимости между факторным и результативным признаками произведите аналитическую группировку с равными интервалами.
Цель исследований: На основе исходных данных, проанализируем, влияет ли общий стаж работы сотрудников предприятия на их заработную плату. В качестве инструмента решения будем использовать сервис Аналитическая группировка.

Данные группируются по признаку-фактору. Затем по каждой группе рассчитывается среднее значение. Задача состоит в том, чтобы увидеть, есть связь между признаками или нет; прямая связь или обратная; линейная или нелинейная.
Так как в основание группировки положен непрерывный количественный признак, то число групп определяют одновременно с размером интервала.
Когда совокупность единиц более или менее однородна (вариация по группировочному признаку мала), прибегают к равным интервалам, размер которых приближенно определяется по формуле Стэрджесса:
n = 1 + 3,2log n = 1 + 3,2log 30 = 6
Тогда ширина интервала составит:


Для каждого значения ряда подсчитаем, какое количество раз оно попадает в тот или иной интервал. Для этого сортируем ряд по возрастанию.

11 - 61
1 1 - 62
31 - 63
4 1 - 64
51 - 65
7 6 - 111
76 - 112
10 6 - 113
106 - 114
10 6 - 115
116 - 116
12 11 - 161
1311 - 162
14 11 - 163
1411 - 164
16 11 - 165
1611 - 166
16 11 - 167
1816 - 211
18 16 - 212
1816 - 213
20 16 - 214
2221 - 261
23 21 - 262
2421 - 263
24 21 - 264
2621 - 265
30 26 - 311
3026 - 312
31 26 - 313
Аналитическая группировка представлена в таблице.
ГруппыКол-во, nОбщий стаж работы, ∑XСредний стаж работы X = ∑X/nЗаработная плата за месяц, тыс. руб., ∑YСредняя заработная плата, Y=∑Y/n
1 - 6 1,2,3,4,55 142.8 5.61.12
6 - 116,7,8,9,10,116559.178.71.45
11 - 16 12,13,14,15,16,17,187 10114.43 10.61.51
16 - 2119,20,21,2247418.56.31.58
21 - 26 23,24,25,26,275 11923.8 8.51.7
26 - 3128,29,3039130.336.12.03
Итого 30 454 45.8
По аналитической группировке измеряют связь при помощи эмпирического корреляционного отношения. Оно основан на правиле разложения дисперсии: общая дисперсия равна сумме внутригрупповой и межгрупповой дисперсий.
1. Находим средние значения каждой группы.






Общее средние значение для всей совокупности:

2. Дисперсия внутри группы при относительном постоянстве признака-фактора возникает за счет других факторов (не связанных с изучением). Эта дисперсия называется остаточной:

Расчет для группы: 1 - 6 (1,2,3,4,5)
yj(yj- yср)2Результат
0.9 (0.9 - 1.12)20.0484
0.9(0.9 - 1.12)20.0484
1.3 (1.3 - 1.12)20.0324
1.2(1.2 - 1.12)20.0064
1.3 (1.3 - 1.12)20.0324
Итого0.17
Определим групповую (частную) дисперсию для 1-ой группы:

Расчет для группы: 6 - 11 (6,7,8,9,10,11)
yj(yj- y1)2Результат
1.4 (1.4 - 1.45)20.0025
1.3(1.3 - 1.45)20.0225
1.5 (1.5 - 1.45)20.0025
1.5(1.5 - 1.45)20.0025
1.5 (1.5 - 1.45)20.0025
1.5(1.5 - 1.45)20.0025
Итого 0.035
Определим групповую (частную) дисперсию для 2-ой группы:

Расчет для группы: 11 - 16 (12,13,14,15,16,17,18)
yj(yj- y2)2Результат
1.6 (1.6 - 1.51)20.00735
1.7(1.7 - 1.51)20.0345
1.7 (1.7 - 1.51)20.0345
1.4(1.4 - 1.51)20.0131
1.4 (1.4 - 1.51)20.0131
1.4(1.4 - 1.51)20.0131
1.4 (1.4 - 1.51)20.0131
Итого0.13
Определим групповую (частную) дисперсию для 3-ой группы:

Расчет для группы: 16 - 21 (19,20,21,22)
yj(yj- y3)2Результат
1.8 (1.8 - 1.58)20.0506
1.5(1.5 - 1.58)20.00563
1.4 (1.4 - 1.58)20.0306
1.6(1.6 - 1.58)20.000625
Итого 0.0875
Определим групповую (частную) дисперсию для 4-ой группы:

Расчет для группы: 21 - 26 (23,24,25,26,27)
yj(yj- y4)2Результат
1.7 (1.7 - 1.7)20
1.7(1.7 - 1.7)20
1.5 (1.5 - 1.7)20.04
1.8(1.8 - 1.7)20.01
1.8 (1.8 - 1.7)20.01
Итого0.06
Определим групповую (частную) дисперсию для 5-ой группы:

Расчет для группы: 26 - 31 (28,29,30)
yj(yj- y5)2Результат
1.9 (1.9 - 2.03)20.0178
2(2 - 2.03)20.00111
2.2 (2.2 - 2.03)20.0278
Итого0.0467
Определим групповую (частную) дисперсию для 6-ой группы:

3. Внутригрупповые дисперсии объединяются в средней величине внутригрупповых дисперсий:

Средняя из частных дисперсий:

4. Межгрупповая дисперсия относится на счет изучаемого фактора, она называется факторной

δ2 = ((1.12-1.53)2*5 + (1.45-1.53)2*6 + (1.51-1.53)2*7 + (1.58-1.53)2*4 + (1.7-1.53)2*5 + (2.03-1.53)2*3 + ...)/30 = 0.0598
Общая дисперсия по всей совокупности определяется по формуле сложения дисперсий: σ²=σ²i+δ² = 0.0175+0.0598 = 0.0773
Проверим этот вывод путем расчета общей дисперсии обычным способом:
yi(yi- y6)2Результат
0.9 (0.9 - 1.53)20.39
0.9(0.9 - 1.53)20.39
1.3 (1.3 - 1.53)20.0514
1.2(1.2 - 1.53)20.11
1.3 (1.3 - 1.53)20.0514
1.4(1.4 - 1.53)20.016
1.3 (1.3 - 1.53)20.0514
1.5(1.5 - 1.53)20.000711
1.5 (1.5 - 1.53)20.000711
1.5(1.5 - 1.53)20.000711
1.5 (1.5 - 1.53)20.000711
1.6(1.6 - 1.53)20.00538
1.7 (1.7 - 1.53)20.03
1.7(1.7 - 1.53)20.03
1.4 (1.4 - 1.53)20.016
1.4(1.4 - 1.53)20.016
1.4 (1.4 - 1.53)20.016
1.4(1.4 - 1.53)20.016
1.8 (1.8 - 1.53)20.0747
1.5(1.5 - 1.53)20.000711
1.4 (1.4 - 1.53)20.016
1.6(1.6 - 1.53)20.00538
1.7 (1.7 - 1.53)20.03
1.7(1.7 - 1.53)20.03
1.5 (1.5 - 1.53)20.000711
1.8(1.8 - 1.53)20.0747
1.8 (1.8 - 1.53)20.0747
1.9(1.9 - 1.53)20.14
2 (2 - 1.53)20.22
2.2(2.2 - 1.53)20.45
Итого 2.32


Эмпирическое корреляционное отношение измеряет, какую часть общей колеблемости результативного признака вызывает изучаемый фактор. Это отношение факторной дисперсии к общей дисперсии:

Определяем эмпирическое корреляционное отношение:

Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0.1 < η < 0.3: слабая;
0.3 < η < 0.5: умеренная;
0.5 < η < 0.7: заметная;
0.7 < η < 0.9: высокая;
0.9 < η < 1: весьма высокая;
В нашем примере связь между заработной платой Y и стажем работника X высокая.
Коэффициент детерминации.

Определим коэффициент детерминации:

Вывод: Таким образом, на 77.33% вариация обусловлена различиями между признаками, а на 22.67% – другими факторами. Связь между заработной платой и стажем работника - высокая.