правило сложения дисперсий
Правило сложения дисперсий: общая дисперсия = остаточная дисперсия + межгрупповая дисперсия
Примеры решений Показатели вариации Доверительный интервал Расчет моды и медианы Группировка данных Децили Проверка гипотез по Пирсону Корреляционная таблица Квартили

Вторичные группировки

Группировки различают:
  1. Первичные, составленные на основе первичного материала собранного при наблюдениях.
  2. Вторичные, составленные на основе первичных, используется в двух случаях:
    • когда необходимо мелкие формальные группы, переформировать, в более крупные;
    • когда надо дать сравнительную оценку материалов собранных в разных местах и по различным методикам.
Группировка, составленная по двум или более признакам, называется – комбинационной.
Признак, по которому происходит выделение групп или типов явлений, называется группировочным или основанием группировки. Основание может быть количественным или атрибутивным. Атрибутивный – это признак, имеющий наименование, (например профессия: швея, учитель и т.д.).

Пример №1. Имеются следующие данные о распределении торговых фирм по численности работников двух регионов.

Регион 1 Регион 2
Группы фирм по численности работников, чел. Число фирм Группы фирм по численности работников, чел. Число фирм
1–5

6–10

11–15

16–20

21–25

более 25

6

4

10

50

20

15

Менее 5

5–10

11–20

21–30

31–40

41 и более

1

6

10

50

25

25


Постройте вторичную группировку данных о распределении фирм, пересчитав данные региона 1 в соответствии с группировкой региона 2. В каком регионе средняя численность работников больше?

Решение:
В первую группу «Менее 5» войдет 4/5 от группы «1-5». Тогда число фирм составит: 6*4/5 = 4,8 ≈ 5.
В группу «5-10» полностью входит группа «6-10» и часть группы «1-5», т.е. число фирма будет равно 4 + (6-5) = 5
В группу «11-20» полностью войдет группа «11-15» и часть группы «16-20», а именно ¼*50 = 12,5 ≈ 13.
В группу «21 -30» полностью входит группа «16-20» и группа «21-25», а группа «более 25». Получаем: (50-13) + 20 + 15 = 72

Регион 1 Регион 2
Группы фирм по численности работников, чел. Число фирм Группы фирм по численности работников, чел. Число фирм
Менее 5

5–10

11–20

21–30

31–40

41 и более

5

5

13

72

0

0

Менее 5

5–10

11–20

21–30

31–40

41 и более

1

6

10

50

25

25


Находим среднюю численность работников:
Для первого региона.

Группы

x

Кол-во f

x * f

1 - 5

3

6

18

6 - 10

8

4

32

11 - 15

13

10

130

16 - 20

18

50

900

21 - 25

23

20

460

26 - 30

28

15

420

105

1960


Средняя взвешенная: xср = 1960/105 = 18,67

Для второго региона.

Группы

x

Кол-во f

x * f

1 - 4

2.5

1

2.5

5 - 10

7.5

6

45

11 - 20

15.5

10

155

21 - 30

25.5

50

1275

31 - 40

35.5

25

887.5

41 - 50

45.5

25

1137.5

117

3502.5


Средняя взвешенная: xср = 3502,5/117 = 29,94
Таким образом, во втором регионе средняя численность работников больше.

Пример №2.
Распределение рабочих по стажу работы

№ группы Группы рабочих по стажу, лет Число рабочих, чел. Число рабочих в процентах к итогу
I 2-6 6 30,0
II 6-10 6 30,0
III 10-14 5 25,0
IV 14-18 3 15,0
ИТОГО 20 100,0

В ряду распределения, для наглядности, изучаемый признак исчисляют в процентах. Результаты первичной группировки показали, что 60,0% рабочих имеют стаж до 10 лет, причем поровну от 2-6 лет – 30% и от 6-10 лет – 30%, а 40% рабочих имеют стаж от 10 до 18 лет.
Для изучения зависимости между стажем работы и выработкой необходимо построить аналитическую группировку. В основании ее возьмем те же группы, что в ряду распределения. Результаты группировки представим в таблице 2.

Таблица 2 - Группировка рабочих по стажу работы

№ группы Группы рабочих по стажу лет Число рабочих, чел. Средний стаж работы, лет Выработка продукции, руб.
Всего На одного раб.
I 2-6 6 3,25 1335,0 222,5
II 6-10 6 7,26 1613,0 268,8
III 10-14 5 11,95 1351,0 270,2
IV 14-18 3 16,5 965,0 321,6
ИТОГО: 20 8,62 5264 236

Для заполнения таблицы 2. необходимо составить рабочею таблицу 3.

Таблица 3.

№ п/п Группы рабочих по стажу, лет Номер рабочего Стаж Выработка в руб.
1 2 3 4 5
1 2-6 1, 2, 3, 4,

7, 10.

2,0; 2,3; 3,0; 5,0; 4,5; 2,7 205, 200, 205, 250, 225, 250
Итого по группе: 6 19,5 1335
2 6-10 5, 6, 8, 13, 17, 19 6,2; 8,0; 6,9; 7,0; 9,0; 6,5 208, 290, 270, 250, 270, 253
Итого по группе 6 43,6 1613
3 10-14 9, 12, 15, 16, 18 12,5; 13,0; 11,0; 10,5; 12,8 230, 300, 287, 276, 258
Итого по группе 5 59,8 1351
4 14-18 11, 20, 14 16, 18, 15,5 295, 320, 350
Итого по группе 3 49,5 965
Всего 20 172.4 5264,0

Разделив графы (4:3); (5:3) табл. 3 получим соответствующие данные для заполнения таблицы 2. Итак далее по всем группам. Заполнив таблицу 2. получим аналитическую таблицу.
Рассчитав рабочую таблицу сверяем итоговые результаты таблицы с данными условия задачи, они должны совпадать. Таким образом, кроме построения группировок, нахождения средних величин, проверим еще арифметический контроль.
Анализируя аналитическую таблицу 2, можно сделать вывод о том, что и изучаемые признаки (показатели) зависят друг от друга. С ростом стажа работы постоянно увеличивается выработка продукции на одного рабочего. Выработка рабочих четвертой группы на 99,1 руб. выше, чем первой или на 44,5 % мы рассмотрели пример группировки по одному признаку. Но в ряде случаев для решения поставленных задач такая группировка является недостаточной. В таких случаях переходят к группировке по двум или более признакам, т.е. к комбинационной. Произведем вторичную группировку данных по средней выработке продукции.
Каждую группу охарактеризуем числом рабочих, средним стажем работы, средней выработкой – всего и на одного рабочего расчеты представлены в таблице 4.

Таблица 4 - Группировка рабочих по стажу и средней выработке продукции

№ п/п Группы рабочих Число раб., чел. Сред. стаж работы, лет Средняя выработка прод., руб.
по стажу по средней выраб. прод. в руб. всего на одного раб.
1 2-6 200,0-250,0

250,0-300,0

300,0-350,0

4

2

-

2,5

4,75

-

835,0

500,0

-

208,75

250,0

-

Итого по группе 6 3,25 1335,0 222,5
2 6-10 200,0-250,0

250,0-300,0

300,0-350,0

-

6

-

-

7,26

-

-

1613,0

-

-

268,8

-

3 10-14 200,0-250,0

250,0-300,0

300,0-350,0

1

3

1

12,5

11,43

13,0

230,0

821,0

300,0

230,0

273,6

300,0

Итого по группе 5 11,96 1351,0 270,2
4 14-18 200,0-250,0

250,0-300,0

300,0-350

-

1

2

-

16,0

16,75

-

295,0

670,0

-

295,0

335,0

Итого по группе 3 16,5 965,0 321,6
Итого по группам 200,0-250,0

250,0-300,0

300,0-350,0

5

12

3

3,0

9,86

14,87

1065,0

3229,0

970

213,0

269,0

323

Всего 20 8,62 5264 263,2

Для построения вторичной аналитической группировки по средней выработке продукции в пределах первоначально созданных групп, определим интервал вторичной группировки, выделив при этом три группы, т.е. на одну меньше чем в первоначальной группировке.
Тогда, i=(350-200)/3 = 50 руб.
Больше групп брать нет смысла, будет очень маленький интервал, меньше можно. Итоговые данные по группе рассчитываются как сумма стажа по группе, направить по первой 19, 5 лет делится на число рабочих – 6 человек, получим 3,25 года.
Данные таблицы показывают, что выработка продукции находится в прямой зависимости от стажа работы.

Иногда первоначальная группировка не позволяет четко выявить характер распределения единиц совокупности, либо для приведения к сопоставимому виду группировок с целью проведения сравнительного анализа, необходимо имеющуюся группировку несколько изменить: объединить ранее выделенные относительно мелкие группы в небольшое число более крупных типичных групп или изменить границы прежних групп, с тем чтобы сделать группировку сопоставимой с другими.

Множественная регрессия
Уравнение множественной регрессии: Y=1.83+0.946X1+0.085X2
Коэффициент детерминации

Матрица парных коэффициентов корреляции, оценка качества и значимости построенного уравнения
Решить онлайн
Уравнение тренда
Аналитическое выраванивание ряда по прямой, параболе, экспоненте
Аналитическое выравнивание ряда
Решить онлайн
Нелинейная регрессия
Нелинейная регрессия: парабола, гипербола, экспонента, степенная, логарифмическая
Нелинейная регрессия
Решить онлайн
Курсовые на заказ