Вторичные группировки
Группировки различают:- Первичные, составленные на основе первичного материала собранного при наблюдениях.
- Вторичные, составленные на основе первичных, используется в двух случаях:
- когда необходимо мелкие формальные группы, переформировать, в более крупные;
- когда надо дать сравнительную оценку материалов собранных в разных местах и по различным методикам.
Признак, по которому происходит выделение групп или типов явлений, называется группировочным или основанием группировки. Основание может быть количественным или атрибутивным. Атрибутивный – это признак, имеющий наименование, (например профессия: швея, учитель и т.д.).
Пример №1. Имеются следующие данные о распределении торговых фирм по численности работников двух регионов.
Регион 1 | Регион 2 | ||
Группы фирм по численности работников, чел. | Число фирм | Группы фирм по численности работников, чел. | Число фирм |
1–5
6–10 11–15 16–20 21–25 более 25 | 6
4 10 50 20 15 | Менее 5
5–10 11–20 21–30 31–40 41 и более | 1
6 10 50 25 25 |
Постройте вторичную группировку данных о распределении фирм, пересчитав данные региона 1 в соответствии с группировкой региона 2. В каком регионе средняя численность работников больше?
Решение:
В первую группу «Менее 5» войдет 4/5 от группы «1-5». Тогда число фирм составит: 6*4/5 = 4,8 ≈ 5.
В группу «5-10» полностью входит группа «6-10» и часть группы «1-5», т.е. число фирма будет равно 4 + (6-5) = 5
В группу «11-20» полностью войдет группа «11-15» и часть группы «16-20», а именно ¼*50 = 12,5 ≈ 13.
В группу «21 -30» полностью входит группа «16-20» и группа «21-25», а группа «более 25». Получаем: (50-13) + 20 + 15 = 72
Регион 1 | Регион 2 | ||
Группы фирм по численности работников, чел. | Число фирм | Группы фирм по численности работников, чел. | Число фирм |
Менее 5
5–10 11–20 21–30 31–40 41 и более | 5
5 13 72 0 0 | Менее 5
5–10 11–20 21–30 31–40 41 и более | 1
6 10 50 25 25 |
Находим среднюю численность работников:
Для первого региона.
Группы | x | Кол-во f | x * f |
1 - 5 | 3 | 6 | 18 |
6 - 10 | 8 | 4 | 32 |
11 - 15 | 13 | 10 | 130 |
16 - 20 | 18 | 50 | 900 |
21 - 25 | 23 | 20 | 460 |
26 - 30 | 28 | 15 | 420 |
|
| 105 | 1960 |
Средняя взвешенная: xср = 1960/105 = 18,67
Для второго региона.
Группы | x | Кол-во f | x * f |
1 - 4 | 2.5 | 1 | 2.5 |
5 - 10 | 7.5 | 6 | 45 |
11 - 20 | 15.5 | 10 | 155 |
21 - 30 | 25.5 | 50 | 1275 |
31 - 40 | 35.5 | 25 | 887.5 |
41 - 50 | 45.5 | 25 | 1137.5 |
|
| 117 | 3502.5 |
Средняя взвешенная: xср = 3502,5/117 = 29,94
Таким образом, во втором регионе средняя численность работников больше.
Пример №2.
Распределение рабочих по стажу работы
№ группы | Группы рабочих по стажу, лет | Число рабочих, чел. | Число рабочих в процентах к итогу |
I | 2-6 | 6 | 30,0 |
II | 6-10 | 6 | 30,0 |
III | 10-14 | 5 | 25,0 |
IV | 14-18 | 3 | 15,0 |
ИТОГО | 20 | 100,0 |
В ряду распределения, для наглядности, изучаемый признак исчисляют в процентах. Результаты первичной группировки показали, что 60,0% рабочих имеют стаж до 10 лет, причем поровну от 2-6 лет – 30% и от 6-10 лет – 30%, а 40% рабочих имеют стаж от 10 до 18 лет.
Для изучения зависимости между стажем работы и выработкой необходимо построить аналитическую группировку. В основании ее возьмем те же группы, что в ряду распределения. Результаты группировки представим в таблице 2.
Таблица 2 - Группировка рабочих по стажу работы
№ группы | Группы рабочих по стажу лет | Число рабочих, чел. | Средний стаж работы, лет | Выработка продукции, руб. | |
Всего | На одного раб. | ||||
I | 2-6 | 6 | 3,25 | 1335,0 | 222,5 |
II | 6-10 | 6 | 7,26 | 1613,0 | 268,8 |
III | 10-14 | 5 | 11,95 | 1351,0 | 270,2 |
IV | 14-18 | 3 | 16,5 | 965,0 | 321,6 |
ИТОГО: | 20 | 8,62 | 5264 | 236 |
Для заполнения таблицы 2. необходимо составить рабочею таблицу 3.
Таблица 3.
№ п/п | Группы рабочих по стажу, лет | Номер рабочего | Стаж | Выработка в руб. |
1 | 2 | 3 | 4 | 5 |
1 | 2-6 | 1, 2, 3, 4,
7, 10. | 2,0; 2,3; 3,0; 5,0; 4,5; 2,7 | 205, 200, 205, 250, 225, 250 |
Итого по группе: | 6 | 19,5 | 1335 | |
2 | 6-10 | 5, 6, 8, 13, 17, 19 | 6,2; 8,0; 6,9; 7,0; 9,0; 6,5 | 208, 290, 270, 250, 270, 253 |
Итого по группе | 6 | 43,6 | 1613 | |
3 | 10-14 | 9, 12, 15, 16, 18 | 12,5; 13,0; 11,0; 10,5; 12,8 | 230, 300, 287, 276, 258 |
Итого по группе | 5 | 59,8 | 1351 | |
4 | 14-18 | 11, 20, 14 | 16, 18, 15,5 | 295, 320, 350 |
Итого по группе | 3 | 49,5 | 965 | |
Всего | 20 | 172.4 | 5264,0 |
Разделив графы (4:3); (5:3) табл. 3 получим соответствующие данные для заполнения таблицы 2. Итак далее по всем группам. Заполнив таблицу 2. получим аналитическую таблицу.
Рассчитав рабочую таблицу сверяем итоговые результаты таблицы с данными условия задачи, они должны совпадать. Таким образом, кроме построения группировок, нахождения средних величин, проверим еще арифметический контроль.
Анализируя аналитическую таблицу 2, можно сделать вывод о том, что и изучаемые признаки (показатели) зависят друг от друга. С ростом стажа работы постоянно увеличивается выработка продукции на одного рабочего. Выработка рабочих четвертой группы на 99,1 руб. выше, чем первой или на 44,5 % мы рассмотрели пример группировки по одному признаку. Но в ряде случаев для решения поставленных задач такая группировка является недостаточной. В таких случаях переходят к группировке по двум или более признакам, т.е. к комбинационной. Произведем вторичную группировку данных по средней выработке продукции.
Каждую группу охарактеризуем числом рабочих, средним стажем работы, средней выработкой – всего и на одного рабочего расчеты представлены в таблице 4.
Таблица 4 - Группировка рабочих по стажу и средней выработке продукции
№ п/п | Группы рабочих | Число раб., чел. | Сред. стаж работы, лет | Средняя выработка прод., руб. | ||
по стажу | по средней выраб. прод. в руб. | всего | на одного раб. | |||
1 | 2-6 | 200,0-250,0
250,0-300,0 300,0-350,0 | 4
2 - | 2,5
4,75 - | 835,0
500,0 - | 208,75
250,0 - |
Итого по группе | 6 | 3,25 | 1335,0 | 222,5 | ||
2 | 6-10 | 200,0-250,0
250,0-300,0 300,0-350,0 | -
6 - | -
7,26 - | -
1613,0 - | -
268,8 - |
3 | 10-14 | 200,0-250,0
250,0-300,0 300,0-350,0 | 1
3 1 | 12,5
11,43 13,0 | 230,0
821,0 300,0 | 230,0
273,6 300,0 |
Итого по группе | 5 | 11,96 | 1351,0 | 270,2 | ||
4 | 14-18 | 200,0-250,0
250,0-300,0 300,0-350 | -
1 2 | -
16,0 16,75 | -
295,0 670,0 | -
295,0 335,0 |
Итого по группе | 3 | 16,5 | 965,0 | 321,6 | ||
Итого по группам | 200,0-250,0
250,0-300,0 300,0-350,0 | 5
12 3 | 3,0
9,86 14,87 | 1065,0
3229,0 970 | 213,0
269,0 323 | |
Всего | 20 | 8,62 | 5264 | 263,2 |
Для построения вторичной аналитической группировки по средней выработке продукции в пределах первоначально созданных групп, определим интервал вторичной группировки, выделив при этом три группы, т.е. на одну меньше чем в первоначальной группировке.
Тогда, i=(350-200)/3 = 50 руб.
Больше групп брать нет смысла, будет очень маленький интервал, меньше можно. Итоговые данные по группе рассчитываются как сумма стажа по группе, направить по первой 19, 5 лет делится на число рабочих – 6 человек, получим 3,25 года.
Данные таблицы показывают, что выработка продукции находится в прямой зависимости от стажа работы.
Иногда первоначальная группировка не позволяет четко выявить характер распределения единиц совокупности, либо для приведения к сопоставимому виду группировок с целью проведения сравнительного анализа, необходимо имеющуюся группировку несколько изменить: объединить ранее выделенные относительно мелкие группы в небольшое число более крупных типичных групп или изменить границы прежних групп, с тем чтобы сделать группировку сопоставимой с другими.