Решение типовых задач по статистике
Методические указания к выполнению работ по статистике
Задача IДжон пользовался мобильным телефоном 30 дней. Ежедневное количество звонков
3 | 4 | 2 | 1 | 1 |
3 | 9 | 1 | 4 | 2 |
6 | 4 | 9 | 13 | 15 |
2 | 5 | 5 | 2 | 7 |
3 | 0 | 1 | 2 | 7 |
1 | 8 | 6 | 9 | 4 |
б) вычислите распределение относительных частот.
Решение.
а) Составим распределение частот из 6 групп, используя этот калькулятор. Ширина интервала составит:
Xmax - максимальное значение группировочного признака в совокупности.
Xmin - минимальное значение группировочного признака.
Определим границы группы.
Номер группы | Нижняя граница | Верхняя граница |
1 | 0 | 2.5 |
2 | 2.5 | 5 |
3 | 5 | 7.5 |
4 | 7.5 | 10 |
5 | 10 | 12.5 |
6 | 12.5 | 15 |
Для каждого значения ряда подсчитаем, какое количество раз оно попадает в тот или иной интервал. Для этого сортируем ряд по возрастанию.
0 | 0 - 2.5 | 1 |
1 | 0 - 2.5 | 2 |
1 | 0 - 2.5 | 3 |
1 | 0 - 2.5 | 4 |
1 | 0 - 2.5 | 5 |
1 | 0 - 2.5 | 6 |
2 | 0 - 2.5 | 7 |
2 | 0 - 2.5 | 8 |
2 | 0 - 2.5 | 9 |
2 | 0 - 2.5 | 10 |
2 | 0 - 2.5 | 11 |
3 | 2.5 - 5 | 1 |
3 | 2.5 - 5 | 2 |
3 | 2.5 - 5 | 3 |
4 | 2.5 - 5 | 4 |
4 | 2.5 - 5 | 5 |
4 | 2.5 - 5 | 6 |
4 | 2.5 - 5 | 7 |
5 | 2.5 - 5 | 8 |
5 | 2.5 - 5 | 9 |
6 | 5 - 7.5 | 1 |
6 | 5 - 7.5 | 2 |
7 | 5 - 7.5 | 3 |
7 | 5 - 7.5 | 4 |
8 | 7.5 - 10 | 1 |
9 | 7.5 - 10 | 2 |
9 | 7.5 - 10 | 3 |
9 | 7.5 - 10 | 4 |
13 | 12.5 - 15 | 1 |
15 | 12.5 - 15 | 2 |
Группы | № совокупности | Частота fi |
0 - 2.5 | 1,2,3,4,5,6,7,8,9,10,11 | 11 |
2.5 - 5 | 12,13,14,15,16,17,18,19,20 | 9 |
5 - 7.5 | 21,22,23,24 | 4 |
7.5 - 10 | 25,26,27,28 | 4 |
10 - 12.5 | 0 | 0 |
12.5 - 15 | 29,30 | 2 |
Группы | xi | Кол-во, fi | xi·fi | Накопленная частота, S | |x-x|·f | (x-x)2·f | Частота, fi/n |
0 - 2.5 | 1.25 | 11 | 13.75 | 11 | 35.75 | 116.19 | 0.37 |
2.5 - 5 | 3.75 | 9 | 33.75 | 20 | 6.75 | 5.06 | 0.3 |
5 - 7.5 | 6.25 | 4 | 25 | 24 | 7 | 12.25 | 0.13 |
7.5 - 10 | 8.75 | 4 | 35 | 28 | 17 | 72.25 | 0.13 |
10 - 12.5 | 11.25 | 0 | 0 | 28 | 0 | 0 | 0 |
12.5 - 15 | 13.75 | 2 | 27.5 | 30 | 18.5 | 171.13 | 0.0667 |
30 | 135 | 85 | 376.88 | 1 |
б) Вычислим распределение относительных частот, используя сервис дискретной случайной величины
x | 1.25 | 3.75 | 6.25 | 8.75 | 11.25 | 13.75 |
p | 0.37 | 0.3 | 0.13 | 0.13 | 0 | 0.0667 |
Математическое ожидание M[X].
M[x] = 1.25*0.37 + 3.75*0.3 + 6.25*0.13 + 8.75*0.13 + 11.25*0 + 13.75*0.0667 = 4.455
Дисперсию находим по формуле d = ∑x2ipi - M[x]2.
Дисперсия D[X].
D[X] = 1.252*0.37 + 3.752*0.3 + 6.252*0.13 + 8.752*0.13 + 11.252*0 + 13.752*0.0667 - 4.4552 = 12.595
Среднее квадратическое отклонение σ(x).
Функция распределения F(X).
F(x≤1.25) = 0
F(1.25< x ≤3.75) = 0.37
F(3.75< x ≤6.25) = 0.3 + 0.37 = 0.67
F(6.25< x ≤8.75) = 0.13 + 0.67 = 0.8
F(8.75< x ≤11.25) = 0.13 + 0.8 = 0.93
F(11.25< x ≤13.75) = 0 + 0.93 = 0.93
F(x>13.75) = 1
Функция распределения F(X)
Задача 2
Вычислите среднее медиану и моду для следующего набора данных:
84, 82, 90, 77, 75, 77, 82, 86, 82.
75, 77, 77, 82, 82, 82, 84, 86, 90.
Таблица для расчета показателей.
xi | Кол-во, fi | xi·fi | Накопленная частота, S | |x-x|·f | (x-x)2·f |
75 | 1 | 75 | 1 | 6.67 | 44.44 |
77 | 2 | 154 | 3 | 9.33 | 43.56 |
82 | 3 | 246 | 6 | 1 | 0.33 |
84 | 1 | 84 | 7 | 2.33 | 5.44 |
86 | 1 | 86 | 8 | 4.33 | 18.78 |
90 | 1 | 90 | 9 | 8.33 | 69.44 |
9 | 735 | 32 | 182 |
Показатели центра распределения.
Средняя взвешенная
Мода
Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.
Максимальное значение повторений при x = 82 (f = 3). Следовательно, мода равна 82
Медиана
Медианой (Me) называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности. Находим xi, при котором накопленная частота S будет больше ∑f/2 = 5. Это значение xi = 82. Таким образом, медиана равна 82
Задача 3
Одна компания подсчитала количество своих сотрудников, распределив их по уровню, соответствующему количеству лет работы на компанию.
Кол-во лет работы | Кол-во сотрудников |
1 | 5 |
2 | 7 |
3 | 10 |
4 | 8 |
5 | 12 |
6 | 3 |
Методические рекомендации к решению. Задачу необходимо решать через сервис Показатели вариации. В исходных условиях задать: Вариационный ряд.
Задача 4.
Распределение студентов одного из факультетов по возрасту (лет) характеризуется следующими данными:
Возраст студентов, Лет | 17 | 18 | 18 | 20 | 21 | 22 | 23 | 24 | Всего |
Число студентов | 20 | 80 | 90 | 110 | 130 | 170 | 90 | 60 | 750 |
а) размах вариации;
б) среднее линейное отклонение;
в) дисперсию;
г) среднее квадратическое отклонение;
д) коэффициент вариации.
Сделайте вывод об однородности совокупности.
Методические рекомендации к решению. Задача решается с помощью калькулятора Показатели вариации. В исходных условиях задать: Вариационный ряд.
Задача 5
В порядке механической выборки обследован возраст 100 студентов вуза из общего числа 2000 чел.
Возраст, Лет | 17 | 18 | 19 | 20 | 21 | 22 | 23 |
Число студентов | 11 | 13 | 18 | 23 | 17 | 10 | 8 |
а) средний возраст студента вуза по выборке;
б) величину ошибки при определении возраста студентов на основе выборки;
в) вероятные пределы колебания возраста для всех студентов при вероятности 0,997.
xi | Кол-во, fi | xi·fi | Накопленная частота, S | |x-x|·f | (x-x)2·f |
17 | 11 | 187 | 11 | 31.24 | 88.72 |
18 | 13 | 234 | 24 | 23.92 | 44.01 |
19 | 18 | 342 | 42 | 15.12 | 12.7 |
20 | 23 | 460 | 65 | 3.68 | 0.59 |
21 | 17 | 357 | 82 | 19.72 | 22.88 |
22 | 10 | 220 | 92 | 21.6 | 46.66 |
23 | 8 | 184 | 100 | 25.28 | 79.88 |
100 | 1984 | 140.56 | 295.44 |
Показатели центра распределения.
Средняя взвешенная
Мода
Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.
Максимальное значение повторений при x = 20 (f = 23). Следовательно, мода равна 20
Медиана
Медианой (Me) называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности. Находим xi, при котором накопленная частота S будет больше ∑f/2 = 51. Это значение xi = 20. Таким образом, медиана равна 20
Показатели вариации.
Абсолютные показатели вариации.
Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.
R = Xmax - Xmin
R = 23 - 17 = 6
Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.
Каждое значение ряда отличается от другого в среднем на 1.41
Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).
Несмещенная оценка дисперсии - состоятельная оценка дисперсии.
Среднее квадратическое отклонение.
Каждое значение ряда отличается от среднего значения 19.84 в среднем на 1.72
Оценка среднеквадратического отклонения.
Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.
Поскольку v ≤ 30%, то совокупность однородна, а вариация слабая.
Интервальное оценивание центра генеральной совокупности.
Доверительный интервал для генерального среднего.
или
где d - процент выборки.
В этом случае 2Ф(tkp) = γ
Ф(tkp) = γ/2 = 0.997/2 = 0.4985
По таблице функции Лапласа найдем, при каком tkp значение Ф(tkp) = 0.4985
tkp(γ) = (0.4985) = 2.96
(19.84 - 0.5;19.84 + 0.5) = (19.34;20.34)
С вероятностью 0.997 можно утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала.
Задача 6.
Есть ли статистически значимая связь между удовлетворенностью перспективами должностного и профессионального роста в зависимости от пола респондента.
пол | удовлетворенность | ∑ | |
доволен | не доволен | ||
Ж | 4 | 8 | 12 |
М | 12 | 6 | 18 |
∑ | 16 | 14 | 30 |
Коэффициент контингенции. Пример решения.
см. также примеры решения задач по статистике.
Статистический ряд распределения
Имеются следующие выборочные данные (выборка 2%-ная механическая) о валовых доходах и расходах на продукты питания домохозяйств одного из районов, тыс. руб.:№ домохозяйства п/п | Валовой доход | Число членов домохозяйства, чел. | Расходы на продукты питания | № домохозяйства п/п | Валовой доход | Число членов домохозяйства, чел. | Расходы на продукты питания |
1 | 35,8 | 1 | 14,9 | 16 | 161,4 | 3 | 61,5 |
2 | 65,1 | 1 | 22,2 | 17 | 203,4 | 3 | 69,6 |
3 | 22,1 | 1 | 10,2 | 18 | 163,5 | 3 | 59,7 |
4 | 26,3 | 1 | 12,4 | 19 | 113,6 | 3. | 53,1 |
5 | 78,0 | 2 | 32,2 | 20 | 145,5 | 3 | 57,9 |
6 | 80,0 | 2 | 33,2 | 21 | 89,7 | 3 | 40,2 |
7 | 92,4 | 2 | 36,8 | 22 | 224,0 | 4 | 80,0 |
8 | 84,0 | 2 | 34,8 | 23 | 202,4 | 4 | 81,2 |
9 | 164,2 | 2 | 50,4 | 24 | 192,0 | 4 | 74,4 |
10 | 150,0 | 2 | 48,6 | 25 | 138,0 | 4 | 59,2 |
11 | 137,6 | 2 | 44,4 | 26 | 225,0 | 5 | 90,0 |
12 | 134,0 | 2 | 46,0 | 27 | 292,1 | 5 | 105,0 |
13 | 82,0 | 2 | 34,2 | 28 | 243,0 | 5 | 89,0 |
14 | 171,0 | 3 | 61,5 | 29 | 280,8 | 6 | 110,2 |
15 | 140,1 | 3 | 55,8 | 30 | 159,0 | 6 | 69,6 |
Задание 1
По исходным данным:
1. Постройте статистический ряд распределения организаций по признаку валовой доход, образовав 5 групп с равными интервалами.
2. Постройте графики полученного ряда распределения. Графически определите значения моды и медианы.
1. Рассчитайте характеристики интервального ряда распределения: среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации.
2. Вычислите среднюю арифметическую по исходным данным, сравните ее с аналогичным показателем, рассчитанным в п. 3 для интервального ряда распределения. Объясните причину их расхождения.
Сделайте выводы по результатам выполнения задания.
Задание 2
По исходным данным:
1. Установите наличие и характер связи между признаками валовой доход и расходы на продукты питания, образовав 5 групп с равными интервалами по обоим признакам, методами:
а) аналитической группировки,
б) корреляционной таблицы.
Задание 3
По результатам выполнения задания 1 с вероятностью 0,683 определите ошибку выборки среднего размера валового дохода и границы, в которых он будет находиться в генеральной совокупности.
Методические рекомендации к решению задания: для проверки решения используйте сервис Группировка статистических данных
Задание №1
- По каждому набору данных, содержащему значения двух взаимосвязанных статистических признаков (возраст оборудования и эксплуатационные расходы), определить средний возраст оборудования, средние эксплуатационные расходы, среднее квадратическое отклонение для каждого статистического признака. Определить медиану возраста оборудования для каждого набора данных. Сравнить между собой средние значения для всех четырех наборов исходных данных, построив таблицу, позволяющую произвести такое сравнение. Сделать выводы о том, на каком объекте наблюдения старше оборудование и где наиболее высоки эксплуатационные расходы.
- Произвести аналитическую группировку статистических данных, выбрав в качестве факторного признака возраст оборудования, результативного признака – эксплуатационные расходы. Для проведения такой группировки рекомендуется создать четыре группы станков по возрасту: от 1 года до 5, от 6 до 10, от 2 до 15, от 15 до 20 (станков старше 20 лет нет ни в одном цехе). В каждой образованной по возрасту группе найти средние по группе эксплуатационные расходы. Результаты группировки представить в табличном виде. Макеты необходимых таблиц приведены в приложении. Эти же данные представить в виде набора из четырех гистограмм, показывающих распределение оборудования по возрасту на каждом из объектов наблюдения. По результатам построения таблиц и гистограмм сделать выводы. Определить моду возраста оборудования для каждого набора данных расчетным путем и графически.
- Для каждого набора данных определить коэффициент Фехнера, построить поле корреляции, рассчитать коэффициент корреляции и определить, для какого цеха наблюдается более тесная связь между возрастом оборудования и величиной эксплуатационных издержек. Для каждого объекта получить уравнение линии регрессии, показывающей характер связи между возрастом оборудования и эксплуатационными расходами (связь считать прямолинейной). По полученным уравнениям сделать выводы о том, на каком объекте наблюдения быстрее возрастают с возрастом эксплуатационные расходы.
Задание №2
- Размах вариации, среднее линейное отклонение.
- Определение среднего уровня рядов динамики.
Перейти к онлайн решению своей задачи
Задание. Цех завода производит батарейки. Для проверки качества отобрали 30 батареек и подвергли их испытанию на продолжительность работы. Показания снимали с интервалом в 1 час. Оцените качество батареек методом выборочного статистического контроля, сделав необходимые расчеты и построения (ряд распределения, средняя продолжительность работы батареек, мода, медиана, размах, полигон и т.д.).
Рекомендации к решению. см. предыдущий сервис.
Методы анализа и обработки данных
Задание 1. Дана таблица с числовыми данными:26.9 | 26.3 | 26.5 | 25.8 | 31.2 |
26.7 | 26.5 | 35.2 | 30.2 | 42.4 |
20.4 | 30.1 | 30.9 | 36.9 | 34.4 |
19.7 | 23.6 | 41.8 | 32.8 | 28.9 |
24.1 | 23.6 | 19.5 | 20.4 | 36.7 |
- Упорядочите числовые данные по возрастанию.
- Сгруппируйте их на интервале [0; 50] с постоянным шагом 5.
- Постройте гистограмму плотности эмпирического распределения данных.
- Рассчитайте выборочную оценку математического ожидания и среднеквадратичного отклонения.
- Используя таблицу значений функции Гаусса-Лапласа, постройте на одном графике с гистограммой график нормального распределения с теми же значениями параметров.
Перейти к онлайн решению своей задачи
Задание 2. Даны координаты узлов интерполяционного многочлена второго порядка x1=-1,y1=4, x2=0, y2=4, x3= 2, y3= -2.
- Запишите в явном виде выражение для интерполяционного многочлена.
- Найдите интерполированное значение функции для аргумента xin=1.5.
- Постройте график интерполяционного многочлена и отметьте на нем узлы и точку, соответствующую интерполированному значению функции.
Задание 3. Значения функции заданы в виде таблицы в 6 равноотстоящих узловых точках.
xi | 0 | 1 | 2 | 3 | 4 | 5 |
yi | 2.8 | 4.3 | 4.6 | 4.7 | 3.8 | 2.6 |
Требуется:
- аппроксимировать функцию полиномом второго порядка;
- вычислить значения аппроксимирующего полинома в узловых точках;
- оценить погрешность аппроксимации;
- построить график аппроксимирующего многочлена.
Контрольная работа по статистике
Задание 3.Имеются данные о результатах сдачи экзамена по статистике группы из 20 студентов: 5, 4, 2, 4, 5, 3, 4, 3, 4, 3, 2, 5, 2, 3, 2, 3, 5, 4, 4, 3. По данному ряду выполните задания:
1) ранжируйте ряд и найдите ранг каждого члена ряда,
2) постройте ряд распределения студентов по баллам успеваемости, определите вид полученного ряда, вычислите среднюю успеваемость студентов данной группы, моду и медиану успеваемости;
3) постройте ряд распределения студентов, выделив в нем две группы: неуспевающие и успевающие, определите вид полученного ряда. Дайте характеристику статистическому признаку, лежащему в основе данной группировки.
Задание 4.
Имеются данные о структуре потребительских расходов одного из региона страны (в процентах):
Виды потребительских расходов | 2005 г. | 2006 г. | 2007 г. |
Продукты питания | 36,1 | 46,9 | 49,0 |
Непродовольственные товары | 45,8 | 40,1 | 34,8 |
Алкогольные напитки | 5,0 | 2,9 | 2,5 |
Оплата услуг | 13,1 | 10,1 | 13,7 |
Все потребительские расходы (итого) | 100 | 100 | 100 |
1) определите вид статистического ряда;
2) постройте диаграмму, изображающую структуру расходов по каждому году. Какой вид диаграммы Вы использовали?
3) Рассчитайте относительные показатели координации за каждый год, взяв за базу сравнения долю оплаты за различные услуги. Сделайте словесные выводы.
Задание 9.
Имеются следующие данные о продаже товара А на трех рынках города в I и II кварталах года:
Рынок | Цена за единицу продукта (руб.) | Объём реализации (шт.) | ||
1 квартал | 2 квартал | 1 квартал | 2 квартал | |
А | 150 | 149 | 170 | 220 |
В | 149 | 148 | 350 | 390 |
С | 151 | 148 | 540 | 550 |
1) рассчитайте индивидуальные индексы цен и объема реализации по каждому рынку;
2) агрегатные индексы цен и товарооборота по всем рынкам в целом;
3) сделайте словесные выводы.
Задание 10.
Динамика браков, расторгнутых населением города за 3 года, характеризуется следующими данными:
Годы | Квартал | |||
I | II | III | IV | |
2006 | 304 | 503 | 446 | 401 |
2007 | 309 | 533 | 478 | 412 |
2008 | 318 | 571 | 484 | 432 |
1) Постройте радиальную диаграмму и сделайте визуальные (зрительные) выводы;
2) Постройте динамический график. Подтверждаются ли выводы, сделанные Вами по радиальной диаграмме?
3) Можно ли определить общую тенденцию развития данного явления по построенным диаграммам? Какова эта тенденция?
Построение равноинтервальной группировки
Задание 1
1. Из двух признаков определить признак-фактор и признак-результат.
2. Построить структурную равноинтервальную группировку по обоим признакам.
3. Построить аналитическую группировку. Результат группировки оформить в таблицу.
Задание 2
На основе структурной группировки данных из задания 1 для признака построить вариационный, частотный и кумулятивный ряды распределения, используя закрытые интервалы. Результаты представить в виде таблицы и изобразить графически.
Проанализировать вариационный ряд распределения, вычислив:
среднее арифметическое значение признака;
моду, медиану, аналитически и графически;
показатели вариации: размах вариации, среднее линейное отклонение, дисперсию, среднеквадратическое отклонение, коэффициент вариации.
Задание 3.
Используя данные таблицы 3, определить:
1) индивидуальные индексы физического объема продукции, цены и стоимости;
2) общие индексы в агрегатной форме физического объема и стоимости;
3) абсолютное изменение стоимости произведенной продукции в текущем периоде по сравнению с базисным, в.т.ч за счет:
а) изменения цен;
б) изменения физического объема продукции
5) показать взаимосвязь индексов.
Задание 4.
По данным таблицы:
1) считая продукцию однородной, определить, как изменится средняя цена единицы продукции при помощи индекса переменного состава;
2) определить влияние на среднюю цену изменения структуры совокупности при помощи индекса структурных сдвигов;
3) определить влияние на среднюю цену изменение индексируемой величины, т.е. при помощи индекса постоянного (фиксированного) состава;
4) показать взаимосвязь индексов.
Задание 5.
Полагая, что данные полученные при помощи собственно случайного 10%-го бесповторного отбора определить:
- пределы, за которые с вероятностью p не выйдет среднее значение признака, рассчитанное по выборочной совокупности (доверительный интервал);
- как нужно изменить объем выборки, чтобы увеличить точность вычислений предельной ошибки средней величины в к раз.
Задание 6.
Определить:
- вид ряда динамики;
- цепные и базисные показатели динамики: абсолютный прирост, темп роста, темп прироста;
- средние показатели ряда динамики: среднегодовой уровень, средний абсолютный прирост, средний темп роста, средний темп прироста.
3. Произвести аналитическое выравнивание ряда, приняв зависимость между уровнями в временем как yt = ao + a1t
Задание 9.
По таблице выбрать динамический ряд.
- Определить характер общей тенденции в ряду динамики.
- Измерит сезонность в развитии явлений.
- На основе сезонной волны сделать ежемесячный прогноз на следующий год.
Задание 10.
дана выборка в виде распределения частот. Найти распределение относительных частот, построить полигон и гистограмму, получить несмещенные оценки генеральной средней и генеральной дисперсии.
Методические рекомендации: необходимо указать количество исходных данных равным 7, вариационный ряд.
Скачать решение
Корреляция и выборочный метод
1. У 12 школьников изучались две характеристики: оценки IQ, определенные с помощью шкалы интеллекта Стенфорда-Бине в шестом классе (X) и успеваемость по химии в средней школе, оцененная на основе теста, состоящего из 35 вопросов (Y). Полученные данные отражены в следующей таблице:N | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
X | 120 | 112 | 110 | 120 | 103 | 126 | 113 | 114 | 106 | 108 | 128 | 109 |
Y | 32 | 25 | 19 | 24 | 17 | 28 | 18 | 20 | 16 | 15 | 27 | 19 |
Рассчитать коэффициент корреляции Пирсона между X и Y. Проверить значимость коэффициента корреляции.
2. Министерство образования намеревается с помощью специального теста оценить средний уровень профпригодности молодых социологов – выпускников профильных вузов. Некоторые предварительные исследования позволяют считать, что среднее квадратическое отклонение, характеризующее разброс значений теста, равно 3,5. Какого объема выборку надо использовать, если исследователи хотят, чтобы вероятностью 97% найденное среднее не отклонялось от генерального более, чем на 1,5?
3. Респонденты некоторой выборочной совокупности следующим образом распределились по возрасту
Возрастной интервал | Количество респондентов, попавших в интервал |
15-20 | 20 |
20-25 | 40 |
25-30 | 40 |
30-35 | 60 |
35-40 | 40 |
Найти интервальную оценку для доли людей, попавших по возрасту в интервал (25-30) лет с надежность 97%.
4. На основе обработки массива анкет была получена следующая частотная таблица:
Зарплата | Возраст | |
До 30 лет | Старше 30 лет | |
До 500 | 30 | 10 |
500-1000 | 20 | 10 |
1000-1500 | 20 | 15 |
1500-2000 | 10 | 25 |
Можно ли считать, что средняя зарплата молодых респондентов (моложе 30 лет) ниже средней зарплаты представителей более старшего возраста (старше 30 лет)? Пояснить статистический смысл ответа.
Расчетно-графическая работа по статистике
1. Изучается связь двух типов учеников средней школы: абстрактного мышления и вербального мышления. Разработаны два теста: для измерения склонности к абстрактному мышлению (X) и к вербальному мышлению (Y). Оба теста предложены школьникам младших классов средней школы. Результаты представлены в таблице. Изобразите поле корреляции (диаграмму рассеивания) и установите тесноту связи этих двух типов умственных способностей.Рекомендации к выполнению задачи: при решении используйте сервис Уравнение линейной регрессии.
2. В таблице представлены две иерархии жизненных ценностей учеников 10 класса и их классного руководителя. С помощью критерия Стьюдента выясните коррелируют ли эти иерархии друг с другом.
3. Для проверки знаний по теории статистики преподаватель провел тест в нескольких группах (100 человек) 2 курса. В таблице содержатся результаты проверки работ. Можно ли утверждать, что выборка извлечена из генеральной совокупности с распределением Пуассона?
Рекомендации к выполнению задачи: при решении используйте сервис Проверка гипотезы о виде распределения.
4. Студентов 1-го курса опрашивали с целью выявления занятий, которым они посвящают свое свободное время. Проверьте, различаются ли распределения вербальных и невербальных предпочтений студентов.
Рекомендации к выполнению задачи: при решении используйте сервис Факторный анализ.
5. Для определения победителей хит-парада слушателям радио предложили выбрать одну из 12 песен с помощью смс-голосования. Можно ли утверждать, что распределение музыкальных предпочтений слушателей отличается от равномерного?
Сводка и группировка статистических материалов
Сводка и группировка – важные звенья в статистическом исследовании. Можно располагать качественным статистическим материалом, но он будет испорчен неумелой сводкой.При группировке с равными интервалами применяется формула:
xmax и xmin – соответственно максимальное и минимальное значения группировочного признака;
n – число групп.
Необходимо учесть, что при решении задач этой темы допускаются ошибки при построении рядов распределения и статистических таблиц.
Часто допускается небрежность при изложении результатов группировки в табличной форме: отсутствуют заголовок таблицы, единицы измерения показателей, итоги. Все это затрудняет чтение и анализ таблиц, обесценивает табличный метод изложения статистических данных. Иногда заголовок таблицы отождествляется с названием вида статистической таблицы. Надо помнить, что заголовок таблицы – это краткое пояснение основного содержания статистической сводки (например, «Группировка магазинов по уровню выполнения задания по розничному товарообороту»). Вид же статистической таблицы (перечневая, групповая, комбинационная) зависит от конструктивного ее построения. Несистематизированное перечисление изучаемых явлений дает перечневую таблицу. Но если изучаемые явления систематизированы (сгруппированы) по одному признаку, то это уже групповая статистическая таблица.
Примеры
Вариант шестойЗАДАЧА № 1
Произведите группировку магазинов №№3 ... 22 (см. Приложение 1) по признаку размер товарооборота, образовав при этом 5 групп с равными интервалами.
Сказуемое групповой таблицы должно содержать следующие показатели:
- число магазинов;
- размер товарооборота;
- средняя стоимость основных фондов;
- численность продавцов;
- относительный уровень фондоотдачи (товарооборот / средняя стоимость основных фондов);
- относительный уровень производительности труда (товарооборот / число продавцов).
Примечание : В п.п. 2 – 4 показатели необходимо рассчитать в сумме и в среднем на один магазин.
Сделайте выводы.
Примечание: Задание решается с помощью сервиса Группировка статистических данных.
ЗАДАЧА № 2 Используя построенный в задаче № 1 интервальный ряд распределения магазинов по размеру товарооборота, определите:
- среднее квадратическое отклонение;
- коэффициент вариации;
- модальную величину.
- медианную величину
Постройте гистограмму распределения и сделайте выводы.
ЗАДАЧА №3
В результате выборочного обследования дальности поездок 600 пассажиров пригородных поездов методом собственно-случайного отбора установлены следующие выборочные характеристики:
– Средняя дальность поездки составила 38,4 км, среднее квадратическое отклонение – 4,68 км.
– Доля поездок дальностью до 10 км – 30 %.
Определите:
1. С вероятностью 0,954 возможные пределы средней дальности поездки.
2. С вероятностью 0,997 возможные пределы доли поездок дальностью до 10 км.
Примечание: В связи с тем, что численность пассажиров пригородных поездов значительно превышает число обследованных лиц, при вычислении предельной ошибки выборки поправкой (1 – n/N) следует пренебречь.
ЗАДАЧА № 4
Имеются данные о розничном товарообороте торгового дома (в сопоставимых ценах, млн. руб.):
Годы | 2000 | 2001 | 2002 | 2003 | 2004 | 2005 |
1 | 2 |
3 | 4 |
5 | 6 |
7 |
Без филиалов | 500 | 523 | 615 | 750 | – | – |
С филиалами | – |
– | – |
900 | 920 |
980 |
Приведите уровни данного ряда динамики к сопоставимому виду.
1. Произведите анализ динамики розничного товарооборота торгового дома, вычислив для этого абсолютные, относительные и средние показатели динамики. Постройте соответствующий график.
2. Произведите аналитическое выравнивание и выразите общую тенденцию развития розничного товарооборота торгового дома соответствующим аналитическим уравнением. Вычислите теоретические (выровненные) уровни ряда динамики и нанесите их на график вместе с фактическими уровнями,
3. Методом экстраполяции тренда сделайте прогноз на 2007 г.
Полученные результаты оформите в виде статистической таблицы. Сделайте выводы.
Примечание: Задание решается с помощью сервисов Показатели рядов динамики.
ЗАДАЧА № 5
Имеется информация о продаже продуктов на рынках города за два периода:
продукты | Модальная цена (руб. за 1 кг) | Количество (т) | ||
май | октябрь |
май | октябрь | |
1 | 2 | 3 | 4 | 5 |
Растительное масло |
36,50 | 39,30 |
62 | 64 |
Сливочное масло | 70 | 90 | 58 | 68 |
Творог |
59,5 | 69,8 |
72 | 70 |
Определите:
1. Индивидуальные и общие индексы: товарооборота в фактических ценах, цен и физического объема товарооборота; покажите их взаимосвязь.
2. Прирост товарооборота (общий и за счет действия отдельных факторов).
Сделайте выводы по полученным результатам.
Примечание: Задание решается с помощью сервиса Общий индекс товарооборота.
ЗАДАЧА №6. Имеются следующие данные о товарообороте торгового предприятия в сопоставимых ценах и изменении цен реализации товаров:
Товарные группы | Товарооборот в сопоставимых ценах (тыс. руб.) | Изменение цен (%) | |
1-й период | 2-й период | ||
1 | 2 | 3 | 4 |
А | 720 |
760 | +25 |
Б | 820 | 1040 | +70 |
В | 670 |
705 | +102 |
Г | 920 | 1100 | +130 |
Определите:
1. Индивидуальные индексы: цен, физического объема товарооборота и товарооборота в фактических ценах.
2. Общий индекс физического объема товарооборота.
3. Средний арифметический индекс цен.
4. Средний арифметический индекс товарооборота в фактических ценах.
5. Индекс покупательной способности рубля.
Покажите взаимосвязь исчисленных индексов. Сделайте выводы по полученным результатам.
ЗАДАЧА № 7
Для изучения зависимости между объемом товарооборота и размером торговой площади рассчитайте коэффициент корреляции рангов Спирмена для магазинов №№ 1 ... 20 (см. Приложение 1).
Сделайте выводы.
Примечание: Задание решается с помощью сервиса Коэффициент ранговой корреляции Спирмена.
ЗАДАЧА № 8
Используя исходные данные к задаче № 1, постройте уравнение регрессии между объемом товарооборота и стоимостью основных фондов для магазинов №№ 1 ... 20.
Фактические и теоретические уровни перенесите на график корреляционного поля и сделайте выводы.
Примечание: Задание решается с помощью сервиса Уравнение парной линейной регрессии.
Список литературы
1. Октябрьский П.Я. Статистика. Учебник. М., ТК Велби. Проспект. 2003.2. Статистика. Учебник /Под ред.проф. Мхиторяна В.С. М., Экономистъ. 2005.
3. Под редакцией профессора Р.А. Шмойловой «Теория статистики» г. Москва «Финансы и статистика» 2004 год.
4. Годин А.М. Статистика: Учебник. – М., 2002.
5. Козлов В.С., Эрлих Я.М., Долгушевский Ф.Г. Общая теория статистики: Учебник. - М.: Статистика, 2005.