Решение типовых задач по статистике
Задача IДжон пользовался мобильным телефоном 30 дней. Ежедневное количество звонков
3 | 4 | 2 | 1 | 1 |
3 | 9 | 1 | 4 | 2 |
6 | 4 | 9 | 13 | 15 |
2 | 5 | 5 | 2 | 7 |
3 | 0 | 1 | 2 | 7 |
1 | 8 | 6 | 9 | 4 |
б) вычислите распределение относительных частот.
Решение.
а) Составим распределение частот из 6 групп, используя этот калькулятор. Ширина интервала составит:
Xmax - максимальное значение группировочного признака в совокупности.
Xmin - минимальное значение группировочного признака.
Определим границы группы.
Номер группы | Нижняя граница | Верхняя граница |
1 | 0 | 2.5 |
2 | 2.5 | 5 |
3 | 5 | 7.5 |
4 | 7.5 | 10 |
5 | 10 | 12.5 |
6 | 12.5 | 15 |
Одно и тоже значение признака служит верхней и нижней границами двух смежных (предыдущей и последующей) групп.
Для каждого значения ряда подсчитаем, какое количество раз оно попадает в тот или иной интервал. Для этого сортируем ряд по возрастанию.
0 | 0 - 2.5 | 1 |
1 | 0 - 2.5 | 2 |
1 | 0 - 2.5 | 3 |
1 | 0 - 2.5 | 4 |
1 | 0 - 2.5 | 5 |
1 | 0 - 2.5 | 6 |
2 | 0 - 2.5 | 7 |
2 | 0 - 2.5 | 8 |
2 | 0 - 2.5 | 9 |
2 | 0 - 2.5 | 10 |
2 | 0 - 2.5 | 11 |
3 | 2.5 - 5 | 1 |
3 | 2.5 - 5 | 2 |
3 | 2.5 - 5 | 3 |
4 | 2.5 - 5 | 4 |
4 | 2.5 - 5 | 5 |
4 | 2.5 - 5 | 6 |
4 | 2.5 - 5 | 7 |
5 | 2.5 - 5 | 8 |
5 | 2.5 - 5 | 9 |
6 | 5 - 7.5 | 1 |
6 | 5 - 7.5 | 2 |
7 | 5 - 7.5 | 3 |
7 | 5 - 7.5 | 4 |
8 | 7.5 - 10 | 1 |
9 | 7.5 - 10 | 2 |
9 | 7.5 - 10 | 3 |
9 | 7.5 - 10 | 4 |
13 | 12.5 - 15 | 1 |
15 | 12.5 - 15 | 2 |
Группы | № совокупности | Частота fi |
0 - 2.5 | 1,2,3,4,5,6,7,8,9,10,11 | 11 |
2.5 - 5 | 12,13,14,15,16,17,18,19,20 | 9 |
5 - 7.5 | 21,22,23,24 | 4 |
7.5 - 10 | 25,26,27,28 | 4 |
10 - 12.5 | 0 | 0 |
12.5 - 15 | 29,30 | 2 |
Группы | xi | Кол-во, fi | xi * fi | Накопленная частота, S | |x - xср|*f | (x - xср)2*f | Частота, fi/n |
0 - 2.5 | 1.25 | 11 | 13.75 | 11 | 35.75 | 116.19 | 0.37 |
2.5 - 5 | 3.75 | 9 | 33.75 | 20 | 6.75 | 5.06 | 0.3 |
5 - 7.5 | 6.25 | 4 | 25 | 24 | 7 | 12.25 | 0.13 |
7.5 - 10 | 8.75 | 4 | 35 | 28 | 17 | 72.25 | 0.13 |
10 - 12.5 | 11.25 | 0 | 0 | 28 | 0 | 0 | 0 |
12.5 - 15 | 13.75 | 2 | 27.5 | 30 | 18.5 | 171.13 | 0.0667 |
30 | 135 | 85 | 376.88 | 1 |
б) Вычислим распределение относительных частот, используя сервис дискретной случайной величины
x | 1.25 | 3.75 | 6.25 | 8.75 | 11.25 | 13.75 |
p | 0.37 | 0.3 | 0.13 | 0.13 | 0 | 0.0667 |
Математическое ожидание M[X].
M[x] = 1.25*0.37 + 3.75*0.3 + 6.25*0.13 + 8.75*0.13 + 11.25*0 + 13.75*0.0667 = 4.455
Дисперсию находим по формуле d = ∑x2ipi - M[x]2.
Дисперсия D[X].
D[X] = 1.252*0.37 + 3.752*0.3 + 6.252*0.13 + 8.752*0.13 + 11.252*0 + 13.752*0.0667 - 4.4552 = 12.595
Среднее квадратическое отклонение σ(x).
Функция распределения F(X).
F(x≤1.25) = 0
F(1.25< x ≤3.75) = 0.37
F(3.75< x ≤6.25) = 0.3 + 0.37 = 0.67
F(6.25< x ≤8.75) = 0.13 + 0.67 = 0.8
F(8.75< x ≤11.25) = 0.13 + 0.8 = 0.93
F(11.25< x ≤13.75) = 0 + 0.93 = 0.93
F(x>13.75) = 1
Функция распределения F(X)

Многоугольник распределения

Задача 2
Вычислите среднее медиану и моду для следующего набора данных:
84, 82, 90, 77, 75, 77, 82, 86, 82.
Решение. Построим дискретный вариационный ряд. Для этого отсортируем ряд по возрастанию и подсчитаем количество повторения для каждого элемента ряда.
Таблица для расчета показателей.
Для оценки ряда распределения найдем следующие показатели:
Показатели центра распределения.
Средняя взвешенная


Мода
Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.
Максимальное значение повторений при x = 82 (f = 3). Следовательно, мода равна 82
Медиана
Медианой (Me) называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности. Находим xi, при котором накопленная частота S будет больше ∑f/2 = 5. Это значение xi = 82. Таким образом, медиана равна 82
75 |
77 |
77 |
82 |
82 |
82 |
84 |
86 |
90 |
xi | Кол-во, fi | xi * fi | Накопленная частота, S | |x - xср|*f | (x - xср)2*f | Частота, fi/n |
75 | 1 | 75 | 1 | 6.67 | 44.44 | 0.11 |
77 | 2 | 154 | 3 | 9.33 | 43.56 | 0.22 |
82 | 3 | 246 | 6 | 1 | 0.33 | 0.33 |
84 | 1 | 84 | 7 | 2.33 | 5.44 | 0.11 |
86 | 1 | 86 | 8 | 4.33 | 18.78 | 0.11 |
90 | 1 | 90 | 9 | 8.33 | 69.44 | 0.11 |
9 | 735 | 32 | 182 | 1 |
Показатели центра распределения.
Средняя взвешенная
Мода
Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.
Максимальное значение повторений при x = 82 (f = 3). Следовательно, мода равна 82
Медиана
Медианой (Me) называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности. Находим xi, при котором накопленная частота S будет больше ∑f/2 = 5. Это значение xi = 82. Таким образом, медиана равна 82
Задача 3
Одна компания подсчитала количество своих сотрудников, распределив их по уровню, соответствующему количеству лет работы на компанию.
Кол-во лет работы | Кол-во сотрудников |
1 | 5 |
2 | 7 |
3 | 10 |
4 | 8 |
5 | 12 |
6 | 3 |
Методические рекомендации к решению. Задачу необходимо решать через сервис Показатели вариации. В исходных условиях задать: Вариационный ряд.
Задача 4.
Распределение студентов одного из факультетов по возрасту (лет) характеризуется следующими данными:
Возраст студентов, Лет | 17 | 18 | 18 | 20 | 21 | 22 | 23 | 24 | Всего |
Число студентов | 20 | 80 | 90 | 110 | 130 | 170 | 90 | 60 | 750 |
а) размах вариации;
б) среднее линейное отклонение;
в) дисперсию;
г) среднее квадратическое отклонение;
д) коэффициент вариации.
Сделайте вывод об однородности совокупности.
Методические рекомендации к решению. Задача решается с помощью калькулятора Показатели вариации. В исходных условиях задать: Вариационный ряд.
Задача 5
В порядке механической выборки обследован возраст 100 студентов вуза из общего числа 2000 чел.
Возраст, Лет | 17 | 18 | 19 | 20 | 21 | 22 | 23 |
Число студентов | 11 | 13 | 18 | 23 | 17 | 10 | 8 |
а) средний возраст студента вуза по выборке;
б) величину ошибки при определении возраста студентов на основе выборки;
в) вероятные пределы колебания возраста для всех студентов при вероятности 0,997.
Решение. Таблица для расчета показателей.
Для оценки ряда распределения найдем следующие показатели:
Показатели центра распределения.
Средняя взвешенная


Мода
Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.
Максимальное значение повторений при x = 20 (f = 23). Следовательно, мода равна 20
Медиана
Медианой (Me) называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности. Находим xi, при котором накопленная частота S будет больше ∑f/2 = 51. Это значение xi = 20. Таким образом, медиана равна 20
Показатели вариации.
Абсолютные показатели вариации.
Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.
R = Xmax - Xmin
R = 23 - 17 = 6
Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.


Каждое значение ряда отличается от другого в среднем на 1.41
Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).
^{2} f}}{\sum{f}})

Несмещенная оценка дисперсии - состоятельная оценка дисперсии.
^{2} f}}{\sum{f}-1})

Среднее квадратическое отклонение.

Каждое значение ряда отличается от среднего значения 19.84 в среднем на 1.72
Оценка среднеквадратического отклонения.
Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v ≤ 30%, то совокупность однородна, а вариация слабая.
Интервальное оценивание центра генеральной совокупности.
Доверительный интервал для генерального среднего.
)
или
)
где d - процент выборки.
В этом случае 2Ф(tkp) = γ
Ф(tkp) = γ/2 = 0.997/2 = 0.4985
По таблице функции Лапласа найдем, при каком tkp значение Ф(tkp) = 0.4985
tkp(γ) = (0.4985) = 2.96

(19.84 - 0.5;19.84 + 0.5) = (19.34;20.34)
С вероятностью 0.997 можно утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала.
xi | Кол-во, fi | xi * fi | Накопленная частота, S | |x - xср|*f | (x - xср)2*f | Частота, fi/n |
17 | 11 | 187 | 11 | 31.24 | 88.72 | 0.11 |
18 | 13 | 234 | 24 | 23.92 | 44.01 | 0.13 |
19 | 18 | 342 | 42 | 15.12 | 12.7 | 0.18 |
20 | 23 | 460 | 65 | 3.68 | 0.59 | 0.23 |
21 | 17 | 357 | 82 | 19.72 | 22.88 | 0.17 |
22 | 10 | 220 | 92 | 21.6 | 46.66 | 0.1 |
23 | 8 | 184 | 100 | 25.28 | 79.88 | 0.08 |
100 | 1984 | 140.56 | 295.44 | 1 |
Показатели центра распределения.
Средняя взвешенная
Мода
Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.
Максимальное значение повторений при x = 20 (f = 23). Следовательно, мода равна 20
Медиана
Медианой (Me) называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности. Находим xi, при котором накопленная частота S будет больше ∑f/2 = 51. Это значение xi = 20. Таким образом, медиана равна 20
Показатели вариации.
Абсолютные показатели вариации.
Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.
R = Xmax - Xmin
R = 23 - 17 = 6
Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.
Каждое значение ряда отличается от другого в среднем на 1.41
Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).
Несмещенная оценка дисперсии - состоятельная оценка дисперсии.
Среднее квадратическое отклонение.
Каждое значение ряда отличается от среднего значения 19.84 в среднем на 1.72
Оценка среднеквадратического отклонения.
Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.
Поскольку v ≤ 30%, то совокупность однородна, а вариация слабая.
Интервальное оценивание центра генеральной совокупности.
Доверительный интервал для генерального среднего.
или
где d - процент выборки.
В этом случае 2Ф(tkp) = γ
Ф(tkp) = γ/2 = 0.997/2 = 0.4985
По таблице функции Лапласа найдем, при каком tkp значение Ф(tkp) = 0.4985
tkp(γ) = (0.4985) = 2.96
(19.84 - 0.5;19.84 + 0.5) = (19.34;20.34)
С вероятностью 0.997 можно утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала.
Задача 6.
Есть ли статистически значимая связь между удовлетворенностью перспективами должностного и профессионального роста в зависимости от пола респондента.
пол | удовлетворенность | Σ | |
доволен | не доволен | ||
Ж | 4 | 8 | 12 |
М | 12 | 6 | 18 |
Σ | 16 | 14 | 30 |
Коэффициент контингенции. Пример решения.
см. также примеры решения задач по статистике.