Показатели центра распределения

По заданному интервальному ряду найти показатели центра распределения. Проверить гипотезу  о нормальном распределении.
Группы x Кол-во f x * f S (x - x ср) * f (x - x ср)2 * f (x - x ср)3 * f (x - x ср)4 * f Частота
20 - 22 21 41 861 41 137.4 460.45 -1543.08 5171.17 0.11
22 - 24 23 120 2760 161 162.14 219.09 -296.04 400.01 0.32
24 - 26 25 131 3275 292 84.99 55.14 35.78 23.21 0.35
26 - 28 27 81 2187 373 214.55 568.3 1505.32 3987.29 0.22
    373 9083 599.09 1302.99 -298.02 9581.67
Для оценки ряда распределения с помощью калькулятора найдем следующие показатели:
Показатели центра распределения
Средняя взвешенная


Мода

Выбираем в качестве начала интервала 24, так как именно на этот интервал приходится наибольшее количество

Наиболее часто встречающееся значение ряда – 24.36
Медиана
Медиана делит выборку на две части: половина вариант меньше медианы, половина — больше


Таким образом, что 50% единиц совокупности будут меньше по величине 24.39
Квартили
Квартили – это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине Q1; 25% будут заключены между Q1 и Q2; 25% - между Q2 и Q3; остальные 25% превосходят Q3.

Таким образом, что 25% единиц совокупности будут меньше по величине 22.87
Q2 совпадает с медианой, Q2 = 24.39

Остальные 25% превосходят 25.81
Децили (децентили)
Децили – это значения признака в ранжированном ряду распределения, выбранные таким образом, что 10% единиц совокупности будут меньше по величине D1; 80% будут заключены между D1 и D9; остальные 10% превосходят D9.


Таким образом, что 10% единиц совокупности будут меньше по величине 21.82


Остальные 10% превосходят 27.08

 Показатели вариации.
Размах вариации
R = X max - X min
R = 28 - 20 = 8
Среднее линейное отклонение


Каждое значение ряда отличается от другого не более, чем на 1.61
Дисперсия


Среднее квадратическое отклонение

Каждое значение ряда отличается от среднего значения 24.35 не более, чем на 1.87
Коэффициент вариации

Поскольку v<30%, то совокупность однородна, а вариация слабая. Полученным результатам можно доверять
Показатели формы распределения .
Коэффициент осцилляции

Относительное линейное отклонение

Относительный показатель квартильной вариации

Степень асимметрии
Симметричным является распределение, в котором частоты любых двух вариантов, равностоящих в обе стороны от центра распределения, равны между собой.


Отрицательный знак свидетельствует о наличии левосторонней асимметрии
Для симметричных распределений рассчитывается показатель эксцесса (островершинности). Эксцесс представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения.

Ex > 0  - островершинное распределение
Интервальное оценивание центра генеральной совокупности
Доверительный интервал для генерального среднего


Поскольку n>30, то определяем значение tkp по таблицам функции Лапласа
В этом случае 2Ф(tkp) = 1 - γ
Ф(tkp) = γ /2 = (1- 0.05)/2 = 0.475
По таблице функции Лапласа найдем, при каком tkp значение Ф(tkp) = 373
Tтабл (n-1;a) = (373;0.475) = 5
(24.35 - 4.68;24.35 + 4.68) = (19.67;29.03)
Проверка гипотез о виде распределения
Проверим это предположение с помощью критерия согласия Пирсона

где pi  — вероятность попадания в i-й интервал случайной величины, распределенной по гипотетическому закону.
Для вычисления вероятностей pi применим формулу и таблицу функции Лапласа.

Интервалы группировки Наблюдаемая частота ni Ф(xi) Ф(xi+1) pi n pi Слагаемые статистики Пирсона Ki
20 - 22 41 0.3962 0.4904 0.0942 35.1366 0.9784
22 - 24 120 0.0753 0.3962 0.3209 119.6957 0.0007
24 - 26 131 0.3133 0.0753 0.238 88.774 20.0851
26 - 28 81 0.475 0.3133 0.1617 60.3141 7.0946
  373         28.1588


Определим границу критической области. Так как статистика Пирсона измеряет разницу между эмпирическим и теоретическим распределениями, то чем больше ее наблюдаемое значение  Kнабл, тем сильнее довод против основной гипотезы.
Поэтому критическая область для этой статистики всегда правосторонняя: [Kkp;+∞).
Её границу Kkp = χ2(k-r-1;a) находим по таблицам распределения «хи-квадрат» и заданным значениям a, k (число интервалов),  r=2 (параметры x и σ оценены по выборке).
Kkp = 3.8; Kнабл = 28.16
Наблюдаемое значение статистики Пирсона попадает в критическую область: Кнабл > Kkp, поэтому есть основания отвергать основную гипотезу. Данные выборки распределены не по нормальному закону.

Перейти к онлайн решению своей задачи

загрузка...