Проверка гипотезы о равномерном распределении
В качестве примера непрерывной случайной величины рассмотрим случайную величину X, равномерно распределенную на интервале (a; b). Говорят, что случайная величина X равномерно распределена на промежутке (a; b), если ее плотность распределения непостоянна на этом промежутке:![](images/p4-image007.gif)
Из условия нормировки определим значение константы c. Площадь под кривой плотности распределения должна быть равна единице, но в нашем случае — это площадь прямоугольника с основанием (b - α) и высотой c (рис. 1).
![](images/p4-image009.jpg)
Рис. 1 Плотность равномерного распределения
Отсюда находим значение постоянной c:
![](images/p4-image010.gif)
Итак, плотность равномерно распределенной случайной величины равна
![](images/p4-image011.gif)
Найдем теперь функцию распределения по формуле:
1) для
![](images/p4-image012.gif)
2) для
![](images/p4-image013.gif)
3) для
![](images/p4-image014.gif)
Таким образом,
![](images/p4-image015.gif)
Функция распределения непрерывна и не убывает (рис. 2).
![](images/p4-image016.jpg)
Рис. 2 Функция распределения равномерно распределенной случайной величины
Найдем математическое ожидание равномерно распределенной случайной величины по формуле:
Дисперсия равномерного распределения рассчитывается по формуле и равна
Пример №1. Цена деления шкалы измерительного прибора равна 0.2. Показания прибора округляют до ближайшего целого деления. Найти вероятность того, что при отсчете будет сделана ошибка: а) меньшая 0.04; б) большая 0.02
Решение. Ошибка округления есть случайная величина, равномерно распределенная на промежутке между соседними целыми делениями. Рассмотрим в качестве такого деления интервал (0; 0,2) (рис. а). Округление может проводиться как в сторону левой границы — 0, так и в сторону правой — 0,2, значит, ошибка, менее либо равная 0,04, может быть сделана два раза, что необходимо учесть при подсчете вероятности:
P = 0,2 + 0,2 = 0,4
Для второго случая величина ошибки может превышать 0,02 также с обеих границ деления, то есть она может быть либо больше 0,02, либо меньше 0,18.
Тогда вероятность появления такой ошибки:
Пример №2. Предполагалось, что о стабильности экономической обстановки в стране (отсутствии войн, стихийных бедствий и т. д.) за последние 50 лет можно судить по характеру распределения населения по возрасту: при спокойной обстановке оно должно быть равномерным. В результате проведенного исследования, для одной из стран были получены следующие данные.
Возрастной интервал | 0-10 | 10-20 | 20-30 | 30-40 | 40-50 | 50-60 | 60-70 | 70-80 |
Доля населения | 0,14 | 0,09 | 0,10 | 0,08 | 0,16 | 0,13 | 0,12 | 0,18 |
Группы | Середина интервала, xi | Кол-во, fi | xi * fi | Накопленная частота, S | |x - xср|*f | (x - xср)2*f | Частота, fi/n |
0 - 10 | 5 | 0.14 | 0.7 | 0.14 | 5.32 | 202.16 | 0.14 |
10 - 20 | 15 | 0.09 | 1.35 | 0.23 | 2.52 | 70.56 | 0.09 |
20 - 30 | 25 | 0.1 | 2.5 | 0.33 | 1.8 | 32.4 | 0.1 |
30 - 40 | 35 | 0.08 | 2.8 | 0.41 | 0.64 | 5.12 | 0.08 |
40 - 50 | 45 | 0.16 | 7.2 | 0.57 | 0.32 | 0.64 | 0.16 |
50 - 60 | 55 | 0.13 | 7.15 | 0.7 | 1.56 | 18.72 | 0.13 |
60 - 70 | 65 | 0.12 | 7.8 | 0.82 | 2.64 | 58.08 | 0.12 |
70 - 80 | 75 | 0.18 | 13.5 | 1 | 5.76 | 184.32 | 0.18 |
1 | 43 | 20.56 | 572 | 1 |
Средняя взвешенная
![](images/variations/udistribution1.png)
![](images/variations/udistribution2.png)
Показатели вариации.
Абсолютные показатели вариации.
Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.
R = Xmax - Xmin
R = 70 - 0 = 70
Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).
![](images/variations/udistribution3.png)
![](images/variations/udistribution4.png)
Среднее квадратическое отклонение.
![](images/variations/udistribution5.png)
Каждое значение ряда отличается от среднего значения 43 не более, чем на 23.92
Проверка гипотез о виде распределения.
4. Проверка гипотезы о равномерном распределении генеральной совокупности.
Для того чтобы проверить гипотезу о равномерном распределении X,т.е. по закону: f(x) = 1/(b-a) в интервале (a,b)
надо:
1. Оценить параметры a и b - концы интервала, в котором наблюдались возможные значения X, по формулам (через знак * обозначены оценки параметров):
![](images/variations/udistribution6.png)
2. Найти плотность вероятности предполагаемого распределения f(x) = 1/(b* - a*)
3. Найти теоретические частоты:
n1 = nP1 = n[f(x)*(x1 - a*)] = n*1/(b* - a*)*(x1 - a*)
n2 = n3 = ... = ns-1 = n*1/(b* - a*)*(xi - xi-1)
ns = n*1/(b* - a*)*(b* - xs-1)
4. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона, приняв число степеней свободы k = s-3, где s - число первоначальных интервалов выборки; если же было произведено объединение малочисленных частот, следовательно, и самих интервалов, то s - число интервалов, оставшихся после объединения.
Решение:
1. Найдем оценки параметров a* и b* равномерного распределения по формулам:
![](images/variations/udistribution7.png)
![](images/variations/udistribution8.png)
2. Найдем плотность предполагаемого равномерного распределения:
f(x) = 1/(b* - a*) = 1/(84.42 - 1.58) = 0.0121
3. Найдем теоретические частоты:
n1 = n*f(x)(x1 - a*) = 1 * 0.0121(10-1.58) = 0.1
n8 = n*f(x)(b* - x7) = 1 * 0.0121(84.42-70) = 0.17
Остальные ns будут равны:
ns = n*f(x)(xi - xi-1)
i | ni | n*i | ni - n*i | (ni - n*i)2 | (ni - n*i)2/n*i |
1 | 0.14 | 0.1 | 0.0383 | 0.00147 | 0.0144 |
2 | 0.09 | 0.12 | -0.0307 | 0.000943 | 0.00781 |
3 | 0.1 | 0.12 | -0.0207 | 0.000429 | 0.00355 |
4 | 0.08 | 0.12 | -0.0407 | 0.00166 | 0.0137 |
5 | 0.16 | 0.12 | 0.0393 | 0.00154 | 0.0128 |
6 | 0.13 | 0.12 | 0.0093 | 8.6E-5 | 0.000716 |
7 | 0.12 | 0.12 | -0.000701 | 0 | 4.0E-6 |
8 | 0.18 | 0.17 | 0.00589 | 3.5E-5 | 0.000199 |
Итого | 1 | 0.0532 |
Поэтому критическая область для этой статистики всегда правосторонняя: [Kkp;+∞).
Её границу Kkp = χ2(k-r-1;α) находим по таблицам распределения χ2 и заданным значениям s, k (число интервалов), r=2 (параметры a и b).
Kkp = 11.07050; Kнабл = 0.0532
Наблюдаемое значение статистики Пирсона не попадает в критическую область: Кнабл < Kkp, поэтому нет оснований отвергать основную гипотезу. Справедливо предположение о том, что данные выборки имеют равномерный закон.
![](https://www.semestr.ru/images/math/group/uniform.gif)
xi | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
mi | 26 | 21 | 18 | 32 | 26 | 26 | 31 |
Проверьте гипотезу о том, что данная случайная величина имеет равномерное дискретное распределение. Уровень значимости a= 0,1.
Решение. Выдвигаем основную и альтернативную гипотезы:
H0: данная случайная величина имеет равномерное дискретное распределение;
H1: данная случайная величина не имеет равномерное дискретное распределение.
Считаем, что данное распределение является равномерным дискретным. Тогда вероятности всех значений этой величины одинаковы и равны
![](images/uniform-image001.gif)
Заполняем два оставшихся столбца и находим суммы по столбцам.
xi | mi | pi | mi’ | mi– mi’ | ![]() |
1 | 26 | 0,1429 | 25,714 | 0,286 | 0,003181 |
2 | 21 | 0,1429 | 25,714 | -4,714 | 0,864191 |
3 | 18 | 0,1429 | 25,714 | -7,714 | 2,31414 |
4 | 32 | 0,1429 | 25,714 | 6,286 | 1,536665 |
5 | 26 | 0,1429 | 25,714 | 0,286 | 0,003181 |
6 | 26 | 0,1429 | 25,714 | 0,286 | 0,003181 |
7 | 31 | 0,1429 | 25,714 | 5,286 | 1,086637 |
S | 180 | 1 | 180 | 0 | 5,811 |
Последняя сумма соответствует искомому критерию Χнабл2=5,811.
Данная выборка разбита на l = 7 интервалов. Для дискретного равномерного распределения р = 0 (подбираемых параметра нет). Поэтому число степеней свободы в данном случае k = l-p - 1 = 7 - 0 - 1 = 6. При уровне значимости a= 0,1 и найденному числу степеней свободы из таблицы критических точек распределения Χ2 находим значение критерия Χкр2=10.64.
Т.к. Χнабл2 < Χкр 2, то нулевая гипотеза принимается: выборочные данные не противоречат тому, что распределение данной случайной величины является равномерным дискретным.
Пример №4. Игральную кость бросили 600 раз и результаты наблюдений записали в виде статистического ряда. Случайная величина X – число выпавших очков, ni – частота выпадения i очков, где i= 1, 2, 3, 4, 5, 6
. На уровне значимости α = 0,01 проверить гипотезу о симметричности игральной кости.
Пример №5. Заданная непрерывная случайная величина Х равномерно распределена в интервале (α, β).
Найти:
1) Числовые характеристики: математическое ожидание, дисперсию, среднее квадратическое отклонение.
2) интегральную функцию распределения.
3) Сделать графики дифференциальной и интегральной функций распределения.
α=3, β=8