Системы случайных величин

Назначение сервиса. С помощью сервиса по заданному закону распределения можно найти:

ряды распределения X и Y, математическое ожидание M[X], M[Y], дисперсию D[X], D[Y];
ковариацию cov(x,y), коэффициент корреляции r_x,y, условный ряд распределения X, условное математическое ожидание M[X/Y=y_i];

Кроме этого, дается ответ на вопрос, "зависимы ли случайные величины X и Y?".
Инструкция. Укажите размерность матрицы распределения вероятностей (количество строк и столбцов) и ее вид. Полученное решение сохраняется в файле Word.

Скачать пример оформления

Упорядоченная пара (X,Y) случайных величин X и Y называется двумерной случайной величиной, или случайным вектором двумерного пространства. Двумерная случайная величина (X,Y) называется также системой случайных величина X и Y. Множество всех возможных значений дискретной случайной величины с их вероятностями называется законом распределения этой случайной величины. Дискретная двумерная случайная величина (X,Y) считается заданной, если известен ее закон распределения:

P(X=x_i, Y=y_j) = p_ij, i=1,2...,n, j=1,2...,m

Пример №1. Двумерная дискретная случайная величина имеет таблицу распределения:

Y/X	1	2	3	4
10	0	0,11	0,12	0,03
20	0	0,13	0,09	0,02
30	0,02	0,11	0,08	0,01
40	0,03	0,11	0,05	`q`

Найти величину q и коэффициент корреляции этой случайной величины.

Решение. Величину q найдем из условия Σp_ij = 1
Σp_ij = 0,02 + 0,03 + 0,11 + … + 0,03 + 0,02 + 0,01 + q = 1
0.91+q = 1. Откуда q = 0.09
Находим ряды распределения X и Y.
Пользуясь формулой ∑P(xi,yj) = pi (j=1..n), находим ряд распределения X.

X	10	20	30	40
P	0.26	0.24	0.22	0.28	∑P_i = 1

Математическое ожидание M[X] = 10*0.26 + 20*0.24 + 30*0.22 + 40*0.28 = 25.2
Дисперсия D[X] = 10²*0.26 + 20²*0.24 + 30²*0.22 + 40²*0.28 - 25.2² = 132.96
Среднее квадратическое отклонение σ(x) = sqrt(D[X]) = sqrt(132.96) = 11.531

Пользуясь формулой ∑P(xi,yj) = qj (i=1..m), находим ряд распределения Y.

Y	1	2	3	4
P	0.05	0.46	0.34	0.15	∑P_i = 1

Математическое ожидание M[Y].
M[y] = 1*0.05 + 2*0.46 + 3*0.34 + 4*0.15 = 2.59
Дисперсия D[Y] = 1²*0.05 + 2²*0.46 + 3²*0.34 + 4²*0.15 - 2.59² = 0.64
Среднее квадратическое отклонение σ(y) = sqrt(D[Y]) = sqrt(0.64) = 0.801

Ковариация cov(X,Y) = M[X·Y] - M[X]·M[Y] = 2·10·0.11 + 3·10·0.12 + 4·10·0.03 + 2·20·0.13 + 3·20·0.09 + 4·20·0.02 + 1·30·0.02 + 2·30·0.11 + 3·30·0.08 + 4·30·0.01 + 1·40·0.03 + 2·40·0.11 + 3·40·0.05 + 4·40·0.09 - 25.2 · 2.59 = -0.068
Коэффициент корреляции r_xy = cov(x,y)/σ(x)&sigma(y) = -0.068/(11.531*0.801) = -0.00736

Пример 2. Данные статистической обработки сведений относительно двух показателей X и Y отражены в корреляционной таблице. Требуется:

написать ряды распределения для X и Y и вычислить для них выборочные средние и выборочные средние квадратические отклонения;
написать условные ряды распределения Y/x и вычислить условные средние Y/x;
изобразить графически зависимость условных средних Y/x от значений X;
рассчитать выборочный коэффициент корреляции Y на X;
написать выборочное уравнение прямой регрессии;
изобразить геометрически данные корреляционной таблицы и построить прямую регрессии.

Решение. Упорядоченная пара (X,Y) случайных величин X и Y называется двумерной случайной величиной, или случайным вектором двумерного пространства. Двумерная случайная величина (X,Y) называется также системой случайных величина X и Y.
Множество всех возможных значений дискретной случайной величины с их вероятностями называется законом распределения этой случайной величины.
Дискретная двумерная случайная величина (X,Y) считается заданной, если известен ее закон распределения:
P(X=x_i, Y=y_j) = p_ij, i=1,2...,n, j=1,2..,m

X / Y	20	30	40	50	60
11	2	0	0	0	0
16	4	6	0	0	0
21	0	3	6	2	0
26	0	0	45	8	4
31	0	0	4	6	7
36	0	0	0	0	3

События (X=x_i, Y=y_j) образуют полную группу событий, поэтому сумма всех вероятностей p_ij(i=1,2...,n, j=1,2..,m), указанных в таблице, равна 1.
1. Зависимость случайных величин X и Y.
Находим ряды распределения X и Y.
Пользуясь формулой ∑P(xi,yj) = pi (j=1..n), находим ряд распределения X.

X	11	16	21	26	31	36
P	2	10	11	57	17	3	∑P_i = 100

Математическое ожидание M[X].
M[x] = (11*2 + 16*10 + 21*11 + 26*57 + 31*17 + 36*3 )/100 = 25.3
Дисперсия D[X].
D[X] = (11²*2 + 16²*10 + 21²*11 + 26²*57 + 31²*17 + 36²*3 )/100 - 25.3² = 24.01
Среднее квадратическое отклонение σ(x).

Пользуясь формулой ∑P(xi,yj) = qj (i=1..m), находим ряд распределения Y.

Y	20	30	40	50	60
P	6	9	55	16	14	∑P_i = 100

Математическое ожидание M[Y].
M[y] = (20*6 + 30*9 + 40*55 + 50*16 + 60*14 )/100 = 42.3
Дисперсия D[Y].
D[Y] = (20²*6 + 30²*9 + 40²*55 + 50²*16 + 60²*14 )/100 - 42.3² = 99.71
Среднее квадратическое отклонение σ(y).

Поскольку, P(X=11,Y=20) = 2≠2·6, то случайные величины X и Y зависимы.
2. Условный закон распределения X.
Условный закон распределения X(Y=20).
P(X=11/Y=20) = 2/6 = 0.33
P(X=16/Y=20) = 4/6 = 0.67
P(X=21/Y=20) = 0/6 = 0
P(X=26/Y=20) = 0/6 = 0
P(X=31/Y=20) = 0/6 = 0
P(X=36/Y=20) = 0/6 = 0
Условное математическое ожидание M[X/Y=20).
M[X/Y=y] = 11*0.33 + 16*0.67 + 21*0 + 26*0 + 31*0 + 36*0 = 14.33
Условная дисперсия D[X/Y=20).
D[X/Y=y] = 11²*0.33 + 16²*0.67 + 21²*0 + 26²*0 + 31²*0 + 36²*0 - 14.33² = 5.56
Условный закон распределения X(Y=30).
P(X=11/Y=30) = 0/9 = 0
P(X=16/Y=30) = 6/9 = 0.67
P(X=21/Y=30) = 3/9 = 0.33
P(X=26/Y=30) = 0/9 = 0
P(X=31/Y=30) = 0/9 = 0
P(X=36/Y=30) = 0/9 = 0
Условное математическое ожидание M[X/Y=30).
M[X/Y=y] = 11*0 + 16*0.67 + 21*0.33 + 26*0 + 31*0 + 36*0 = 17.67
Условная дисперсия D[X/Y=30).
D[X/Y=y] = 11²*0 + 16²*0.67 + 21²*0.33 + 26²*0 + 31²*0 + 36²*0 - 17.67² = 5.56
Условный закон распределения X(Y=40).
P(X=11/Y=40) = 0/55 = 0
P(X=16/Y=40) = 0/55 = 0
P(X=21/Y=40) = 6/55 = 0.11
P(X=26/Y=40) = 45/55 = 0.82
P(X=31/Y=40) = 4/55 = 0.0727
P(X=36/Y=40) = 0/55 = 0
Условное математическое ожидание M[X/Y=40).
M[X/Y=y] = 11*0 + 16*0 + 21*0.11 + 26*0.82 + 31*0.0727 + 36*0 = 25.82
Условная дисперсия D[X/Y=40).
D[X/Y=y] = 11²*0 + 16²*0 + 21²*0.11 + 26²*0.82 + 31²*0.0727 + 36²*0 - 25.82² = 4.51
Условный закон распределения X(Y=50).
P(X=11/Y=50) = 0/16 = 0
P(X=16/Y=50) = 0/16 = 0
P(X=21/Y=50) = 2/16 = 0.13
P(X=26/Y=50) = 8/16 = 0.5
P(X=31/Y=50) = 6/16 = 0.38
P(X=36/Y=50) = 0/16 = 0
Условное математическое ожидание M[X/Y=50).
M[X/Y=y] = 11*0 + 16*0 + 21*0.13 + 26*0.5 + 31*0.38 + 36*0 = 27.25
Условная дисперсия D[X/Y=50).
D[X/Y=y] = 11²*0 + 16²*0 + 21²*0.13 + 26²*0.5 + 31²*0.38 + 36²*0 - 27.25² = 10.94
Условный закон распределения X(Y=60).
P(X=11/Y=60) = 0/14 = 0
P(X=16/Y=60) = 0/14 = 0
P(X=21/Y=60) = 0/14 = 0
P(X=26/Y=60) = 4/14 = 0.29
P(X=31/Y=60) = 7/14 = 0.5
P(X=36/Y=60) = 3/14 = 0.21
Условное математическое ожидание M[X/Y=60).
M[X/Y=y] = 11*0 + 16*0 + 21*0 + 26*0.29 + 31*0.5 + 36*0.21 = 30.64
Условная дисперсия D[X/Y=60).
D[X/Y=y] = 11²*0 + 16²*0 + 21²*0 + 26²*0.29 + 31²*0.5 + 36²*0.21 - 30.64² = 12.37
3. Условный закон распределения Y.
Условный закон распределения Y(X=11).
P(Y=20/X=11) = 2/2 = 1
P(Y=30/X=11) = 0/2 = 0
P(Y=40/X=11) = 0/2 = 0
P(Y=50/X=11) = 0/2 = 0
P(Y=60/X=11) = 0/2 = 0
Условное математическое ожидание M[Y/X=11).
M[Y/X=x] = 20*1 + 30*0 + 40*0 + 50*0 + 60*0 = 20
Условная дисперсия D[Y/X=11).
D[Y/X=x] = 20²*1 + 30²*0 + 40²*0 + 50²*0 + 60²*0 - 20² = 0
Условный закон распределения Y(X=16).
P(Y=20/X=16) = 4/10 = 0.4
P(Y=30/X=16) = 6/10 = 0.6
P(Y=40/X=16) = 0/10 = 0
P(Y=50/X=16) = 0/10 = 0
P(Y=60/X=16) = 0/10 = 0
Условное математическое ожидание M[Y/X=16).
M[Y/X=x] = 20*0.4 + 30*0.6 + 40*0 + 50*0 + 60*0 = 26
Условная дисперсия D[Y/X=16).
D[Y/X=x] = 20²*0.4 + 30²*0.6 + 40²*0 + 50²*0 + 60²*0 - 26² = 24
Условный закон распределения Y(X=21).
P(Y=20/X=21) = 0/11 = 0
P(Y=30/X=21) = 3/11 = 0.27
P(Y=40/X=21) = 6/11 = 0.55
P(Y=50/X=21) = 2/11 = 0.18
P(Y=60/X=21) = 0/11 = 0
Условное математическое ожидание M[Y/X=21).
M[Y/X=x] = 20*0 + 30*0.27 + 40*0.55 + 50*0.18 + 60*0 = 39.09
Условная дисперсия D[Y/X=21).
D[Y/X=x] = 20²*0 + 30²*0.27 + 40²*0.55 + 50²*0.18 + 60²*0 - 39.09² = 44.63
Условный закон распределения Y(X=26).
P(Y=20/X=26) = 0/57 = 0
P(Y=30/X=26) = 0/57 = 0
P(Y=40/X=26) = 45/57 = 0.79
P(Y=50/X=26) = 8/57 = 0.14
P(Y=60/X=26) = 4/57 = 0.0702
Условное математическое ожидание M[Y/X=26).
M[Y/X=x] = 20*0 + 30*0 + 40*0.79 + 50*0.14 + 60*0.0702 = 42.81
Условная дисперсия D[Y/X=26).
D[Y/X=x] = 20²*0 + 30²*0 + 40²*0.79 + 50²*0.14 + 60²*0.0702 - 42.81² = 34.23
Условный закон распределения Y(X=31).
P(Y=20/X=31) = 0/17 = 0
P(Y=30/X=31) = 0/17 = 0
P(Y=40/X=31) = 4/17 = 0.24
P(Y=50/X=31) = 6/17 = 0.35
P(Y=60/X=31) = 7/17 = 0.41
Условное математическое ожидание M[Y/X=31).
M[Y/X=x] = 20*0 + 30*0 + 40*0.24 + 50*0.35 + 60*0.41 = 51.76
Условная дисперсия D[Y/X=31).
D[Y/X=x] = 20²*0 + 30²*0 + 40²*0.24 + 50²*0.35 + 60²*0.41 - 51.76² = 61.59
Условный закон распределения Y(X=36).
P(Y=20/X=36) = 0/3 = 0
P(Y=30/X=36) = 0/3 = 0
P(Y=40/X=36) = 0/3 = 0
P(Y=50/X=36) = 0/3 = 0
P(Y=60/X=36) = 3/3 = 1
Условное математическое ожидание M[Y/X=36).
M[Y/X=x] = 20*0 + 30*0 + 40*0 + 50*0 + 60*1 = 60
Условная дисперсия D[Y/X=36).
D[Y/X=x] = 20²*0 + 30²*0 + 40²*0 + 50²*0 + 60²*1 - 60² = 0
Ковариация.
cov(X,Y) = M[X·Y] - M[X]·M[Y]
cov(X,Y) = (20·11·2 + 20·16·4 + 30·16·6 + 30·21·3 + 40·21·6 + 50·21·2 + 40·26·45 + 50·26·8 + 60·26·4 + 40·31·4 + 50·31·6 + 60·31·7 + 60·36·3)/100 - 25.3 · 42.3 = 38.11
Если случайные величины независимы, то их ковариации равна нулю. В нашем случае cov(X,Y) ≠ 0.
Коэффициент корреляции.

Уравнение линейной регрессии с y на x имеет вид:

Уравнение линейной регрессии с x на y имеет вид:

Найдем необходимые числовые характеристики.
Выборочные средние:
x = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 42.3
y = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 25.3
Дисперсии:
σ²_x = (20²(2 + 4) + 30²(6 + 3) + 40²(6 + 45 + 4) + 50²(2 + 8 + 6) + 60²(4 + 7 + 3))/100 - 42.3² = 99.71
σ²_y = (11²(2) + 16²(4 + 6) + 21²(3 + 6 + 2) + 26²(45 + 8 + 4) + 31²(4 + 6 + 7) + 36²(3))/100 - 25.3² = 24.01
Откуда получаем среднеквадратические отклонения:
σ_x = 9.99 и σ_y = 4.9
и ковариация:
Cov(x,y) = (20·11·2 + 20·16·4 + 30·16·6 + 30·21·3 + 40·21·6 + 50·21·2 + 40·26·45 + 50·26·8 + 60·26·4 + 40·31·4 + 50·31·6 + 60·31·7 + 60·36·3)/100 - 42.3 · 25.3 = 38.11
Определим коэффициент корреляции:

Запишем уравнения линий регрессии y(x):

и вычисляя, получаем:
y_x = 0.38 x + 9.14
Запишем уравнения линий регрессии x(y):

и вычисляя, получаем:
x_y = 1.59 y + 2.15
Если построить точки, определяемые таблицей и линии регрессии, увидим, что обе линии проходят через точку с координатами (42.3; 25.3) и точки расположены близко к линиям регрессии.
Значимость коэффициента корреляции.

По таблице Стьюдента с уровнем значимости α=0.05 и степенями свободы k=100-m-1 = 98 находим t_крит:
t_крит (n-m-1;α/2) = (98;0.025) = 1.984
где m = 1 - количество объясняющих переменных.
Если t_набл > t_критич, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается).
Поскольку t_набл > t_крит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим.

doc

Задание. Количество попаданий пар значений случайных величин X и Y в соответствующие интервалы приведены в таблице. По этим данным найти выборочный коэффициент корреляции и выборочные уравнения прямых линий регрессии Y на X и X на Y.
Решение

Пример. Распределение вероятностей двумерной случайной величины (X, Y) задано таблицей. Найти законы распределения составляющих величин X, Y и коэффициент корреляции p(X, Y).
Скачать решение

Задание. Двумерная дискретная величина (X, Y) задана законом распределения. Найти законы распределения составляющих X и Y, ковариацию и коэффициент корреляции.

Системы случайных величин

Правила ввода данных

Поиск

Процесс

Сообщение