Пример решения

Задание. Данные статистической обработки сведений относительно двух показателей X и Y отражены в корреляционной таблице. Требуется:
  1. написать ряды распределения для X и Y и вычислить для них выборочные средние и выборочные средние квадратические отклонения;
  2. написать условные ряды распределения Y/x и вычислить условные средние Y/x;
  3. изобразить графически зависимость условных средних Y/x от значений X;
  4. рассчитать выборочный коэффициент корреляции Y на X;
  5. написать выборочное уравнение прямой регрессии;
  6. изобразить геометрически данные корреляционной таблицы и построить прямую регрессии.

Решение находим с помощью калькулятора.
Упорядоченная пара (X,Y) случайных величин X и Y называется двумерной случайной величиной, или случайным вектором двумерного пространства. Двумерная случайная величина (X,Y) называется также системой случайных величина X и Y.
Множество всех возможных значений дискретной случайной величины с их вероятностями называется законом распределения этой случайной величины.
Дискретная двумерная случайная величина (X,Y) считается заданной, если известен ее закон распределения:
P(X=xi, Y=yj) = pij, i=1,2...,n, j=1,2..,m

X / Y

20

30

40

50

60

11

2

0

0

0

0

16

4

6

0

0

0

21

0

3

6

2

0

26

0

0

45

8

4

31

0

0

4

6

7

36

0

0

0

0

3



События (X=xi, Y=yj) образуют полную группу событий, поэтому сумма всех вероятностей pij(i=1,2...,n, j=1,2..,m), указанных в таблице, равна 1.
1. Зависимость случайных величин X и Y.
Находим ряды распределения X и Y.
Пользуясь формулой ∑P(xi,yj) = pi (j=1..n), находим ряд распределения X.

X

11

16

21

26

31

36

P

2

10

11

57

17

3

∑Pi = 100



Математическое ожидание M[X].
M[x] = (11*2 + 16*10 + 21*11 + 26*57 + 31*17 + 36*3 )/100 = 25.3
Дисперсия D[X].
D[X] = (112*2 + 162*10 + 212*11 + 262*57 + 312*17 + 362*3 )/100 - 25.32 = 24.01
Среднее квадратическое отклонение σ(x).

Пользуясь формулой ∑P(xi,yj) = qj (i=1..m), находим ряд распределения Y.

Y

20

30

40

50

60

P

6

9

55

16

14

∑Pi = 100



Математическое ожидание M[Y].
M[y] = (20*6 + 30*9 + 40*55 + 50*16 + 60*14 )/100 = 42.3
Дисперсия D[Y].
D[Y] = (202*6 + 302*9 + 402*55 + 502*16 + 602*14 )/100 - 42.32 = 99.71
Среднее квадратическое отклонение σ(y).

Поскольку, P(X=11,Y=20) = 2≠2•6, то случайные величины X и Y зависимы.
2. Условный закон распределения X.
Условный закон распределения X(Y=20).
P(X=11/Y=20) = 2/6 = 0.33
P(X=16/Y=20) = 4/6 = 0.67
P(X=21/Y=20) = 0/6 = 0
P(X=26/Y=20) = 0/6 = 0
P(X=31/Y=20) = 0/6 = 0
P(X=36/Y=20) = 0/6 = 0
Условное математическое ожидание M[X/Y=20).
M[X/Y=y] = 11*0.33 + 16*0.67 + 21*0 + 26*0 + 31*0 + 36*0 = 14.33
Условная дисперсия D[X/Y=20).
D[X/Y=y] = 112*0.33 + 162*0.67 + 212*0 + 262*0 + 312*0 + 362*0 - 14.332 = 5.56
Условный закон распределения X(Y=30).
P(X=11/Y=30) = 0/9 = 0
P(X=16/Y=30) = 6/9 = 0.67
P(X=21/Y=30) = 3/9 = 0.33
P(X=26/Y=30) = 0/9 = 0
P(X=31/Y=30) = 0/9 = 0
P(X=36/Y=30) = 0/9 = 0
Условное математическое ожидание M[X/Y=30).
M[X/Y=y] = 11*0 + 16*0.67 + 21*0.33 + 26*0 + 31*0 + 36*0 = 17.67
Условная дисперсия D[X/Y=30).
D[X/Y=y] = 112*0 + 162*0.67 + 212*0.33 + 262*0 + 312*0 + 362*0 - 17.672 = 5.56
Условный закон распределения X(Y=40).
P(X=11/Y=40) = 0/55 = 0
P(X=16/Y=40) = 0/55 = 0
P(X=21/Y=40) = 6/55 = 0.11
P(X=26/Y=40) = 45/55 = 0.82
P(X=31/Y=40) = 4/55 = 0.0727
P(X=36/Y=40) = 0/55 = 0
Условное математическое ожидание M[X/Y=40).
M[X/Y=y] = 11*0 + 16*0 + 21*0.11 + 26*0.82 + 31*0.0727 + 36*0 = 25.82
Условная дисперсия D[X/Y=40).
D[X/Y=y] = 112*0 + 162*0 + 212*0.11 + 262*0.82 + 312*0.0727 + 362*0 - 25.822 = 4.51
Условный закон распределения X(Y=50).
P(X=11/Y=50) = 0/16 = 0
P(X=16/Y=50) = 0/16 = 0
P(X=21/Y=50) = 2/16 = 0.13
P(X=26/Y=50) = 8/16 = 0.5
P(X=31/Y=50) = 6/16 = 0.38
P(X=36/Y=50) = 0/16 = 0
Условное математическое ожидание M[X/Y=50).
M[X/Y=y] = 11*0 + 16*0 + 21*0.13 + 26*0.5 + 31*0.38 + 36*0 = 27.25
Условная дисперсия D[X/Y=50).
D[X/Y=y] = 112*0 + 162*0 + 212*0.13 + 262*0.5 + 312*0.38 + 362*0 - 27.252 = 10.94
Условный закон распределения X(Y=60).
P(X=11/Y=60) = 0/14 = 0
P(X=16/Y=60) = 0/14 = 0
P(X=21/Y=60) = 0/14 = 0
P(X=26/Y=60) = 4/14 = 0.29
P(X=31/Y=60) = 7/14 = 0.5
P(X=36/Y=60) = 3/14 = 0.21
Условное математическое ожидание M[X/Y=60).
M[X/Y=y] = 11*0 + 16*0 + 21*0 + 26*0.29 + 31*0.5 + 36*0.21 = 30.64
Условная дисперсия D[X/Y=60).
D[X/Y=y] = 112*0 + 162*0 + 212*0 + 262*0.29 + 312*0.5 + 362*0.21 - 30.642 = 12.37
3. Условный закон распределения Y.
Условный закон распределения Y(X=11).
P(Y=20/X=11) = 2/2 = 1
P(Y=30/X=11) = 0/2 = 0
P(Y=40/X=11) = 0/2 = 0
P(Y=50/X=11) = 0/2 = 0
P(Y=60/X=11) = 0/2 = 0
Условное математическое ожидание M[Y/X=11).
M[Y/X=x] = 20*1 + 30*0 + 40*0 + 50*0 + 60*0 = 20
Условная дисперсия D[Y/X=11).
D[Y/X=x] = 202*1 + 302*0 + 402*0 + 502*0 + 602*0 - 202 = 0
Условный закон распределения Y(X=16).
P(Y=20/X=16) = 4/10 = 0.4
P(Y=30/X=16) = 6/10 = 0.6
P(Y=40/X=16) = 0/10 = 0
P(Y=50/X=16) = 0/10 = 0
P(Y=60/X=16) = 0/10 = 0
Условное математическое ожидание M[Y/X=16).
M[Y/X=x] = 20*0.4 + 30*0.6 + 40*0 + 50*0 + 60*0 = 26
Условная дисперсия D[Y/X=16).
D[Y/X=x] = 202*0.4 + 302*0.6 + 402*0 + 502*0 + 602*0 - 262 = 24
Условный закон распределения Y(X=21).
P(Y=20/X=21) = 0/11 = 0
P(Y=30/X=21) = 3/11 = 0.27
P(Y=40/X=21) = 6/11 = 0.55
P(Y=50/X=21) = 2/11 = 0.18
P(Y=60/X=21) = 0/11 = 0
Условное математическое ожидание M[Y/X=21).
M[Y/X=x] = 20*0 + 30*0.27 + 40*0.55 + 50*0.18 + 60*0 = 39.09
Условная дисперсия D[Y/X=21).
D[Y/X=x] = 202*0 + 302*0.27 + 402*0.55 + 502*0.18 + 602*0 - 39.092 = 44.63
Условный закон распределения Y(X=26).
P(Y=20/X=26) = 0/57 = 0
P(Y=30/X=26) = 0/57 = 0
P(Y=40/X=26) = 45/57 = 0.79
P(Y=50/X=26) = 8/57 = 0.14
P(Y=60/X=26) = 4/57 = 0.0702
Условное математическое ожидание M[Y/X=26).
M[Y/X=x] = 20*0 + 30*0 + 40*0.79 + 50*0.14 + 60*0.0702 = 42.81
Условная дисперсия D[Y/X=26).
D[Y/X=x] = 202*0 + 302*0 + 402*0.79 + 502*0.14 + 602*0.0702 - 42.812 = 34.23
Условный закон распределения Y(X=31).
P(Y=20/X=31) = 0/17 = 0
P(Y=30/X=31) = 0/17 = 0
P(Y=40/X=31) = 4/17 = 0.24
P(Y=50/X=31) = 6/17 = 0.35
P(Y=60/X=31) = 7/17 = 0.41
Условное математическое ожидание M[Y/X=31).
M[Y/X=x] = 20*0 + 30*0 + 40*0.24 + 50*0.35 + 60*0.41 = 51.76
Условная дисперсия D[Y/X=31).
D[Y/X=x] = 202*0 + 302*0 + 402*0.24 + 502*0.35 + 602*0.41 - 51.762 = 61.59
Условный закон распределения Y(X=36).
P(Y=20/X=36) = 0/3 = 0
P(Y=30/X=36) = 0/3 = 0
P(Y=40/X=36) = 0/3 = 0
P(Y=50/X=36) = 0/3 = 0
P(Y=60/X=36) = 3/3 = 1
Условное математическое ожидание M[Y/X=36).
M[Y/X=x] = 20*0 + 30*0 + 40*0 + 50*0 + 60*1 = 60
Условная дисперсия D[Y/X=36).
D[Y/X=x] = 202*0 + 302*0 + 402*0 + 502*0 + 602*1 - 602 = 0
Ковариация.
cov(X,Y) = M[X•Y] - M[X]•M[Y]
cov(X,Y) = (20•11•2 + 20•16•4 + 30•16•6 + 30•21•3 + 40•21•6 + 50•21•2 + 40•26•45 + 50•26•8 + 60•26•4 + 40•31•4 + 50•31•6 + 60•31•7 + 60•36•3)/100 - 25.3 • 42.3 = 38.11
Если случайные величины независимы, то их ковариации равна нулю. В нашем случае cov(X,Y) ≠ 0.
Коэффициент корреляции.


Уравнение линейной регрессии с y на x имеет вид:

Уравнение линейной регрессии с x на y имеет вид:

Найдем необходимые числовые характеристики.
Выборочные средние:
(20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 42.3
(20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 25.3
Дисперсии:
σ2x = (202(2 + 4) + 302(6 + 3) + 402(6 + 45 + 4) + 502(2 + 8 + 6) + 602(4 + 7 + 3))/100 - 42.32 = 99.71
σ2y = (112(2) + 162(4 + 6) + 212(3 + 6 + 2) + 262(45 + 8 + 4) + 312(4 + 6 + 7) + 362(3))/100 - 25.32 = 24.01
Откуда получаем среднеквадратические отклонения:
σx = 9.99 и σy = 4.9
и ковариация:
Cov(x,y) = (20•11•2 + 20•16•4 + 30•16•6 + 30•21•3 + 40•21•6 + 50•21•2 + 40•26•45 + 50•26•8 + 60•26•4 + 40•31•4 + 50•31•6 + 60•31•7 + 60•36•3)/100 - 42.3 • 25.3 = 38.11
Определим коэффициент корреляции:


Запишем уравнения линий регрессии y(x):

и вычисляя, получаем:
yx = 0.38 x + 9.14
Запишем уравнения линий регрессии x(y):

и вычисляя, получаем:
xy = 1.59 y + 2.15
Если построить точки, определяемые таблицей и линии регрессии, увидим, что обе линии проходят через точку с координатами (42.3; 25.3) и точки расположены близко к линиям регрессии.
Значимость коэффициента корреляции.

По таблице Стьюдента с уровнем значимости α=0.05 и степенями свободы k=100-m-1 = 98 находим tкрит:
tкрит (n-m-1;α/2) = (98;0.025) = 1.984
где m = 1 - количество объясняющих переменных.
Если tнабл > tкритич, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается).
Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим.

Перейти к онлайн решению своей задачи

doc:xml:

Задание. Количество попаданий пар значений случайных величин X и Y в соответствующие интервалы приведены в таблице. По этим данным найти выборочный коэффициент корреляции и выборочные уравнения прямых линий регрессии Y на X и X на Y.
Решение.

doc:xml:

Пример. Распределение вероятностей двумерной случайной величины (X, Y) задано таблицей. Найти законы распределения составляющих величин X, Y и коэффициент корреляции p(X, Y).
Решение: Скачать решение:xml

Задание. Двумерная дискретная величина (X, Y) задана законом распределения. Найти законы распределения составляющих X и Y, ковариацию и коэффициент корреляции.

Перейти к онлайн решению своей задачи

загрузка...