Критерий Стьюдента

t-статистика предназначена для определения статистической значимости каждого коэффициента уравнения.

Рассмотрим пример решения стандартной задачи (например, этой). Целью расчетов является ответ на вопрос, являются ли полученные коэффициенты регрессии a и b статистически значимыми?
Будем исследовать зависимость размера дивидендов Y акций группы компаний от доходности акций X.

Линейное уравнение регрессии имеет вид y = bx + a + ε
Система нормальных уравнений.
a•n + b∑x = ∑y
a∑x + b∑x2 = ∑y•x
Для наших данных система уравнений имеет вид
50a + 343.53 b = 1679.25
343.53 a + 2510.58 b = 11912.45
Из первого уравнения выражаем а и подставим во второе уравнение:
Получаем эмпирические коэффициенты регрессии: b = 2.4948, a = 16.4443
Уравнение регрессии (эмпирическое уравнение регрессии):
y = 2.4948 x + 16.4443
Для расчета параметров регрессии построим расчетную таблицу (табл. 1)

x y x2 y2 x • y
8.19 42.08 67.14 1770.46 344.77
7.65 36.51 58.53 1333.01 279.32
4.56 23.76 20.76 564.4 108.24
5.92 27.23 35.02 741.68 161.17
8.15 25.44 66.45 647.33 207.41
6.51 35.44 42.37 1256.17 230.71
6.23 34.18 38.82 1168.53 212.99
6.42 27.33 41.27 747.19 175.6
6.9 32.69 47.55 1068.57 225.42
7.45 34.74 55.55 1207.12 258.96
7.58 32.47 57.38 1054.09 245.94
6.6 30.18 43.61 910.77 199.29
3.28 28.01 10.77 784.56 91.91
7.42 39.48 54.99 1558.45 292.74
8.91 47.81 79.32 2285.38 425.77
8.42 45.7 70.87 2088.63 384.74
6.11 29.39 37.39 864.01 179.73
9.48 38.19 89.96 1458.76 362.25
8.97 30.78 80.43 947.36 276.03
5.79 37.86 33.48 1433.68 219.09
4.77 24.29 22.77 590.16 115.92
7.79 37.28 60.64 1389.55 290.29
6.99 27.78 48.89 771.49 194.21
4.43 31.61 19.6 999.26 139.95
6.04 31.09 36.5 966.62 187.84
8.84 40.95 78.14 1677.22 362.02
8.06 41.38 64.93 1712.12 333.41
8.57 45.16 73.42 2039.53 386.98
4.78 21.62 22.83 467.5 103.3
7.01 39.76 49.12 1581.1 278.67
3.25 24.2 10.57 585.61 78.67
6.41 32.4 41.05 1050.04 207.6
6.91 29.79 47.8 887.69 206
5.84 35.63 34.14 1269.63 208.2
6.38 32.35 40.75 1046.49 206.49
8.37 37.57 70 1411.56 314.34
8.02 34.01 64.33 1156.46 272.74
11.7 43.06 136.92 1853.84 503.82
5.92 38.63 35.05 1492.23 228.71
7.69 34.49 59.18 1189.37 265.3
9.32 35.13 86.86 1233.89 327.37
8.63 37.22 74.46 1385.56 321.21
6.14 27.77 37.68 771.31 170.49
8.22 39.84 67.55 1587.14 327.43
6.2 34.03 38.5 1158.06 211.15
2.35 22.38 5.55 501.04 52.71
5.34 30.51 28.48 930.89 162.82
6.36 33.92 40.47 1150.52 215.78
5.16 27.16 26.63 737.7 140.16
7.49 28.94 56.12 837.46 216.78
343.53 1679.25 2510.58 58321.22 11912.45

Параметры уравнения регрессии.
Выборочные средние.


Выборочные дисперсии:


Среднеквадратическое отклонение

Для оценки качества параметров регрессии построим расчетную таблицу (табл. 2)
x y y(x) (yi-ycp)2 (y-y(x))2
8.19 42.08 36.89 72.11 26.94
7.65 36.51 35.53 8.56 0.96
4.56 23.76 27.81 96.58 16.43
5.92 27.23 31.21 40.34 15.8
8.15 25.44 36.78 66.29 128.57
6.51 35.44 32.68 3.45 7.61
6.23 34.18 31.99 0.36 4.82
6.42 27.33 32.47 39.06 26.38
6.9 32.69 33.65 0.8 0.92
7.45 34.74 35.04 1.34 0.0871
7.58 32.47 35.34 1.25 8.27
6.6 30.18 32.92 11.6 7.51
3.28 28.01 24.63 31.08 11.42
7.42 39.48 34.94 34.72 20.55
8.91 47.81 38.66 202.23 83.57
8.42 45.7 37.45 146.81 68.14
6.11 29.39 31.7 17.56 5.31
9.48 38.19 40.11 21.24 3.66
8.97 30.78 38.82 7.87 64.62
5.79 37.86 30.88 18.31 48.78
4.77 24.29 28.35 86.34 16.45
7.79 37.28 35.87 13.63 1.97
6.99 27.78 33.89 33.75 37.36
4.43 31.61 27.49 3.9 16.99
6.04 31.09 31.52 6.22 0.18
8.84 40.95 38.5 54.3 6.03
8.06 41.38 36.55 60.73 23.34
8.57 45.16 37.82 134.01 53.87
4.78 21.62 28.36 143.12 45.45
7.01 39.76 33.93 38.17 34.04
3.25 24.2 24.55 88.09 0.13
6.41 32.4 32.43 1.39 0.000554
6.91 29.79 33.69 14.37 15.21
5.84 35.63 31.02 4.19 21.25
6.38 32.35 32.37 1.53 0.000389
8.37 37.57 37.32 15.89 0.0643
8.02 34.01 36.45 0.18 5.99
11.7 43.06 45.64 89.71 6.66
5.92 38.63 31.22 25.45 54.97
7.69 34.49 35.64 0.81 1.32
9.32 35.13 39.7 2.38 20.87
8.63 37.22 37.97 13.24 0.56
6.14 27.77 31.76 33.78 15.9
8.22 39.84 36.95 39.11 8.35
6.2 34.03 31.92 0.2 4.44
2.35 22.38 22.32 125.46 0.00418
5.34 30.51 29.76 9.45 0.57
6.36 33.92 32.32 0.11 2.57
5.16 27.16 29.32 41.27 4.66
7.49 28.94 35.13 21.59 38.37
343.53 1679.25 1679.25 1923.93 987.9

2. Оценка параметров уравнения регрессии.
2.3. Анализ точности определения оценок коэффициентов регрессии.
Несмещенной оценкой дисперсии возмущений является величина:

S2y = 20.58 - необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).

Sy = 4.54 - стандартная ошибка оценки (стандартная ошибка регрессии).
Sa - стандартное отклонение случайной величины a.

Sb - стандартное отклонение случайной величины b.

Перейти к онлайн решению своей задачи

Оценим значимость показателей уравнения регрессии, которое наиболее адекватно описывает зависимость между показателями с вероятностью 95%.
С помощью МНК мы получили лишь оценки параметров уравнения регрессии, которые характерны для конкретного статистического наблюдения (конкретного набора значений x и y).
Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается гипотеза Н0 о случайной природе показателей, т.е. о незначимом их отличии от нуля.
Чтобы проверить, значимы ли параметры, т.е. значимо ли они отличаются от нуля для генеральной совокупности используют статистические методы проверки гипотез.
В качестве основной (нулевой) гипотезы выдвигают гипотезу о незначимом отличии от нуля параметра или статистической характеристики в генеральной совокупности. Наряду с основной (проверяемой) гипотезой выдвигают альтернативную (конкурирующую) гипотезу о неравенстве нулю параметра или статистической характеристики в генеральной совокупности.
Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости α=0.05.
В случае, если основная гипотеза окажется неверной, мы принимаем альтернативную. Для проверки этой гипотезы используется t-критерий Стьюдента.
Найденное по данным наблюдений значение t-критерия (его еще называют наблюдаемым или фактическим) сравнивается с табличным (критическим) значением, определяемым по таблицам распределения Стьюдента (которые обычно приводятся в конце учебников и практикумов по статистике или эконометрике).
Табличное значение определяется в зависимости от уровня значимости (α) и числа степеней свободы, которое в случае линейной парной регрессии равно (n-2), n-число наблюдений. Таким образом, Табличное значение t-статистика зависит и от доверительной вероятности, и от числа факторов и от длины исходного ряда.
Если фактическое значение t-критерия больше табличного (по модулю), то основную гипотезу отвергают и считают, что с вероятностью (1-α) параметр или статистическая характеристика в генеральной совокупности значимо отличается от нуля.
Если фактическое значение t-критерия меньше табличного (по модулю), то нет оснований отвергать основную гипотезу, т.е. параметр или статистическая характеристика в генеральной совокупности незначимо отличается от нуля при уровне значимости α.
tкрит (n-m-1;α/2) = (48;0.025) = 2.009

Поскольку 6.74 > 2.009, то статистическая значимость коэффициента регрессии b подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).

Поскольку 6.27 > 2.009, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).

Вывод: Полученные коэффициенты регрессии a и b - статистически значимы, и поэтому их можно использовать в уравнении линейной регрессии для дальнейших анализов и прогнозов.

Доверительный интервал для коэффициентов уравнения регрессии


Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими:
(b - tкрит Sb; b + tкрит Sb)
(2.49 - 2.009 • 0.37; 2.49 + 2.009 • 0.37)
(1.75;3.24)
С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.
(a - tкрит Sa; a + tкрит Sa)
(16.44 - 2.009 • 2.62; 16.44 + 2.009 • 2.62)
(11.18;21.71)
С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.

см. также Как оценить уравнение регрессии в целом?

загрузка...