Пример нахождения доверительных интервалов коэффициентов регрессии

В таблице 5 представлена динамика российского нефтяного экспорта и цены нефти марки 11га1з в 1997-2003 гг.

Задание:

1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.

2. Постройте уравнение зависимости экспорта нефти от цены на нефть.

3. Рассчитайте среднюю ошибку аппроксимации и коэффициент детерминации. Оценить статистическую значимость параметров регрессии и уравнения в целом.

4. Оцените полученные результаты, выводы оформите в аналитической записке.

Таблица 5

Годы

Цена нефти марки Urals (Россия), долл/барр.

Экспорт нефти и нефтепродуктов, млн.т.

1997

18,33

60,6

1998

11,83

53,8

1999

17,30

56,9

2000

26,63

61,9

2001

22,97

70,8

2002

23,73

75,0

2003

27,04

76,4

Решение:

Уравнение имеет вид y = ax + b
1. Параметры уравнения регрессии.
Средние значения


 Дисперсия


Среднеквадратическое отклонение
Среднеквадратическое отклонение

Коэффициент корреляции
Коэффициент корреляции
Связь между признаком Y фактором X сильная и прямая
Уравнение регрессии
Уравнение регрессии
Коэффициент детерминации
R 2= 0.92 2 = 0.84
т.е. в 84.2593 % случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - высокая

x y x 2 y 2 x ∙ y y(x) (y-y cp) 2 (y-y(x))2 (x-x p) 2
119 298.12 14161 88875.53 35476.28 219.63 232120.8 6160.56 24362.01
203 481.03 41209 231389.86 97649.09 521.16 89328.76 1610.26 5196.01
281 539.12 78961 290650.37 151492.72 801.15 57979.42 68658.51 35.01
305 653.57 93025 427153.74 199338.85 887.3 15961.59 54628.94 895.01
381 987.66 145161 975472.28 376298.46 1160.11 43160.41 29738.57 11218.34
363 1252.85 131769 1569633.12 454784.55 1095.5 223673.03 24760.35 7729.34
389 1276.88 151321 1630422.53 496706.32 1188.83 246980.01 7753.57 12977.01
387 1396.70 149769 1950770.89 540522.9 1181.65 380430.93 46248.04 12525.34
315 952.03 99225 906361.12 299889.45 923.19 29625.58 831.49 1593.34
217 619.96 47089 384350.4 134531.32 571.41 25583.74 2356.85 3373.67
149 384.40 22201 147763.36 57275.6 327.32 156427.5 3258.23 15897.01
192 516.59 36864 266865.23 99185.28 481.67 69336.98 1219.24 6902.84
3301 9358.91 1010755 8869708.45 2943150.82 9358.91 1570608.75 247224.62 102704.92


2. Оценка параметров уравнения регрессии
Значимость коэффициента корреляции

По таблице Стьюдента находим Tтабл
Tтабл (n-m-1;a) = (10;0.05) = 1.812
Поскольку Tнабл > Tтабл , то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициента корреляции статистически - значим.

Анализ точности определения оценок коэффициентов регрессии





S a = 0.4906
Доверительные интервалы для зависимой переменной

Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и X = 1
(-587.75;179.86)
Проверка гипотез относительно коэффициентов линейного уравнения регрессии
1) t-статистика


Статистическая значимость коэффициента регрессии a подтверждается

Статистическая значимость коэффициента регрессии b не подтверждается
Доверительный интервал для коэффициентов уравнения регрессии
Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95%  будут следующими:
(a - t a S a; a + t aSa)
(2.7006;4.4786)
(b - t b S b; b + tbSb)
(-465.5454;50.4796)
2) F-статистики


Fkp = 4.96
Поскольку F > Fkp, то коэффициент детерминации статистически значим.

Перейти к онлайн решению своей задачи

загрузка...