Аналитическое выравнивание ряда по прямой
Задание.1. Постройте прогноз численности наличного населения города Б на 2010-2011 гг., используя методы: скользящей средней, экспоненциального сглаживания, наименьших квадратов.
2. Постройте график фактического и расчетных показателей.
3. Рассчитайте ошибки полученных прогнозов при использовании каждого метода.
4. Сравните полученные результаты, сделайте вывод.
Решение находим с помощью калькулятора.
Линейное уравнение тренда имеет вид y = at + b
1. Находим параметры уравнения методом наименьших квадратов.
Система уравнений
Для наших данных система уравнений имеет вид
Из первого уравнения выражаем а0 и подставим во второе уравнение
Получаем a0 = -2.89, a1 = 63.27
Уравнение тренда
y = -2.89 t + 63.27
Оценим качество уравнения тренда с помощью ошибки абсолютной аппроксимации.
Поскольку ошибка больше 15%, то данное уравнение не желательно использовать в качестве тренда
Средние значения
Дисперсия
Среднеквадратическое отклонение
Коэффициент детерминации
т.е. в 39.75 % случаев влияет на изменение данных. Другими словами - точность подбора уравнения тренда - средняя
t | y | t 2 | y 2 | x ∙ y | y(t) | (y-ycp) 2 | (y-y(t))2 | (t-tp) 2 | (y-y(t)) : y |
1 | 80 | 1 | 6400 | 80 | 60.38 | 1826.44 | 384.99 | 64 | 1569.68 |
2 | 79 | 4 | 6241 | 158 | 57.49 | 1741.96 | 462.7 | 49 | 1699.33 |
3 | 75 | 9 | 5625 | 225 | 54.6 | 1424.07 | 416.16 | 36 | 1530 |
4 | 70 | 16 | 4900 | 280 | 51.71 | 1071.7 | 334.5 | 25 | 1280.26 |
5 | 65 | 25 | 4225 | 325 | 48.82 | 769.33 | 261.76 | 16 | 1051.63 |
6 | 60 | 36 | 3600 | 360 | 45.93 | 516.96 | 197.92 | 9 | 844.11 |
7 | 39 | 49 | 1521 | 273 | 43.04 | 3.02 | 16.34 | 4 | 157.64 |
8 | 35 | 64 | 1225 | 280 | 40.15 | 5.12 | 26.55 | 1 | 180.34 |
9 | 30 | 81 | 900 | 270 | 37.26 | 52.75 | 52.75 | 0 | 217.89 |
10 | 25 | 100 | 625 | 250 | 34.37 | 150.39 | 87.87 | 1 | 234.34 |
11 | 20 | 121 | 400 | 220 | 31.48 | 298.02 | 131.89 | 4 | 229.68 |
12 | 10 | 144 | 100 | 120 | 28.59 | 743.28 | 345.76 | 9 | 185.95 |
13 | 13 | 169 | 169 | 169 | 25.71 | 588.7 | 161.42 | 16 | 165.17 |
14 | 19 | 196 | 361 | 266 | 22.82 | 333.54 | 14.56 | 25 | 72.5 |
15 | 29 | 225 | 841 | 435 | 19.93 | 68.28 | 82.33 | 36 | 263.14 |
16 | 14 | 256 | 196 | 224 | 17.04 | 541.17 | 9.22 | 49 | 42.52 |
17 | 20 | 289 | 400 | 340 | 14.15 | 298.02 | 34.25 | 64 | 117.05 |
18 | 25 | 324 | 625 | 450 | 11.26 | 150.39 | 188.85 | 81 | 343.55 |
171 | 708 | 2109 | 38354 | 4725 | 708 | 11971.68 | 7212.72 | 570 | 10184.79 |
2. Анализ точности определения оценок параметров уравнения тренда.
Анализ точности определения оценок параметров уравнения тренда
Sa = 0.8384
Доверительные интервалы для зависимой переменной
По таблице Стьюдента находим Tтабл
Tтабл (n-m-1;a) = (17;0.05) = 1.74
Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и t = 10
63.27 + -2.89*10 - 1.74*20.55 ; 63.27 + -2.89*10 - 1.74*20.55
(-1.39;70.14)
Интервальный прогноз.
Определим среднеквадратическую ошибку прогнозируемого показателя.
где L - период упреждения; уn+L - точечный прогноз по модели на (n + L)-й момент времени; n - количество наблюдений во временном ряду; Sy - стандартная ошибка прогнозируемого показателя; Tтабл - табличное значение критерия Стьюдента для уровня значимости а и для числа степеней свободы, равного n — 2.
Точечный прогноз, t = 20: y(20) = -2.89*20 + 63.27 = 5.48
K1 = 49.73
5.48 - 49.73 = -44.25 ; 5.48 + 49.73 = 55.21
t = 20: (-44.25;55.21)
3. Проверка гипотез относительно коэффициентов линейного уравнения тренда.
1) t-статистика. Критерий Стьюдента.
Статистическая значимость коэффициента уравнения подтверждается.
Статистическая значимость коэффициента тренда подтверждается.
Доверительный интервал для коэффициентов уравнения тренда
Определим доверительные интервалы коэффициентов тренда, которые с надежность 95% будут следующими (tтабл=1.74):
(a - tтабл·Sa; a + tтабл·Sa)
(-4.3484;-1.4306)
(b - tтабл·Sb; b + tтабл·Sb)
(47.898;78.6389)
2) F-статистика. Критерий Фишера.
Fkp = 4.41
Поскольку F > Fkp, то коэффициент детерминации статистически значим
4. Тест Дарбина-Уотсона на наличие автокорреляции остатков для временного ряда.
y | y(x) | ei = y-y(x) | e2 | (ei - ei-1)2 |
80 | 60.38 | 19.62 | 384.99 | 0 |
79 | 57.49 | 21.51 | 462.7 | 3.57 |
75 | 54.6 | 20.4 | 416.16 | 1.23 |
70 | 51.71 | 18.29 | 334.5 | 4.45 |
65 | 48.82 | 16.18 | 261.76 | 4.45 |
60 | 45.93 | 14.07 | 197.92 | 4.45 |
39 | 43.04 | -4.04 | 16.34 | 327.99 |
35 | 40.15 | -5.15 | 26.55 | 1.23 |
30 | 37.26 | -7.26 | 52.75 | 4.45 |
25 | 34.37 | -9.37 | 87.87 | 4.45 |
20 | 31.48 | -11.48 | 131.89 | 4.45 |
10 | 28.59 | -18.59 | 345.76 | 50.56 |
13 | 25.71 | -12.71 | 161.42 | 34.69 |
19 | 22.82 | -3.82 | 14.56 | 79.02 |
29 | 19.93 | 9.07 | 82.33 | 166.14 |
14 | 17.04 | -3.04 | 9.22 | 146.66 |
20 | 14.15 | 5.85 | 34.25 | 79.02 |
25 | 11.26 | 13.74 | 188.85 | 62.24 |
0 | 0 | 0 | 7212.72 | 6909.71 |
Критические значения d1 и d2 определяются на основе специальных таблиц для требуемого уровня значимости a, числа наблюдений n и количества объясняющих переменных m.
Не обращаясь к таблицам, можно пользоваться приблизительным правилом и считать, что автокорреляция остатков отсутствует, если 1.5 < DW < 2.5. Для более надежного вывода целесообразно обращаться к табличным значениям.
d1 < DW и d2 < DW < 4 - d2.