Прогнозирование объема товарооборота на основе тренда

Цель: спрогнозировать объем товарооборота на основе данных таблицы.

Задачи исследования:

определить параметры тренда
спрогнозировать объем товарооборота
оценить погрешность прогноза.

Решение находим с помощью калькулятора.
Линейное уравнение тренда имеет вид y = at + b
1. Находим параметры уравнения методом наименьших квадратов.
Система уравнений МНК:
a₀n + a₁∑t = ∑y
a₀∑t + a₁∑t² = ∑y•t
Для наших данных система уравнений имеет вид:
45a₀ + 1035a₁ = 4141.61
1035a₀ + 31395a₁ = 93922.83
Из первого уравнения выражаем а₀ и подставим во второе уравнение
Получаем a₀ = -0.18, a₁ = 96.08
Уравнение тренда
y = -0.18*t + 96.08
Оценим качество уравнения тренда с помощью ошибки абсолютной аппроксимации.

Поскольку ошибка больше 15%, то данное уравнение не желательно использовать в качестве тренда
Средние значения

Дисперсия

Среднеквадратическое отклонение

Коэффициент эластичности

Коэффициент эластичности меньше 1. Следовательно, с изменение периода мало влияет на изменение товарооборота.
Коэффициент детерминации

т.е. в 0.22 % случаев влияет на изменение данных. Другими словами - точность подбора уравнения тренда – низкая. Полученное уравнение тренда не желательно использовать для прогнозирования.

Расчетная таблица

2. Анализ точности определения оценок параметров уравнения тренда.

Анализ точности определения оценок параметров уравнения тренда

S _a = 0.5684
Доверительные интервалы для зависимой переменной

По таблице Стьюдента находим Tтабл
T_табл (n-m-1;α/2) = (43;0.025) = 2.009
Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и t = 25.
(96.08 -0.18*25 - 2.009*100.61 ; 96.08 -0.18*25 - 2.009*100.61)
(-8.92;192.29)
Интервальный прогноз.
Определим среднеквадратическую ошибку прогнозируемого показателя.

где L - период упреждения; у_n+L - точечный прогноз по модели на (n + L)-й момент времени; n - количество наблюдений во временном ряду; Sy - стандартная ошибка прогнозируемого показателя; T_табл - табличное значение критерия Стьюдента для уровня значимости а и для числа степеней свободы, равного n-2.

Проверим качество полученного уравнения тренда.

Fkp = 4
Поскольку F < Fkp, то коэффициент детерминации статистически не значим. Это еще раз подтверждает, что данное уравнение тренда не желательно использовать для прогноза товарооборота. Необходимо выбрать другую модель: по параболе, экспоненциальную, степенную или другую.

Проверка на наличие автокорреляции остатков.
Важной предпосылкой построения качественной регрессионной модели по МНК является независимость значений случайных отклонений от значений отклонений во всех других наблюдениях. Это гарантирует отсутствие коррелированности между любыми отклонениями и, в частности, между соседними отклонениями.
Автокорреляция (последовательная корреляция) определяется как корреляция между наблюдаемыми показателями, упорядоченными во времени (временные ряды) или в пространстве (перекрестные ряды). Автокорреляция остатков (отклонений) обычно встречается в регрессионном анализе при использовании данных временных рядов и очень редко при использовании перекрестных данных.
В экономических задачах значительно чаще встречается положительная автокорреляция, нежели отрицательная автокорреляция. В большинстве случаев положительная автокорреляция вызывается направленным постоянным воздействием некоторых неучтенных в модели факторов.
Отрицательная автокорреляция фактически означает, что за положительным отклонением следует отрицательное и наоборот. Такая ситуация может иметь место, если ту же зависимость между спросом на прохладительные напитки и доходами рассматривать по сезонным данным (зима-лето).
Среди основных причин, вызывающих автокорреляцию, можно выделить следующие:
1. Ошибки спецификации. Неучет в модели какой-либо важной объясняющей переменной либо неправильный выбор формы зависимости обычно приводят к системным отклонениям точек наблюдения от линии регрессии, что может обусловить автокорреляцию.
2. Инерция. Многие экономические показатели (инфляция, безработица, ВНП и т.д.) обладают определенной цикличностью, связанной с волнообразностью деловой активности. Поэтому изменение показателей происходит не мгновенно, а обладает определенной инертностью.
3. Эффект паутины. Во многих производственных и других сферах экономические показатели реагируют на изменение экономических условий с запаздыванием (временным лагом).
4. Сглаживание данных. Зачастую данные по некоторому продолжительному временному периоду получают усреднением данных по составляющим его интервалам. Это может привести к определенному сглаживанию колебаний, которые имелись внутри рассматриваемого периода, что в свою очередь может служить причиной автокорреляции.
Последствия автокорреляции схожи с последствиями гетероскедастичности: выводы по t- и F-статистикам, определяющие значимость коэффициента регрессии и коэффициента детерминации, возможно, будут неверными.
Обнаружение автокорреляции
1. Графический метод
Есть ряд вариантов графического определения автокорреляции. Один из них увязывает отклонения e_i с моментами их получения i. При этом по оси абсцисс откладывают либо время получения статистических данных, либо порядковый номер наблюдения, а по оси ординат – отклонения e_i (либо оценки отклонений).
Естественно предположить, что если имеется определенная связь между отклонениями, то автокорреляция имеет место. Отсутствие зависимости скорее всего будет свидетельствовать об отсутствии автокорреляции.
Автокорреляция становится более наглядной, если построить график зависимости e_i от e_i-1
Критерий Дарбина-Уотсона.
Этот критерий является наиболее известным для обнаружения автокорреляции.
При статистическом анализе уравнения регрессии на начальном этапе часто проверяют выполнимость одной предпосылки: условия статистической независимости отклонений между собой. При этом проверяется некоррелированность соседних величин e_i.

y	y(x)	e_i= y-y(x)	e²	(e_i- e_i-1)²
115	95.9	19.1	364.69	0
85	95.73	-10.73	115.07	889.48
69	95.55	-26.55	704.98	250.41
57	95.38	-38.38	1472.69	139.81
184.6	95.2	89.4	7992.38	16326.65
56	95.02	-39.02	1522.88	16492.78
85	94.85	-9.85	96.99	851.23
265	94.67	170.33	29011.44	32463.31
60.65	94.5	-33.85	1145.6	41687.11
130	94.32	35.68	1272.99	4833.83
46	94.15	-48.15	2317.96	7026.5
115	93.97	21.03	442.29	4785.29
70.96	93.79	-22.83	521.37	1924.07
39.5	93.62	-54.12	2928.74	978.7
78.9	93.44	-14.54	211.47	1566.24
60	93.27	-33.27	1106.64	350.6
100	93.09	6.91	47.74	1614.09
51	92.91	-41.91	1756.84	2383.8
157	92.74	64.26	4129.49	11273.3
123.5	92.56	30.94	957.09	1110.5
55.2	92.39	-37.19	1382.9	4640.91
95.5	92.21	3.29	10.81	1638.29
57.6	92.04	-34.44	1185.82	1423.12
64.5	91.86	-27.36	748.57	50.07
92	91.68	0.32	0.0997	765.95
100	91.51	8.49	72.11	66.84
81	91.33	-10.33	106.76	354.35
65	91.16	-26.16	684.18	250.41
110	90.98	19.02	361.72	2040.85
42.1	90.81	-48.71	2372.21	4586.57
135	90.63	44.37	1968.74	8663.1
39.6	90.45	-50.85	2586.1	9067.65
57	90.28	-33.28	1107.42	308.91
80	90.1	-10.1	102.05	537.12
61	89.93	-28.93	836.73	354.35
69.6	89.75	-20.15	406.05	77.01
250	89.57	160.43	25736.24	32607.61
64.5	89.4	-24.9	619.96	34345.07
125	89.22	35.78	1279.98	3681.55
152.3	89.05	63.25	4000.88	754.92
110	88.87	21.13	446.41	1774.45
40.6	88.7	-48.1	2313.21	4791.99
95	88.52	6.48	41.99	2978.52
98	88.34	9.66	93.23	10.09
52	88.17	-36.17	1308.16	2099.86
			107891.72	264817.26

Для анализа коррелированности отклонений используют статистику Дарбина-Уотсона:

Критические значения d₁ и d₂ определяются на основе специальных таблиц для требуемого уровня значимости α, числа наблюдений n = 45 и количества объясняющих переменных m=1.
Автокорреляция отсутствует, если выполняется следующее условие:
d₁ < DW и d₂ < DW < 4 - d₂.
Не обращаясь к таблицам, можно пользоваться приблизительным правилом и считать, что автокорреляция остатков отсутствует, если 1.5 < DW < 2.5. Поскольку 1.5 < 2.45 < 2.5, то автокорреляция остатков отсутствует.
Для более надежного вывода целесообразно обращаться к табличным значениям.
По таблице Дарбина-Уотсона для n=45 и k=1 (уровень значимости 5%) находим: d₁ = 1.48; d₂ = 1.57.
Поскольку 1.48 < 2.45 и 1.57 < 2.45 < 4 - 1.57, то автокорреляция остатков присутствует.
Проверка наличия гетероскедастичности.
1) Методом графического анализа остатков.
В этом случае по оси абсцисс откладываются значения объясняющей переменной X, а по оси ординат либо отклонения e_i, либо их квадраты e²_i.
Если имеется определенная связь между отклонениями, то гетероскедастичность имеет место. Отсутствие зависимости скорее всего будет свидетельствовать об отсутствии гетероскедастичности.
2) При помощи теста ранговой корреляции Спирмена.
Коэффициент ранговой корреляции Спирмена.
Присвоим ранги признаку e_i и фактору t. Найдем сумму разности квадратов d².
По формуле вычислим коэффициент ранговой корреляции Спирмена.

X	e_i	ранг X, d_x	ранг e_i, d_y	(d_x- d_y)²
1	-19.1	1	12	121
2	10.73	2	23	441
3	26.55	3	29	676
4	38.38	4	38	1156
5	-89.4	5	3	4
6	39.02	6	39	1089
7	9.85	7	20	169
8	-170.33	8	1	49
9	33.85	9	34	625
10	-35.68	10	8	4
11	48.15	11	42	961
12	-21.03	12	11	1
13	22.83	13	26	169
14	54.12	14	45	961
15	14.54	15	24	81
16	33.27	16	32	256
17	-6.91	17	16	1
18	41.91	18	40	484
19	-64.26	19	4	225
20	-30.94	20	9	121
21	37.19	21	37	256
22	-3.29	22	18	16
23	34.44	23	35	144
24	27.36	24	30	36
25	-0.32	25	19	36
26	-8.49	26	15	121
27	10.33	27	22	25
28	26.16	28	28	0
29	-19.02	29	13	256
30	48.71	30	43	169
31	-44.37	31	6	625
32	50.85	32	44	144
33	33.28	33	33	0
34	10.1	34	21	169
35	28.93	35	31	16
36	20.15	36	25	121
37	-160.43	37	2	1225
38	24.9	38	27	121
39	-35.78	39	7	1024
40	-63.25	40	5	1225
41	-21.13	41	10	961
42	48.1	42	41	1
43	-6.48	43	17	676
44	-9.66	44	14	900
45	36.17	45	36	81
				15942

Связь между признаком Y фактором X слабая и обратная
Оценка коэффициента ранговой корреляции Спирмена.
Значимость коэффициента ранговой корреляции Спирмена

По таблице Стьюдента находим t_табл:
t_табл (n-m-1;α/2) = (43;0.05/2) = 2.009
Поскольку Tнабл < tтабл , то принимаем гипотезу о равенстве 0 коэффициента ранговой корреляции. Другими словами, коэффициент ранговой корреляции статистически - не значим.

Поскольку 2.009 > 0.33, то гипотеза об отсутствии гетероскедастичности принимается.

Перейти к онлайн решению своей задачи

X	f	Группы	Количество
2	3	5-10	5
3	6	10-15	8
4	7	15-20	14
5	4	...	...

Прогнозирование объема товарооборота на основе тренда

Правила ввода данных

Поиск

Процесс

Сообщение