Метод сопряженных градиентов

Назначение сервиса. Онлайн-калькулятор предназначен для нахождения минимума функции методом сопряженных градиентов. Метод Флетчера-Ривза и метод сопряженных градиентов – это разные методы, хотя второй и является разновидностью первого. Флетчер и Ривз расширили предшествующий метод на случай произвольных функций. В применении к квадратичным функциям он становится равносильным методу сопряженных градиентов. Также реализован вариант Миля-Кентрелла.

Решение оформляется в формате Word.

Правила ввода функций:

Все переменные выражаются через x1,x2

Например, x₁²+x₁x₂, записываем как x1^2+x1*x2

Метод сопряженных градиентов формирует направления поиска, в большей мере соответствующие геометрии минимизируемой функции.
Определение. Два n-мерных вектора х и у называют сопряженными по отношению к матрице A (или A-сопряженными), если скалярное произведение (x, Aу) = 0. Здесь A - симметрическая положительно определенная матрица размером n х n.

Схема алгоритма метода сопряженных градиентов

Положить k=0.
Ш. 1 Пусть x⁰ - начальная точка; g₀=∇f(x⁰)=Ax⁰+b,
d₀=-g₀; k=0.
Ш. 2 Определить x^k⁺¹=x^k+λ_kd_k, где

.
Затем d_k+1=-g_k+1+β_kd_k,

,
β_k находится из условия d_k₊₁Ad_k=0 (сопряжены относительно матрицы A).
Ш. 3 Положить k=k+1 → Ш. 2.
Критерий останова одномерного поиска вдоль каждого из направлений d_k записывается в виде: ∇f(x^k+1)d_k=0.
Значения β_i(i=1,k-1) выбираются таким образом, чтобы направление d_k было A-сопряжено со всеми построенными ранее направлениями.

Метод Флетчера-Ривса

Стратегия метода Флетчера-Ривса состоит в построении последовательности точек {x^k}, k=0, 1, 2, ... таких, что f(x^k⁺¹) < f(x^k), k=0, 1, 2, ...
Точки последовательности {x^k} вычисляются по правилу:
x^k⁺¹=x^k-t_kd_k, k = 0, 1, 2,…
d_k = ▽f(x^k) + b_k_-1▽f(x^k^-1)
метод Флетчера-Ривса

Величина шага выбирается из условия минимума функции f(х) по t в направлении движения, т. е. в результате решения задачи одномерной минимизации:
f(x^k-t_kd_k) → min (t_k>0)
В случае квадратичной функции f(x)= (х, Нх) + (b, х) + а направления d_k, d_k_-1 будут H-сопряженными, т.е. (d_k, Hd_k_-1)=0
При этом в точках последовательности {x^k} градиенты функции f(x) взаимно перпендикулярны, т.е. (▽f(x^k⁺¹),▽f(x^k))=0, k =0, 1, 2…
При минимизации неквадратичных функций метод Флетчера-Ривса не является конечным. Для неквадратичных функций используется следующая модификация метод Флетчера-Ривса (метод Полака-Рибьера), когда величина b_k_-1 вычисляется следующим образом:

Здесь I- множество индексов: I = {0, n, 2n, 3n, ...}, т. е. метод Полака-Рибьера предусматривает использование итерации наискорейшего градиентного спуска через каждые n шагов с заменой x⁰ на xⁿ⁺¹.
Построение последовательности{x^k} заканчивается в точке, для которой |▽f(x^k)|<ε.
Геометрический смысл метода сопряженных градиентов состоит в следующем. Из заданной начальной точки x⁰осуществляется спуск в направлении d₀ = ▽f(x⁰).В точке x¹определяется вектор-градиент ▽f(x¹).Поскольку x¹является точкой минимума функции в направлении d₀, то▽f(x¹) ортогонален вектору d₀. Затем отыскивается вектор d₁, H-сопряженный к d₀. Далее отыскивается минимум функции вдоль направления d₁и т. д.
Метод сопряженных градиентов

Алгоритм метода Флетчера-Ривса

Начальный этап.
Задать x⁰, ε > 0.
Найти градиент функции в произвольной точке

k=0.
Основной этап
Шаг 1. Вычислить ▽f(x^k)
Шаг 2. Проверить выполнение критерия останова |▽f(x^k)|< ε
а) если критерий выполнен, расчет окончен,x^*=x^k
б) если критерий не выполнен, то перейти к шагу 3, если k=0, иначе к шагу 4.
Шаг 3. Определить d₀= ▽f(x⁰)
Шаг 4. Определить

или в случае неквадратичной функции

Шаг 5. Определить d_k = ▽f(x^k) + b_k_-1▽f(x^k^-1)
Шаг 6. Вычислить величину шага t_k из условия f(x^k - t_kd_k) → min (t_k>0)
Шаг 7. Вычислить x^k+1=x^k-t_kd_k
Шаг 8. Положить k= k +1 и перейти к шагу 1.

Сходимость метода

Теорема 1. Если квадратичная функция f(x) = (х, Нх) + (b, х) + а с неотрицательно определенной матрицей Н достигает своего минимального значения на Rⁿ, то метод Флетчера-Ривса обеспечивает отыскание точки минимума не более чем за n шагов.
Теорема 2. Пусть функция f(x) дифференцируема и ограничена снизу на R^m, а ее градиент удовлетворяет условию Липшица

. Тогда при произвольной начальной точке

для метода Полака-Рибьера имеем

Теорема 2 гарантирует сходимость последовательности {x^k} к стационарной точке x^*, где ▽f(x^*)=0. Поэтому найденная точка x^* нуждается в дополнительном исследовании для ее классификации. Метод Полака-Рибьера гарантирует сходимость последовательности {x^k} к точке минимума только для сильно выпуклых функций.
Оценка скорости сходимости получена только для сильно выпуклых функций, в этом случае последовательность {x^k} сходится к точке минимума функции f(x) со скоростью: |x^k+n– x*| ≤ C|x^k– x*|, k = {0, n, 2, …}

Пример. Найти минимум функции методом сопряженных градиентов: f(X) = 2x₁²+2x₂²+2x₁x₂+20x₁+10x₂+10.
Решение. В качестве направления поиска выберем вектор градиент в текущей точке:

▽ f(X) =

4*x₁+2*x₂+20

2*x₁+4*x₂+10

Итерация №0.

▽ f(X₀) =

Проверим критерий остановки: |▽f(X₀)| < ε

Вычислим значение функции в начальной точке f(X₀) = 10.
Сделаем шаг вдоль направления антиградиента.

X₁ = X₀ - t₀▽ f(X₀) =

- t₀

-20.0*t₀

-10.0*t₀

f(X₁) = 2*(-20.0*t₀)²+2*(-10.0*t₀)²+2*(-20.0*t₀)*(-10.0*t₀)+20*(-20.0*t₀)+10*(-10.0*t₀)+10 → min
Найдем такой шаг, чтобы целевая функция достигала минимума вдоль этого направления. Из необходимого условия существования экстремума функции (f '(x₁)=0):
2800*t₁-500 = 0
Получим шаг: t₀ = 0.1786
Выполнение этого шага приведет в точку:

X₀ =

- 0.1786

-3.5714

-1.7857

Итерация №1.

▽ f(X₁) =

2.143

-4.286

Проверим критерий остановки: |▽f(X₁)| < ε

Вычислим значение функции в новой точке f(X₁) = -34.643.
X² = X¹ - t₁d₁
d₁ = ▽f(X¹) + b₀▽f(X⁰)

d₁ =

2.143

-4.286

+ 0.0459

3.061

-3.827

Сделаем шаг вдоль направления антиградиента.

X₂ = X₁ - t₁▽ f(X₁) =

-3.5714

-1.7857

- t₁

3.061

-3.827

-3.0612*t₁-3.5714

3.8265*t₁-1.7857

f(X₂) = 2*(-3.0612*t₁-3.5714)²+2*(3.8265*t₁-1.7857)²+2*(-3.0612*t₁-3.5714)*(3.8265*t₁-1.7857)+20*(-3.0612*t₁-3.5714)+10*(3.8265*t₁-1.7857)+10 → min
Найдем такой шаг, чтобы целевая функция достигала минимума вдоль этого направления. Из необходимого условия существования экстремума функции (f '(x₂)=0):
49.19825*t₂-22.95918 = 0
Получим шаг: t₀ = 0.4667
Выполнение этого шага приведет в точку:

X₀ =

-3.5714

-1.7857

- 0.4667

3.061

-3.827

-5

Итерация №2.

▽ f(X₂) =

Проверим критерий остановки: |▽f(X₂)| < ε

Вычислим значение функции в новой точке f(X₂) = -40.

Анализ решения. Найдем матрицу Гессе функции f(X) = 2x₁²+2x₂²+2x₁x₂+20x₁+10x₂+10.

H =

4	2
2	4

Так как матрица Гессе является положительно определенной, то функция f(X) строго выпукла и, следовательно, в стационарной точке достигает глобальный минимум.