Организация процесса оптимизации в динамическом программировании


 

Выше было отмечено, что при выборе шагового управления необходимо учитывать следующие требования:

1. возможные исходы предыдущего шага ;

2. влияние управления на все оставшиеся до конца процесса шаги.

В задачах динамического программирования первое требование учитывают, делая на каждом шаге условные предположения о возможных вариантах окончания предыдущего шага и проводя для каждого из вариантов условную оптимизацию. Выполнение второго требования обеспечивается тем, что в этих задачах условная оптимизация проводится от конца процесса к началу.

 

Условная оптимизация.На первом этапе решения задачи, называемом условной оптимизацией, определяются функция Беллмана и оптимальные управления для всех возможных состояний на каждом шаге, начиная с последнего в соответствии с алгоритмом обратной прогонки. На последнем, n-м шаге оптимальное управление - определяется функцией Беллмана: , в соответствии с которой максимум выбирается из всех возможных значений , причем .
Дальнейшие вычисления производятся согласно рекуррентному соотношению, связывающему функцию Беллмана на каждом шаге с этой же функцией, но вычисленной на предыдущем шаге. В общем виде это уравнение имеет вид

, .

Этот максимум (или минимум) определяется по всем, возможным для и , значениям переменной управления .

 

Безусловная оптимизация.После того, как функция Беллмана и соответствующие оптимальные управления найдены для всех шагов с n-го по первый, осуществляется второй этап решения задачи, называемый безусловной оптимизацией. Пользуясь тем, что на первом шаге ( ) состояние системы известно - это ее начальное состояние , можно найти оптимальный результат за все шагов и оптимальное управление на первом шаге , которое этот результат доставляет. После применения этого управления система перейдет в другое состояние , зная которое, можно, пользуясь результатами условной оптимизации, найти оптимальное управление на втором шаге , и так далее до последнего -го шага. Вычислительную схему динамического программирования можно строить на сетевых моделях (как в случае с черепашкой), а также по алгоритмам прямой прогонки (от начала) и обратной прогонки (от конца к началу).


Список литературы

 

1. Калиткин Н.Н. Численные методы. – М.: “Наука”, 1991.

2. Коршунов Ю.М. Математические основы кибернетики. – М.: Энергоатом издат, 1987.

3. Мину М. Математическое программирование. Теория и алгоритмы: Пер. с фр. И предисловие Штерна. – М.: Наука. Гл. ред. физ-мат.лит., 1990.– 488 с.

4. Моисеев Н.Н., Иванилов Ю.П., Столярова Е.М., Методы оптимизации. М.: – Наука, 1978.

5. Работы выпускные квалификационные, проекты и работы курсовые. Структура и правила оформления. СТО ТПУ 2.5.01-2006

6. Реклейтис Г., Рейвиндран А., Рэгсдел К. Оптимизация в технике: В 2-х кн. Кн.1. Пер. с англ.- М.: Мир, 1986.

7. Сухарев А.Г., Тимохов А.В., Федоров В.В. Курс методов оптимизации. – М.: Наука, 1986.



Дата добавления: 2020-03-17; просмотров: 623;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.008 сек.