ОБЩИЕ ПОНЯТИЯ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
Динамическое программирование – метод оптимизации, приспособленный к операциям, в которых процесс принятия решений может быть разбит на этапы.
Приведем общую постановку задачи ДП. Рассматривается управляемый процесс, например, экономический процесс распределения средств между предприятиями, использования ресурсов в течение ряда лет, замены оборудования, пополнения запасов и т. п. В результате управления система (объект управления) s переводится из начального состояния s0 в состояние . предположим, что управление можно разбить на n шагов, т.е. решение принимается последовательно на каждом шаге, а управление, переводящее систему s из начального состояния в конечное, представляет собой совокупность n пошаговых управлений.
Обозначим через хk, управление на k-м шаге . Переменные хk, удовлетворяют некоторым ограничениям и в этом смысле называются допустимыми (хk может быть числом, точкой в n-мерном пространстве, качественным признаком).
Пусть - управление, переводящее систему s из состояния s0 в состояние . Обозначим через sk состояние системы после k-го шага управления. Получаем последовательность состояний которую изобразим кружками (рис. 5).
Рис. 5
Показатель эффективности рассматриваемой управляемой операции - целевая функция - зависит от начального состояния и управления:
(26)
Сделаем несколько предположений.
1. Состояние sk системы в конце k-го шага зависит только от предшествующего состояния sk-1 и управления на k-м шаге хk, (и не зависит от предшествующих состояний и управлений). Это требование называется “отсутствием последействия”. Сформулированное положение записывается в виде уравнений
которые называются уравнениями состояний.
2. Целевая функция (26) является аддитивной от показателя эффективности каждого шага. Обозначим показатель эффективности k-го шага через тогда
(27)
Задача пошаговой оптимизации (задача ДП) формулируется так: определить такое допустимое управление х, переводящее систему s из состояния в s0 в состояние , при котором целевая функция (27) принимает наибольшее (наименьшее) значение.
Выделим особенности модели ДП:
1. Задача оптимизации интерпретируется как n-шаговый процесс управления.
2. Целевая функция равна сумме целевых функций каждого шага.
3. Выбор управления на k-м шаге зависит только от состояния системы к этому шагу, не влияет на предшествующие шаги (нет обратной связи).
4. Состояние sk после k-го шага управления зависит только от предшествующего состояния sk-1 и управления хk (отсутствие последействия).
5. На каждом шаге управление хk, зависит от конечного числа управляющих переменных, а состояние sk - от конечного числа параметров.
Дата добавления: 2021-07-22; просмотров: 293;