ОБЩИЕ ПОНЯТИЯ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ


Динамическое программирование – метод оптимизации, приспособленный к операциям, в которых процесс принятия решений может быть разбит на этапы.

Приведем общую постановку задачи ДП. Рассматривается управляемый процесс, например, экономический процесс распределения средств между предприятиями, использования ресурсов в течение ряда лет, замены оборудования, пополнения запасов и т. п. В результате управления система (объект управления) s переводится из начального состояния s0 в состояние . предположим, что управление можно разбить на n шагов, т.е. решение принимается последовательно на каждом шаге, а управление, переводящее систему s из начального состояния в конечное, представляет собой совокупность n пошаговых управлений.

Обозначим через хk, управление на k-м шаге . Переменные хk, удовлетворяют некоторым ограничениям и в этом смысле называются допустимыми (хk может быть числом, точкой в n-мерном пространстве, качественным признаком).

Пусть - управление, переводящее систему s из состояния s0 в состояние . Обозначим через sk состояние системы после k-го шага управления. Получаем последовательность состояний которую изобразим кружками (рис. 5).

 

Рис. 5

Показатель эффективности рассматриваемой управляемой операции - целевая функция - зависит от начального состояния и управления:

(26)

Сделаем несколько предположений.

1. Состояние sk системы в конце k-го шага зависит только от предшествующего состояния sk-1 и управления на k-м шаге хk, (и не зависит от предшествующих состояний и управлений). Это требование называется “отсутствием последействия”. Сформулированное положение записывается в виде уравнений

которые называются уравнениями состояний.

2. Целевая функция (26) является аддитивной от показателя эффективности каждого шага. Обозначим показатель эффективности k-го шага через тогда

(27)

Задача пошаговой оптимизации (задача ДП) формулируется так: определить такое допустимое управление х, переводящее систему s из состояния в s0 в состояние , при котором целевая функция (27) принимает наибольшее (наименьшее) значение.

Выделим особенности модели ДП:

1. Задача оптимизации интерпретируется как n-шаговый процесс управления.

2. Целевая функция равна сумме целевых функций каждого шага.

3. Выбор управления на k-м шаге зависит только от состояния системы к этому шагу, не влияет на предшествующие шаги (нет обратной связи).

4. Состояние sk после k-го шага управления зависит только от предшествующего состояния sk-1 и управления хk (отсутствие последействия).

5. На каждом шаге управление хk, зависит от конечного числа управляющих переменных, а состояние sk - от конечного числа параметров.



Дата добавления: 2021-07-22; просмотров: 293;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.009 сек.