Общая постановка задачи динамического программирования
Если модели линейного программирования можно использовать в экономике для принятия крупномасштабных плановых решений в сложных ситуациях, то модели ДП применяются при решении задач значительно меньшего масштаба, например, при разработке правил управления запасами, устанавливающими момент пополнения запасов и размер пополняющего заказа; при разработке принципов календарного планирования производства и выравнивания занятости в условиях колеблющегося спроса на продукцию; при распределении дефицитных капитальных вложений между возможными новыми направлениями их использования; при составлении календарных планов текущего и капитального ремонта сложного оборудования и его замены; при разработке долгосрочных правил замены выбывающих из эксплуатации основных фондов и т. п.
В реально функционирующих больших экономических системах еженедельно требуется принимать микроэкономические решения. Модели ДП ценны тем, что позволяют на основе стандартного подхода с использованием при минимальном вмешательстве человека принимать такие решения. И если каждое взятое в отдельности такое решение малосущественно, то в совокупности эти решения могут оказать большое влияние на прибыль.
Приведем общую постановку задачи ДП. Рассматривается управляемый процесс, например, экономический процесс распределения средств между предприятиями, использования ресурсов в течение ряда лет, замены оборудования, пополнения запасов и т. п. В результате управления система (объект управления) 5 переводится из начального состояния м0 в состояние 5 . Предположим, что управление можно разбить на п шагов, т.е.
решение принимается последовательно на каждом шаге, а управление, переводящее систему 5 из начального состояния в конечное, представляет собой совокупность п пошаговых управлений.Обозначим через X,\ управление на к-м шаге (Л=1, 2, ..., л). Переменные Хь удовлетворяют некоторым ограничениям и в этом смысле называются допустимыми (Хц может быть числом, точкой в л-мерном пространстве, качественным признаком).
Пусть X (Х\, Х2, ..., Х„) — управление, переводящее систему 5 ИЗ СОСТОЯНИЯ М0 в состоянием . Обозначим через м* состояние системы после £-го шага управления. Получаем последовательность СОСТОЯНИЙ М0> Мь ..., М*-!, %..., М„-Ь Мл=М, которую изобразим кружками (рис. 12.1).
Рис. 12.1 |
Показатель эффективности рассматриваемой управляемой операции — целевая функция — зависит от начального состояния и управления:
0,х). (12.1)
Сделаем несколько предположений.
1. Состояние м* системы в конце к-го шага зависит только от предшествующего состояния м*-1 и управления на к-м шаге Х^ (и не зависит от предшествующих состояний и управлений) Это требование называется “отсутствием последействия”. Сформулированное положение записывается в виде уравнений
= Ф*(^-ь Хк), Л = 1,2, п, (12.2)
которые называются уравнениями состояний.
2. Целевая функция (12.1) является аддитивной от показателя эффективности каждого шага [3]. Обозначим показатель эффективности &-го шага через
= Л(5*-ь Хк), к=1, 2, ..., п, (12.3)
тогда ,
п
^ . (12.4)
к=1
Задача пошаговой оптимизации (задача ДП) формулируется так: определить такое допустимое управление X, переводящее систему 5[29] из состояния 50 в состояние 1, при котором целевая функция (12.4) принимает наибольшее (наименьшее) значение.
Выделим особенности модели ДП:
1. Задача оптимизации интерпретируется как п-шаговый процесс управления.
2. Целевая функция равна сумме целевых функций каждого шага
3. Выбор управления на к-м шаге зависит только от состояния системы к этому шагу, не влияет на предшествующие шаги {нет обратной связи).
4. Состояние 5* после к-го шага управления зависит только от предшествующего состояния 5^-1 и управления Хк {отсутствие последействия).
5. На каждом шаге управление Хк зависит от конечного числа управляющих переменных, а состояние .5* — от конечного числа параметров (смысл замечания 5 станет ясным из рассмотренных ниже примеров).
Следует вспомнить, что существуют различные способы решения подобных задач, применяемые в зависимости от вида функций, ограничений, размерности и т. п. Рассмотрим вычислительную схему ДП, которая окажется безразличной к способам задания функций и ограничений. Вычислительная схема связана с принципом оптимальности и использует рекуррентные соотношения.
12.1.
Еще по теме Общая постановка задачи динамического программирования:
- 2.1.2. ЗАДАЧИ ЭКОНОМИЧЕСКОГО ФАКТОРНОГО АНАЛИЗА
- Общая характеристика математических методов анализа
- ПРЕДИСЛОВИЕ
- Общая постановка задачи динамического программирования
- Задача о замене оборудования
- Ответы к примерам для самостоятельного анализа
- Анализ действия 1 кейса.
- НОВЫЙ ВЗГЛЯД НА УПРАВЛЕНИЕ ИНВЕСТИЦИЯМИ
- 2.1. Участие сбытовиков в клиентском анализе
- Моделирование в экономических системах
- 3.2. Характеристика методов управления организацией
- 7.2. Моделирование ситуаций
- 16.3. Расчеты эффективного менеджмента
- 6.4. Модели оптимального планирования
- Ответы к примерам для самостоятельного анализа
- Моделирование
- Проектирование организационных систем для бизнес-процессов
- ПРИЛОЖЕНИЕ 2. ЭЛЕМЕНТЫ ТЕОРИИ ГРАФОВ