Оптимизация с применением динамического программирования (ДП) презентация

Ноябрь 14, 2021

Главная
Информатика
Оптимизация с применением динамического программирования (ДП)

Содержание

2. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Для решения задач оптимизации многостадийных процессов успешно применяется метод динамического программирования - ДП, который
3. Блочная схема многостадийного процесса 1 2 … i N …
4. Условные обозначения на схеме каскада аппаратов: - вектор переменных состояния процесса на выходе из i-того аппарата
5. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Критерий оптимальности на каждой стадии определяется её состоянием:
6. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Уравнение математической модели для i –й стадии даёт связь между вектором входных параметров, вектором
7. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Рассмотрим задачу: Сырьё определённого состава поступает в каскад из трёх изотермических реакторов 1 2
8. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ По техническому регламенту для каждого реактора допускается реализация трёх стационарных состояний, определяемых набором параметров:
9. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Вектор искомых управляющих переменных на каждой стадии имеет вид: n – число оборотов мешалки
10. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Схематическое изображение процесса в рассматриваемом трехстадийном процессе:
11. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Задача оптимизации ставится следующим образом: найти такой набор управлений на каждом из реакторов, чтобы
12. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Точка A изображает начальное состояние процесса, которое характеризуется начальным составом сырья, его температурой и
13. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Далее переработка сырья во втором реакторе осуществляется таким образом, что на выходе из него
14. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Аналогично для третьего реактора точки D1, D2 и D3 соответствуют трём возможным стационарным состояниям
15. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Далее предположим, что реализация любого управления на любом реакторе связана с некоторым значением критерия
16. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Проще всего эта задача может быть решена обычным перебором (1-ый способ решения), т.е. сравнением
17. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Из всех полученных значений R выбирается максимальный и, следовательно, выбирается реализующий его набор управлений.
18. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Изложенный метод решения задачи требует реализации большого количества необходимых вычислений. Формула для количества возможных
19. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ В соответствии с принципом оптимальности, которым необходимо руководствоваться при решении таких задач, и который
20. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Если же задача решается изложенным методом динамического программирования (2-ой способ решения), необходимое количество вычислений
21. Динамическое программирование Большинство процессов химической технологии относится к классу дискретно распределённых во времени и пространстве процессов.
22. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Допустим, что задана конечная концентрация реагента A: Число реакторов в каскаде N. Требуется выбрать
23. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Критерий оптимальности является функцией многих переменных, и решение задачи методом неопределённых множителей Лагранжа становится
24. Формулировка принципа оптимальности Белмана Оптимальная стратегия обладает таким свойством, что каково бы ни было начальное состояние
25. Общая схема решения задач методом динамического программирования При подходе к решению задач оптимизации методом динамического программирования
26. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ При выполнении перечисленных условий необходимо правильно формулировать задачу оптимизации. При формулировке должны быть выявлены:
27. Математическая формулировка принципа оптимальности 1 2 … i N …
28. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Критерий оптимальности на каждой стадии определяется её состоянием:
29. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Уравнение математической модели для i –й стадии даёт связь между вектором входных параметров, вектором
30. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Решение задачи начинается с последней стадии, где необходимо выбрать оптимальное управление – так, чтобы
31. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Используя уравнение математической модели для данной стадии, получим: откуда определяется оптимальное управление которое зависит
32. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Переходя к стадии N – 1, получим условие выбора оптимального уравнения: где математическая модель
33. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Поскольку f1 уже выбрано, определение f2 даёт возможность выбора оптимального управления на стадии N
34. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Проводя аналогичный анализ, для стадии i можно записать:
35. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ С учётом φi получим математическую формулировку принципа оптимальности, являющуюся рекуррентной формулой, позволяющей выполнять решение
36. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Для первой стадии имеем: откуда определяется оптимальное управление (А) или наряду с оптимальным управлением
37. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ На этом завершается 1-этап решения задачи ДП. Второй этап решения Для реализация 2-этапа на
38. Произвольная стадия каскада
39. Пример 1. Пусть имеется каскад химических реакторов идеального перемешивания, в котором проводится необратимая реакция первого порядка:
40. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Нетрудно видеть, что в поставленной задаче оптимизации выполнены условия a, b и с: оптимизируемый
41. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Запишем сведения о процессе, необходимые для решения задачи оптимизации: 1. Параметрами, характеризующими состояние каждой
42. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ на параметры управления процесса на каждой стадии наложены ограничения: или
43. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Составляем математическое описание каждой i-ой стадии (уравнение материального баланса): или
44. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Откуда имеем:
45. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Составляем критерий оптимальности (Слайд 67) : или
46. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Пример 1. ПЕРВЫЙ ЭТАП РЕШЕНИЯ решения выглядит следующим образом: где
47. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Концентрация реагента A на выходе из реактора N однозначно определяет время пребывания в нём,
48. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ В соответствии с общей схемой переходим к предпоследнему реактору:
49. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Если вид выражения критерия не сложен, а названное управление - это единственный управляющий параметр,
50. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ В предпоследнем реакторе необходимо выбрать такое значение x N-1, чтобы выражение в скобках имело
51. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Из последнего выражения следует:
52. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Поскольку функция f2 дифференцируемая, легко проверить достаточное условие существования экстремума: во всём диапазоне изменения
53. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ в точке функция f2 принимает минимальное значение. Следовательно:
54. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Чтобы получить минимальное значение времени пребывания в двух последних реакторах, запишем рекуррентное соотношение:
55. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Повторим рассмотренную процедуру для третьего от конца реактора. Запишем для него рекуррентное соотношение:
56. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Найдём минимум, воспользовавшись необходимым условием существования экстремума функции одной переменной:
57. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Откуда получаем:
58. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Проверим достаточное условие:
59. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Подставив в последнее выражение полученное значение оптимальной концентрации, имеем: т.е. при оптимальном значении концентрации
60. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Подставив значение оптимальной концентрации в рекуррентное соотношение, получим:
61. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ или после преобразований:
62. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Решение задачи выполняется таким же образом последовательно для всех реакторов до первого включительно. Для
63. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ и рекуррентного соотношения:
64. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Для первого реактора:
65. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Поскольку в условии задачи x 0 и xN заданы, k и N неизвестны, из
66. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ и для первого реактора:
67. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ ВТОРОЙ ЭТАП РЕШЕНИЯ На втором этапе решения из полученных соотношений определяются:
68. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Для второго реактора имеем:
69. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Далее определяется: и т.д. до тех пор, пока не будут получены значения всех оптимальных
70. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Далее определяется: и т.д. до тех пор, пока не будут получены значения всех оптимальных
71. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Пример 2 В каскаде реакторов идеального перемешивания проводится простая реакция 2-го порядка : A
72. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Исходные данные: Число аппаратов N = 3 Начальная концентрация компонента A x0 = 1
73. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Решение Критерий оптимальности процесса по условию задачи есть: τi - среднее время пребывания в
74. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Из уравнения материального баланса для i – го реактора имеем:
75. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Первый этап решения Записываем рекуррентное соотношение:
76. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Поскольку x3 задано,
77. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Функциональное уравнение будем решать графически:
78. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Записываем рекуррентное соотношение для f2:
79. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
80. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
81. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
82. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
83. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Записываем рекуррентное соотношение для f2:
84. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
85. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
86. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Из графических построений определяется: И оптимальное управление, соответствующее f3: Второй этап решения
87. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ По найденному значению x1(opt) графически определяем x2(opt):
88. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Рассчитываем время пребывания в каждом из аппаратов:
89. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
90. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
92. Скачать презентацию

Слайд 2

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Для решения задач оптимизации многостадийных процессов успешно применяется метод динамического

программирования - ДП, который позволяет снять ряд трудностей, возникающих при решении многомерных задач.
Основным преимуществом этого метода является возможность снизить размерность решаемой задачи. Наиболее часто метод динамического программирования используется при решении:

задач о распределении ресурсов по стадиям процесса

Слайд 3

Блочная схема многостадийного процесса
1
2
…
i
N
…

Слайд 4

Условные обозначения на схеме каскада аппаратов:
- вектор переменных состояния процесса на

выходе из i-того аппарата и на входе в i+1 аппарат

- вектор переменных управления i-том аппарате

- частный критерий оптимальности в i-том аппарате

- Критерий оптимальности всего процесса – аддитивная функция

- число стадий процесса (аппаратов)

Слайд 5

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Критерий оптимальности на каждой стадии определяется её состоянием:

Слайд 6

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Уравнение математической модели для i –й стадии даёт связь между

вектором входных параметров, вектором выходных параметров и вектором управлений:

Слайд 7

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Рассмотрим задачу:
Сырьё определённого состава поступает в каскад из трёх изотермических

реакторов

Слайд 8

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
По техническому регламенту для каждого реактора допускается реализация трёх стационарных

состояний, определяемых набором параметров:
n – число оборотов мешалки
tн – температура хладагента
G – расход хладагента

Каждому стационарному состоянию соответствует некоторый состав на выходе из аппарата:

Слайд 9

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Вектор искомых управляющих переменных на каждой стадии имеет вид:
n –

число оборотов мешалки
tн – температура хладагента
G – расход хладагента

Тогда задача оптимизации формулируется следующим образом:

Слайд 10

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Схематическое изображение процесса в рассматриваемом трехстадийном процессе:

Слайд 11

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Задача оптимизации ставится следующим образом:
найти такой набор управлений на

каждом из реакторов, чтобы критерий оптимальности всего процесса R достиг максимального значения. В соответствии со схемой, решение задачи оптимизации методом перебора всех вариантов управлений, т.е. комбинаторным методом это означает такой выбор одной или нескольких ломаных линий из всей их совокупности, чтобы выполнилось следующее равенство:

Слайд 12

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Точка A изображает начальное состояние процесса, которое характеризуется начальным составом

сырья, его температурой и т.д. В результате определённого набора управлений на первом реакторе (n1, tн1, G1) на выходе из него получается продукт с составом:

k – соответствует числу состояний (k =3), реализуемых в каждом случае.

Слайд 13

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Далее переработка сырья во втором реакторе осуществляется таким образом, что

на выходе из него получается следующий состав продуктов:

Эти состояния изображаются точками C1, C2 и C3. Линии, соединяющие точки Bi и Cj, соответствуют тем наборам управлений на втором реакторе, которые используются при переводе системы из состояния Bi в состояние Cj.

Слайд 14

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Аналогично для третьего реактора точки D1, D2 и D3 соответствуют

трём возможным стационарным состояниям на третьем реакторе, т.е. составам:

Линии, соединяющие точки Ci и Dj, соответствуют тем наборам управлений на третьем реакторе, которые используются при переводе системы из состояния Ci в состояние Dj.

Слайд 15

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Далее предположим, что реализация любого управления на любом реакторе связана

с некоторым значением критерия оптимальности в этом реакторе. На схеме цифрами проставлены условные значения критерия оптимальности на каждой стадии в зависимости от применяемого набора управлений. При этом будем считать, что критерий оптимальности всего процесса может быть выражен в виде:

ri – значение критерия оптимальности в i-ом реакторе

Слайд 16

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Проще всего эта задача может быть решена обычным перебором (1-ый

способ решения), т.е. сравнением между собой всех возможных вариантов проведения процесса. Необходимо определить значение R для всех ломаных (здесь 27) схемы процесса:

Слайд 17

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Из всех полученных значений R выбирается максимальный и, следовательно, выбирается

реализующий его набор управлений.

Однако этот путь решения имеет существенный недостаток - требуется производить анализ всех возможных вариантов, число которых быстро возрастает с ростом числа стадий и числа допустимых состояний:

Для 5 стадий и 3 допустимых состояний число вариантов:

Для 10 стадий и 3 допустимых состояний число вариантов:

Слайд 18

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Изложенный метод решения задачи требует реализации большого количества необходимых вычислений.

Формула для количества возможных вариантов вычислений при использовании метода перебора (1-ый способ решения) имеет вид:

k – число возможных состояний на стадии
N – число стадий

Слайд 19

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
В соответствии с принципом оптимальности, которым необходимо руководствоваться при решении

таких задач, и который лежит в основе динамического программирования (2-ой способ решения):

для любого промежуточного состояния процесса последующие управления должны быть оптимальными.

В соответствии с этим принципом решение задачи методом ДП включает
2 этапа:
1- этап: начинается с выбора оптимального управления на последней стадии, затем на предпоследней и т.д., двигаясь от конца процесса к его началу. Однако значения этих управлений зависят от входных параметров на каждую стадию, включая первую стадию. Входные параметры на первую стадию либо известны, либо определяются по результатам расчетов первой стадии.
2-этап: по известным значениям входных параметров, начиная с первой стадии определяются конкретные управляющие параметры последовательно на всех стадиях процесса до последней стадии, что и является решением задачи.

Слайд 20

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Если же задача решается изложенным методом динамического программирования (2-ой способ

решения), необходимое количество вычислений (n’ )составляет:

При k = 3 и N = 3 n’ = 21, в то время как в 1-ом способе - n = 27
При k = 3 и N = 5 n’ = 39, в то время, как в 1-м - n = 243.

При k = 3 и N = 10 n’ = 93, в то время, как в 1-м - n = 59049.

Слайд 21

Динамическое программирование
Большинство процессов химической технологии относится к классу дискретно распределённых во

времени и пространстве процессов.

Пусть имеется каскад химических реакторов идеального перемешивания, в котором проводится необратимая реакция первого или второго порядка:

Слайд 22

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Допустим, что задана конечная концентрация реагента A:
Число реакторов в каскаде

N. Требуется выбрать объёмы реакторов так, чтобы суммарный объём всех реакторов был минимальным.

Слайд 23

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Критерий оптимальности
является функцией многих переменных, и решение задачи методом неопределённых

множителей Лагранжа становится затруднительным.

Слайд 24

Формулировка принципа оптимальности Белмана
Оптимальная стратегия обладает таким свойством, что каково бы ни

было начальное состояние и начальное решение, последующие решения должны приниматься, исходя из оптимальной стратегии относительно состояния, получаемого в результате первого решения

Слайд 25

Общая схема решения задач методом динамического программирования
При подходе к решению задач

оптимизации методом динамического программирования необходимо обращать внимание на следующее:

оптимизируемый процесс должен быть дискретно-распределённым во времени или пространстве (многостадийный процесс);
отдельные стадии процесса должны обладать относительной независимостью, т.е. вектор выходных параметров любой стадии должен зависеть только от вектора входных параметров на эту стадию и управлений на ней;
критерий оптимальности всего процесса должен быть сформулирован как аддитивная функция критериев оптимальности каждой стадии;

Слайд 26

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
При выполнении перечисленных условий необходимо правильно формулировать задачу оптимизации. При

формулировке должны быть выявлены:

параметры, характеризующие состояние каждой стадии;
управляющие параметры на каждой стадии;
ограничения, которые накладываются на параметры состояния процесса и управляющие параметры.

Необходимо составить:

математическое описание для каждой стадии;
критерий оптимальности.

Слайд 27

Математическая формулировка принципа оптимальности
1
2
…
i
N
…

Слайд 28

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Критерий оптимальности на каждой стадии определяется её состоянием:

Слайд 29

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Уравнение математической модели для i –й стадии даёт связь между

вектором входных параметров, вектором выходных параметров и вектором управлений:

Слайд 30

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Решение задачи начинается с последней стадии, где необходимо выбрать оптимальное

управление – так, чтобы критерий оптимальности rN был экстремальным (например, максимальным):

Первый этап решения

Слайд 31

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Используя уравнение математической модели для данной стадии, получим:
откуда определяется оптимальное

управление
которое зависит от выходных переменных предыдущей стадии

Слайд 32

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Переходя к стадии N – 1, получим условие выбора оптимального

уравнения:

где математическая модель предыдущей стадии имеет вид:

с зависимостями для управляющих переменных следующего вида:

Слайд 33

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Поскольку f1 уже выбрано, определение f2 даёт возможность выбора оптимального

управления на стадии N – 1. Подставляя уравнение математической модели для данной стадии, получим:

откуда определяется оптимальное управление

Слайд 34

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Проводя аналогичный анализ, для стадии i можно записать:

Слайд 35

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
С учётом φi получим математическую формулировку принципа оптимальности, являющуюся рекуррентной

формулой, позволяющей выполнять решение задачи оптимизации последовательно:

где fN-(i-1) – значение суммы критериев оптимальности последних N - i стадий.
откуда определяется оптимальное управление

Слайд 36

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Для первой стадии имеем:
откуда определяется оптимальное управление (А) или наряду

с оптимальным управлением и оптимальные входные переменные (В) :
А)

или
В) , - более сложная задача (большей размерности)

Слайд 37

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
На этом завершается 1-этап решения задачи ДП.
Второй этап решения
Для реализация

2-этапа на основе знания и по соотношениям, приведенным ниже, последовательно определяются (i=1,…N) и (i=2,…N):

Слайд 38

Произвольная стадия каскада

Слайд 39

Пример 1.
Пусть имеется каскад химических реакторов идеального перемешивания, в котором проводится

необратимая реакция первого порядка:

Задана конечная концентрация A:

Число реакторов в каскаде N.
Задача оптимизации: выбрать объёмы реакторов так, чтобы суммарный объём всех реакторов был минимальным.

Слайд 40

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Нетрудно видеть, что в поставленной задаче оптимизации выполнены условия a,

b и с: оптимизируемый процесс является дискретно-распределённым в пространстве; отдельные стадии процесса обладают относительной независимостью (выход каждого реактора зависит только от входящих переменных и управлений на нём) и критерий оптимальности всего процесса является аддитивной функцией частных критериев (критерий оптимальности - объём каскада реакторов, частные критерии - объёмы каждого аппарата).

Слайд 41

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Запишем сведения о процессе, необходимые для решения задачи оптимизации:
1. Параметрами,

характеризующими состояние каждой стадии являются концентрации продукта реакции или исходного реагента - xi.

2. Управляющие параметры - объёмы каждого реактора или, что то же самое, время пребывания смеси в каждом реакторе Ui (при постоянной нагрузке).

3. На параметры состояния процесса на каждой стадии наложены ограничения:

Слайд 42

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
на параметры управления процесса на каждой стадии наложены ограничения:
или

Слайд 43

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Составляем математическое описание каждой i-ой стадии (уравнение материального баланса):
или

Слайд 44

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Откуда имеем:

Слайд 45

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Составляем критерий оптимальности (Слайд 67) :
или

Слайд 46

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Пример 1.
ПЕРВЫЙ ЭТАП РЕШЕНИЯ
решения выглядит следующим образом:
где

Слайд 47

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Концентрация реагента A на выходе из реактора N однозначно определяет

время пребывания в нём, поэтому именно её можно взять в качестве управляющего параметра.
Тогда задача оптимизации на последней стадии состоит в выборе такой концентрации на выходе из N –го аппарата, при которой время пребывания в N –ом аппарате было бы минимальным.
Однако в рассматриваемой задаче конечная концентрация xN задана, поэтому задача какого-либо выбора исключается и остаётся только рассчитать время пребывания при заданном значении xN:

Слайд 48

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
В соответствии с общей схемой переходим к предпоследнему реактору:

Слайд 49

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Если вид выражения критерия не сложен, а названное управление -

это единственный управляющий параметр, то для определения экстремума r*N на стадии можно пользоваться теоремами математического анализа.
Если же выражение критерия сложно, а управление есть совокупность нескольких управляющих воздействий, то решение с использованием классического дифференциального анализа или невозможно, или представляет значительные трудности. Поэтому следует применять методы нелинейного программирования.

Слайд 50

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
В предпоследнем реакторе необходимо выбрать такое значение x N-1, чтобы

выражение в скобках имело минимум при любых значениях xN-2. Это значение xN-1 можно найти, воспользовавшись необходимым условием существования экстремума функции одной переменной:

Слайд 51

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Из последнего выражения следует:

Слайд 52

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Поскольку функция f2 дифференцируемая, легко проверить достаточное условие существования экстремума:
во

всём диапазоне изменения xN-1, следовательно

Слайд 53

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
в точке
функция f2 принимает минимальное значение.
Следовательно:

Слайд 54

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Чтобы получить минимальное значение времени пребывания в двух последних реакторах,

запишем рекуррентное соотношение:

Слайд 55

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Повторим рассмотренную процедуру для третьего от конца реактора. Запишем для

него рекуррентное соотношение:

Слайд 56

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Найдём минимум, воспользовавшись необходимым условием существования экстремума функции одной переменной:

Слайд 57

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Откуда получаем:

Слайд 58

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Проверим достаточное условие:

Слайд 59

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Подставив в последнее выражение полученное значение оптимальной концентрации, имеем:
т.е. при

оптимальном значении концентрации действительно достигается минимум.

Слайд 60

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Подставив значение оптимальной концентрации в рекуррентное соотношение, получим:

Слайд 61

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
или после преобразований:

Слайд 62

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Решение задачи выполняется таким же образом последовательно для всех реакторов

до первого включительно.

Для произвольного реактора i, считая от конца процесса, получим аналогичные выражения оптимальной концентрации:

Слайд 63

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
и рекуррентного соотношения:

Слайд 64

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Для первого реактора:

Слайд 65

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Поскольку в условии задачи x 0 и xN заданы, k

и N неизвестны, из последнего выражения рассчитывается минимальное значение критерия оптимальности:

Слайд 66

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
и для первого реактора:

Слайд 67

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
ВТОРОЙ ЭТАП РЕШЕНИЯ
На втором этапе решения из полученных соотношений определяются:

Слайд 68

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Для второго реактора имеем:

Слайд 69

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Далее определяется:
и т.д. до тех пор, пока не будут получены

значения всех оптимальных управлений.

Слайд 70

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Далее определяется:
и т.д. до тех пор, пока не будут получены

значения всех оптимальных управлений.

Слайд 71

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Пример 2
В каскаде реакторов идеального перемешивания проводится простая реакция

2-го порядка : A → P. Каждый из аппаратов каскада работает в изотермических условиях, причём температура реакционной массы во всех аппаратах одинакова.
Требуется определить среднее время пребывания реакционной массы в каждом из аппаратов с тем, чтобы общее время пребывания реакционной массы в системе было минимальным.

Слайд 72

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Исходные данные:
Число аппаратов N = 3
Начальная концентрация компонента A x0

= 1 моль/литр

Конечная концентрация компонента A на выходе из каскада x3 = 0,2 моль/литр

Константа скорости реакции:

Слайд 73

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Решение
Критерий оптимальности процесса по условию задачи есть:
τi - среднее время

пребывания в i – ом аппарате.

Слайд 74

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Из уравнения материального баланса для i – го реактора имеем:

Слайд 75

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Первый этап решения
Записываем рекуррентное соотношение:

Слайд 76

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Поскольку x3 задано,

Слайд 77

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Функциональное уравнение будем решать графически:

Слайд 78

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Записываем рекуррентное соотношение для f2:

Слайд 79

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ

Слайд 80

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ

Слайд 81

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ

Слайд 82

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ

Слайд 83

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Записываем рекуррентное соотношение для f2:

Слайд 84

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ

Слайд 85

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ

Слайд 86

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Из графических построений определяется:
И оптимальное управление, соответствующее f3:
Второй этап решения

Слайд 87

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
По найденному значению x1(opt) графически определяем x2(opt):

Слайд 88

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Рассчитываем время пребывания в каждом из аппаратов:

Слайд 89

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ

Слайд 90

Оптимизация с применением динамического программирования (ДП) презентация

Содержание

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕДля решения задач оптимизации многостадийных процессов успешно применяется метод динамического

Блочная схема многостадийного процесса12…iN…

Условные обозначения на схеме каскада аппаратов:- вектор переменных состояния процесса на

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕКритерий оптимальности на каждой стадии определяется её состоянием:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕУравнение математической модели для i –й стадии даёт связь между

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕРассмотрим задачу:Сырьё определённого состава поступает в каскад из трёх изотермических

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕПо техническому регламенту для каждого реактора допускается реализация трёх стационарных

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕВектор искомых управляющих переменных на каждой стадии имеет вид:n –

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕСхематическое изображение процесса в рассматриваемом трехстадийном процессе:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕЗадача оптимизации ставится следующим образом: найти такой набор управлений на

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕТочка A изображает начальное состояние процесса, которое характеризуется начальным составом

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕДалее переработка сырья во втором реакторе осуществляется таким образом, что

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕАналогично для третьего реактора точки D1, D2 и D3 соответствуют

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕДалее предположим, что реализация любого управления на любом реакторе связана

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕПроще всего эта задача может быть решена обычным перебором (1-ый

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕИз всех полученных значений R выбирается максимальный и, следовательно, выбирается

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕИзложенный метод решения задачи требует реализации большого количества необходимых вычислений.

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕВ соответствии с принципом оптимальности, которым необходимо руководствоваться при решении

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕЕсли же задача решается изложенным методом динамического программирования (2-ой способ

Динамическое программированиеБольшинство процессов химической технологии относится к классу дискретно распределённых во

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕДопустим, что задана конечная концентрация реагента A:Число реакторов в каскаде

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕКритерий оптимальностиявляется функцией многих переменных, и решение задачи методом неопределённых

Формулировка принципа оптимальности БелманаОптимальная стратегия обладает таким свойством, что каково бы ни

Общая схема решения задач методом динамического программированияПри подходе к решению задач

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕПри выполнении перечисленных условий необходимо правильно формулировать задачу оптимизации. При

Математическая формулировка принципа оптимальности12…iN…

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕКритерий оптимальности на каждой стадии определяется её состоянием:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕУравнение математической модели для i –й стадии даёт связь между

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕРешение задачи начинается с последней стадии, где необходимо выбрать оптимальное

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕИспользуя уравнение математической модели для данной стадии, получим:откуда определяется оптимальное

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕПереходя к стадии N – 1, получим условие выбора оптимального

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕПоскольку f1 уже выбрано, определение f2 даёт возможность выбора оптимального

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕПроводя аналогичный анализ, для стадии i можно записать:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕС учётом φi получим математическую формулировку принципа оптимальности, являющуюся рекуррентной

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕДля первой стадии имеем:откуда определяется оптимальное управление (А) или наряду

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕНа этом завершается 1-этап решения задачи ДП.Второй этап решенияДля реализация

Произвольная стадия каскада

Пример 1.Пусть имеется каскад химических реакторов идеального перемешивания, в котором проводится

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕНетрудно видеть, что в поставленной задаче оптимизации выполнены условия a,

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕЗапишем сведения о процессе, необходимые для решения задачи оптимизации:1. Параметрами,

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕна параметры управления процесса на каждой стадии наложены ограничения:или

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕСоставляем математическое описание каждой i-ой стадии (уравнение материального баланса):или

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕОткуда имеем:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕСоставляем критерий оптимальности (Слайд 67) :или

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕПример 1. ПЕРВЫЙ ЭТАП РЕШЕНИЯрешения выглядит следующим образом:где

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕКонцентрация реагента A на выходе из реактора N однозначно определяет

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕВ соответствии с общей схемой переходим к предпоследнему реактору:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕЕсли вид выражения критерия не сложен, а названное управление -

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕВ предпоследнем реакторе необходимо выбрать такое значение x N-1, чтобы

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕИз последнего выражения следует:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕПоскольку функция f2 дифференцируемая, легко проверить достаточное условие существования экстремума:во

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕв точке функция f2 принимает минимальное значение. Следовательно:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕЧтобы получить минимальное значение времени пребывания в двух последних реакторах,

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕПовторим рассмотренную процедуру для третьего от конца реактора. Запишем для

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕНайдём минимум, воспользовавшись необходимым условием существования экстремума функции одной переменной:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕОткуда получаем:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕПроверим достаточное условие:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕПодставив в последнее выражение полученное значение оптимальной концентрации, имеем:т.е. при

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕПодставив значение оптимальной концентрации в рекуррентное соотношение, получим:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕили после преобразований:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕРешение задачи выполняется таким же образом последовательно для всех реакторов

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕи рекуррентного соотношения:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕДля первого реактора:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕПоскольку в условии задачи x 0 и xN заданы, k

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕи для первого реактора:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕВТОРОЙ ЭТАП РЕШЕНИЯНа втором этапе решения из полученных соотношений определяются:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕДля второго реактора имеем:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕДалее определяется:и т.д. до тех пор, пока не будут получены

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕДалее определяется:и т.д. до тех пор, пока не будут получены

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕПример 2 В каскаде реакторов идеального перемешивания проводится простая реакция

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕИсходные данные:Число аппаратов N = 3Начальная концентрация компонента A x0

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕРешениеКритерий оптимальности процесса по условию задачи есть:τi - среднее время

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕИз уравнения материального баланса для i – го реактора имеем:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕПервый этап решенияЗаписываем рекуррентное соотношение:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Для решения задач оптимизации многостадийных процессов успешно применяется метод динамического

Блочная схема многостадийного процесса
1
2
…
i
N
…

Условные обозначения на схеме каскада аппаратов:
- вектор переменных состояния процесса на

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Критерий оптимальности на каждой стадии определяется её состоянием:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Уравнение математической модели для i –й стадии даёт связь между

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Рассмотрим задачу:
Сырьё определённого состава поступает в каскад из трёх изотермических

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
По техническому регламенту для каждого реактора допускается реализация трёх стационарных

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Вектор искомых управляющих переменных на каждой стадии имеет вид:
n –

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Схематическое изображение процесса в рассматриваемом трехстадийном процессе:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Задача оптимизации ставится следующим образом:
найти такой набор управлений на

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Точка A изображает начальное состояние процесса, которое характеризуется начальным составом

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Далее переработка сырья во втором реакторе осуществляется таким образом, что

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Аналогично для третьего реактора точки D1, D2 и D3 соответствуют

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Далее предположим, что реализация любого управления на любом реакторе связана

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Проще всего эта задача может быть решена обычным перебором (1-ый

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Из всех полученных значений R выбирается максимальный и, следовательно, выбирается

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Изложенный метод решения задачи требует реализации большого количества необходимых вычислений.

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
В соответствии с принципом оптимальности, которым необходимо руководствоваться при решении

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Если же задача решается изложенным методом динамического программирования (2-ой способ

Динамическое программирование
Большинство процессов химической технологии относится к классу дискретно распределённых во

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Допустим, что задана конечная концентрация реагента A:
Число реакторов в каскаде

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Критерий оптимальности
является функцией многих переменных, и решение задачи методом неопределённых

Формулировка принципа оптимальности Белмана
Оптимальная стратегия обладает таким свойством, что каково бы ни

Общая схема решения задач методом динамического программирования
При подходе к решению задач

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
При выполнении перечисленных условий необходимо правильно формулировать задачу оптимизации. При

Математическая формулировка принципа оптимальности
1
2
…
i
N
…

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Критерий оптимальности на каждой стадии определяется её состоянием:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Уравнение математической модели для i –й стадии даёт связь между

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Решение задачи начинается с последней стадии, где необходимо выбрать оптимальное

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Используя уравнение математической модели для данной стадии, получим:
откуда определяется оптимальное

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Переходя к стадии N – 1, получим условие выбора оптимального

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Поскольку f1 уже выбрано, определение f2 даёт возможность выбора оптимального

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Проводя аналогичный анализ, для стадии i можно записать:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
С учётом φi получим математическую формулировку принципа оптимальности, являющуюся рекуррентной

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Для первой стадии имеем:
откуда определяется оптимальное управление (А) или наряду

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
На этом завершается 1-этап решения задачи ДП.
Второй этап решения
Для реализация

Пример 1.
Пусть имеется каскад химических реакторов идеального перемешивания, в котором проводится

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Нетрудно видеть, что в поставленной задаче оптимизации выполнены условия a,

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Запишем сведения о процессе, необходимые для решения задачи оптимизации:
1. Параметрами,

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
на параметры управления процесса на каждой стадии наложены ограничения:
или

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Составляем математическое описание каждой i-ой стадии (уравнение материального баланса):
или

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Откуда имеем:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Составляем критерий оптимальности (Слайд 67) :
или

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Пример 1.
ПЕРВЫЙ ЭТАП РЕШЕНИЯ
решения выглядит следующим образом:
где

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Концентрация реагента A на выходе из реактора N однозначно определяет

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
В соответствии с общей схемой переходим к предпоследнему реактору:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Если вид выражения критерия не сложен, а названное управление -

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
В предпоследнем реакторе необходимо выбрать такое значение x N-1, чтобы

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Из последнего выражения следует:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Поскольку функция f2 дифференцируемая, легко проверить достаточное условие существования экстремума:
во

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
в точке
функция f2 принимает минимальное значение.
Следовательно:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Чтобы получить минимальное значение времени пребывания в двух последних реакторах,

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Повторим рассмотренную процедуру для третьего от конца реактора. Запишем для

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Найдём минимум, воспользовавшись необходимым условием существования экстремума функции одной переменной:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Откуда получаем:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Проверим достаточное условие:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Подставив в последнее выражение полученное значение оптимальной концентрации, имеем:
т.е. при

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Подставив значение оптимальной концентрации в рекуррентное соотношение, получим:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
или после преобразований:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Решение задачи выполняется таким же образом последовательно для всех реакторов

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
и рекуррентного соотношения:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Для первого реактора:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Поскольку в условии задачи x 0 и xN заданы, k

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
и для первого реактора:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
ВТОРОЙ ЭТАП РЕШЕНИЯ
На втором этапе решения из полученных соотношений определяются:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Для второго реактора имеем:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Далее определяется:
и т.д. до тех пор, пока не будут получены

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Далее определяется:
и т.д. до тех пор, пока не будут получены

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Пример 2
В каскаде реакторов идеального перемешивания проводится простая реакция

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Исходные данные:
Число аппаратов N = 3
Начальная концентрация компонента A x0

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Решение
Критерий оптимальности процесса по условию задачи есть:
τi - среднее время

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Из уравнения материального баланса для i – го реактора имеем:

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Первый этап решения
Записываем рекуррентное соотношение: