Главная Промышленная автоматика.

5.4. МЕТОДЫ СИНТЕЗА

ОПТИМАЛЬНОГО УПРАВЛЕНИЯ В ДИНАМИЧЕСКОМ РЕЖИМЕ

В динамическом режиме работы объекта иеремеииые состояния из.меияются во времени. Этот режи.м характеризуется иа-чальны.м значением вектора состояния (до приложения внешних воздействий X(c = lkio, Х20, Anollj, текущим значением вектора состояния У(t) и интервалом времени fo, 1], где ii - конечный момент времени. Кроме того, дпна.мика объекта характеризуется координатами управления н/ и координатами выхода объекта .V,- или уи Координаты управления - это внен;-ние воздействия, которые прикладываются к объекту реализации процесса управления и могут изменяться (гроизвольным образом. В отличие от них выходные координаты Xi(i) изменяются с ограниченной скоростью, гюскольку они всегда представляют собой выходные сигналы реальных дина.мических элементов На практике все координаты управле1!ия и выхода ограпичень[ (во многих случаях при опти.мальном управлении предельные значения припи.мают лишь координаты унравления, а выходные координаты ограничений пе достигают).

Для изучения 1!среходных процессов в СЛУ можно воспользоваться функционалом, выражаемым некоторым определенным интегралом:

J =F{x, X, t)dt, (5.30)

где x = x(t) - траектория движения; x = x(t) - скорость движения; (\, 2--начальный и конечный моменты времени.

Задача опти.мизации динамики С.ЛУ сводится к математическому определению экстремума. Для этого следует дать приращение аргументу функционала и выяснить, как изменится его значение. Приращение (или вариация) 6х аргумента x(t) изменяющегося произвольно функционала J[x(t)] есть разность между двумя близкими функция.ми: 6xX2(1)-X\(t).

Не следует смешивать понятие вариации 6а с понятием дифферещиала dx. Оба понятия содержат бесконеч!10 малые изменения функции х. Различие их в том, что dx порождается бесконечно малым изменением dt независимой переменной t, а бх своим возникновением обязан новой функции X2(t)=Xi(t)-\-+f>x. При этом варьируется лишь функция x(ti) при постоянстве ti, т. е. 6/ = 0. Варьирование функции есть переход ее от первоначальной функции xi(t) к близкой, мало отличающейся от нее функции ХгСО и сравнение их значений при определенных значениях независимой неременной /.

Нахождение экстрему.мов функционалов производится методами вариационного исчисления. Рассмотрим некоторые из них.



Классический метод вариационного исчисления. Определим условие существования экстремума функционала (5.30). Для этого проварьируем подынтегральную функцию x(t) и ее про-и-чводную x(t), т. е. образуем функции .v+6.v и х-\-Ьх. Прира-щепие интеграла (5.30) можно определить разложением его в ряд Тейлора: t,

А/ \ F{x+ox; xi-Zx; t) dt-\F{x, x, t) dt =

+ -дх---dt-\-... .

(5.31)

Отбрасывая в правой части выражения (5.31) из-за малости величин Ьх и Ьх все члены, кроме первых двух ли1!еииых, получим так называемую первую вариацию для функционала (5.30):

flFix, x,t) . , dF(x. X, t) p,;.

(5.32).

Необходимы.м условием существования экстремального значения интеграла (5.30) является равенство нулю его первой вариации: й/ = 0. Для нахождения экстремума функционала (о.ЗО) при заданных граничных условиях X\(t) = Q и Х2(0 = 0 приравняем к нулю выражение (5.32):

дР(х, X, л .

дР{х,х, о 1у

dt=0.

(5.33)

Это равенство должно выполняться для любой вариации, которая удовлетворяет граничным условиям 6a-(i) = 0 и bx(t2) = 0. Учитывая их и интегрируя по частям второе слагаемое, представим равенство (5.33) в виде

m--±jLbxdt+bx

Ox Ox

{ £ \dF{x, x,

J Ч-

dF(x. X, t) ±1 oFix. X, t) dt

bxdt = Q,

bxdt=

(5.34)

Так как Ьх выбирается произвольно и может быть пе равно нулю, равенство (5,34) возможно лип!Ь ири условии

(5.35) 15»

дРх, X, t) дх

fdF(x. X, t)\Q



Уравне1П!е (5.35) называют дифференциальным уравнением Эйлера. Постоянные интегрирования этого уравнения определяются из граничных условий. Решение уравнения Эйлера является необходимым и достаточным условием экстремума интеграла (5.30) при заданных граничных условиях. Если граничные условия не фиксированы и представлены в виде кривых, то для решения урав1;спня (5.35) используются условия трансверсальности. Для определения соответствия экстремума функционала минимуму или максимуму можно ограничиться численной проверкой значения функционала около найденной экстремали или проверить знак второй нроизвощюй вдоль экстремали (условие Лежандра): при d-F/dx-O будет минимум, а при dF/dxrO - максимум функционала.

Использование классического метода вариационного исчисления предполагает, что иско.мые функции опти.мальных процессов являются непрерывными и иа координаты выхода и управлении не накладываются ограничения. Поскольку на практике обычно обратное - различные ограничения накладываются не только на объект управления, но и на СЛУ, то возможности использоваршя рассмотренного метода ограничены.

Метод динамического программирования. В основу этого метода, предложенного американским учены.м Р. Белл.маиом, положен принцип оптимальности, согласно которому оптимальное управление системы не зависит от предыстории самой системы. Метод динамического программирования дает возможность иайти оптимальные управления и°(t) и траектории Х(/) из условия минимума фуикцнона.та т

J= \F{X. u, t)t/t=m\n (5 36)

i

для заданных уравнений объекта

Х---AX-f Ви = Ф(Х, U), (5.37)

начальных и конечных значений Х(/о) и Х(/) п интервала времени io<.t<.T при наличии ограничений вида \{1)М и u{i)U (М, и - заданные допустимые области для координат выхода и унравления). Если необходи.мо обеспечить условия максиму.ма функционала (5.36), следует принять минус перед интегралом.

Для решения задач оптимизации объектов используется вспо.могательиая функция Беллмэна: г

S{t, Х)= min

Jy=-(X, u, t) dt

(5.38)

Поскольку минимум функционала (5.36) зависит от момента to-\-M, значения \t и конечного момента Т, то функция Белл-мана преобразуется в выражение





0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 [51] 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81

0.0044