Главная Промышленная автоматика.


Рис.6.19. Графики переходного процесса разгона электропривода

Оптимальность полученной траектории можно проверить, применяя к ней принцип максимума Л. С. Понт-рягина. Функция Гамильтона имеет вид

Я = -(1+ХАР5;)-Ь

Ч/2("-Шо -е)

+ oi.(6.43)

Уравнения для сопряженных переменных:

дН V2

Vl =-

= 2Xi +

Э(Шо) " Т Магистральной траектории соответствует особое оптимальное управление при \/2 = О, ф2 = 0. В этом случае, как видно из

последнего уравнения, = 2XTi, а функция Гамильтона равна

Я = -(UAPj;) + 2Xi{iRQ - IRo ). (6.44)

Если х/2 = О, то

diRr

= О , поэтому особая траектория

dt дц12

соответствует постоянству тока якоря. Это оптимальное значение,

полученное из условия Rq = О , где Я определяется выраже-

нием (6.43), как нетрудно убедиться, совпадает с (6.44). Сигнал управления: на особом участке и* = i*Ro + е, на всей траектории * (iRo +е при 4/2 =0; [usign\;2 при\;2 0.

6.11. МЕТОД ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

Предварительные замечания. Динамическое программирование является одним из методов математической теории опти-



мального управления, предназначенных для решения вариационных задач при наличии ограничений фазовых координат. В основе метода лежит принцип оптимальности, сформулированный Р.Беллманом, суть которого состоит в том, что поиск оптимума не зависит от предыдущего состояния системы и определяется лишь ее состоянием в рассматриваемый момент времени.

С помощью динамического программирования рассматриваются достаточно сложные процессы, которые могут быть разбиты во времени на отдельные этапы (шаги). При решении последовательно определяется оптимальное управление для соответствующих этапов. Найденное для какого-то этапа управление в соответствии с принципом оптимальности Р.Беллмана должно быть связано с общей стратегией управления, позволяющей получить наилучший результат во время движения.

Поэтапное решение позволяет составить программу изменения управления для рассматриваемого процесса. Поэтому, а также вследствие того, что рассматриваемый метод предназначен главным образом для динамических процессов, этот метод и был назван динамическим программированием.

Рекуррентное соотношение Р.Беллмана. Пусть управляемый объект описывается системой уравнений

x = fi{x,u)

при начальном значении д:(0) = Xq. Требуется найти управление, минимизирующее функционал качества

J-= lfo{x,u)dt + ((>x{x{tf)),

где (pi(x(tf)) - некоторая функция конечного положения системы.

Для решения поставленной задачи разобьем процесс перемещения объекта на ряд этапов (шагов) и произведем последовательную оптимизацию каждого из них. На рис.6.20 показана разбивка интервала времени (О, tf) на N равных участков длиной Д.

Решение задачи состоит в определении последовательности дискретных значений управления минимизи-

рующих функционал качества при ограниченных значениях фазовых координат и управления. Таким образом, необходи-


Рис.6.20. Расчет оптимальной траектории



МО найти минимум сложной функции N - 1 переменных. Метод динамического программирования позволяет свести эту операцию к последовательной минимизации функций одной переменной на каждом интервале дискретности при движении от конца процесса (t = tf) к его началу. В результате поэтапной оптимизации процесса получим рекуррентную формулу для Sff-k, представляющего минимальное значение функции Jff-k> зависящее от состояния системы x-ii на (N - А)-м шаге:

+ Sif-k iN-k + fo iN-k . "N-A )))• (6.45)

Эта формула позволяет определить значения функционала и оптимального управления на любом шаге. Доведя расчеты до начальной точки х(0), можно получить оптимальную траекторию и оптимальное управление. Решение по рекуррентной формуле (6.45) обычно выполняется с помощью ЭВМ с большим объемом памяти.

Функциональное уравнение Р.Беллмана. Используя метод динамического программирования, найдем функциональное уравнение для случая с закрепленным концом траектории и свободным временем, наиболее часто встречающегося в практике.

Пусть система описывается дифференциальными уравнениями (6.22). Требуется перевести систему из точки x(tQ) = Xq фазового пространства х в заданную точку Xf. Момент времени tf, в который изображающая точка приходит в заданное конечное положение Xf, заранее не фиксируется. Управление и = u(t) должно удовлетворять ограничению и е U а минимизировать функционал

J= lfo{x{t),u(t))dt. (6.46)

Управление, удовлетворяющее этим условиям, а также получаемую при этом фазовую траекторию и время tf - tQ будем считать оптимальными.

Наименьшее возможное значение Ф функционала (6.46) при оптимальном управлении и = и* зависит от начального состояния системы:

Ф = Ф(Хо ) = Ф(Х10 , Х20 . )•

Сделаем допущение, что функция Ф непрерывна и всюду имеет непрерывные частные производные по своим аргументам. По определению,

Ф{хо) = min jfoix{t),u{t))dt, (6.47)

«о

где минимум берется по u(t) ё U.

Разобьем интеграл в правой части на два:





0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 [54] 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115

0.0019