Главная Промышленная автоматика. Рис.6.19. Графики переходного процесса разгона электропривода Оптимальность полученной траектории можно проверить, применяя к ней принцип максимума Л. С. Понт-рягина. Функция Гамильтона имеет вид Я = -(1+ХАР5;)-Ь Ч/2("-Шо -е) + oi.(6.43) Уравнения для сопряженных переменных: дН V2 Vl =- = 2Xi + Э(Шо) " Т Магистральной траектории соответствует особое оптимальное управление при \/2 = О, ф2 = 0. В этом случае, как видно из последнего уравнения, = 2XTi, а функция Гамильтона равна Я = -(UAPj;) + 2Xi{iRQ - IRo ). (6.44) Если х/2 = О, то diRr = О , поэтому особая траектория dt дц12 соответствует постоянству тока якоря. Это оптимальное значение, полученное из условия Rq = О , где Я определяется выраже- нием (6.43), как нетрудно убедиться, совпадает с (6.44). Сигнал управления: на особом участке и* = i*Ro + е, на всей траектории * (iRo +е при 4/2 =0; [usign\;2 при\;2 0. 6.11. МЕТОД ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ Предварительные замечания. Динамическое программирование является одним из методов математической теории опти- мального управления, предназначенных для решения вариационных задач при наличии ограничений фазовых координат. В основе метода лежит принцип оптимальности, сформулированный Р.Беллманом, суть которого состоит в том, что поиск оптимума не зависит от предыдущего состояния системы и определяется лишь ее состоянием в рассматриваемый момент времени. С помощью динамического программирования рассматриваются достаточно сложные процессы, которые могут быть разбиты во времени на отдельные этапы (шаги). При решении последовательно определяется оптимальное управление для соответствующих этапов. Найденное для какого-то этапа управление в соответствии с принципом оптимальности Р.Беллмана должно быть связано с общей стратегией управления, позволяющей получить наилучший результат во время движения. Поэтапное решение позволяет составить программу изменения управления для рассматриваемого процесса. Поэтому, а также вследствие того, что рассматриваемый метод предназначен главным образом для динамических процессов, этот метод и был назван динамическим программированием. Рекуррентное соотношение Р.Беллмана. Пусть управляемый объект описывается системой уравнений x = fi{x,u) при начальном значении д:(0) = Xq. Требуется найти управление, минимизирующее функционал качества J-= lfo{x,u)dt + ((>x{x{tf)), где (pi(x(tf)) - некоторая функция конечного положения системы. Для решения поставленной задачи разобьем процесс перемещения объекта на ряд этапов (шагов) и произведем последовательную оптимизацию каждого из них. На рис.6.20 показана разбивка интервала времени (О, tf) на N равных участков длиной Д. Решение задачи состоит в определении последовательности дискретных значений управления минимизи- рующих функционал качества при ограниченных значениях фазовых координат и управления. Таким образом, необходи- Рис.6.20. Расчет оптимальной траектории МО найти минимум сложной функции N - 1 переменных. Метод динамического программирования позволяет свести эту операцию к последовательной минимизации функций одной переменной на каждом интервале дискретности при движении от конца процесса (t = tf) к его началу. В результате поэтапной оптимизации процесса получим рекуррентную формулу для Sff-k, представляющего минимальное значение функции Jff-k> зависящее от состояния системы x-ii на (N - А)-м шаге: + Sif-k iN-k + fo iN-k . "N-A )))• (6.45) Эта формула позволяет определить значения функционала и оптимального управления на любом шаге. Доведя расчеты до начальной точки х(0), можно получить оптимальную траекторию и оптимальное управление. Решение по рекуррентной формуле (6.45) обычно выполняется с помощью ЭВМ с большим объемом памяти. Функциональное уравнение Р.Беллмана. Используя метод динамического программирования, найдем функциональное уравнение для случая с закрепленным концом траектории и свободным временем, наиболее часто встречающегося в практике. Пусть система описывается дифференциальными уравнениями (6.22). Требуется перевести систему из точки x(tQ) = Xq фазового пространства х в заданную точку Xf. Момент времени tf, в который изображающая точка приходит в заданное конечное положение Xf, заранее не фиксируется. Управление и = u(t) должно удовлетворять ограничению и е U а минимизировать функционал J= lfo{x{t),u(t))dt. (6.46) Управление, удовлетворяющее этим условиям, а также получаемую при этом фазовую траекторию и время tf - tQ будем считать оптимальными. Наименьшее возможное значение Ф функционала (6.46) при оптимальном управлении и = и* зависит от начального состояния системы: Ф = Ф(Хо ) = Ф(Х10 , Х20 . )• Сделаем допущение, что функция Ф непрерывна и всюду имеет непрерывные частные производные по своим аргументам. По определению, Ф{хо) = min jfoix{t),u{t))dt, (6.47) «о где минимум берется по u(t) ё U. Разобьем интеграл в правой части на два: 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 [54] 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 0.0019 |