On the optimal control function diagrams in the problem of the movement of a platform with oscillators
- 作者: Kayumov O.R.1
-
隶属关系:
- Branch of Omsk State Pedagogical University
- 期: 编号 2 (2024)
- 页面: 67-83
- 栏目: OPTIMAL MANAGEMENT
- URL: https://journal-vniispk.ru/0002-3388/article/view/264492
- DOI: https://doi.org/10.31857/S0002338824020079
- EDN: https://elibrary.ru/VOJEHR
- ID: 264492
如何引用文章
全文:
详细
We consider the problem of the time-optimal movement of a rigid body moving translationally along a horizontal straight line and carrying n-linear oscillators. The only control force is applied to the platform and is limited in magnitude, there is no friction. The system is transferred from a state of rest to a specified distance with vibration damping. The evolution of optimal control functions depending on the distance of movement is investigated. A general approach to constructing a visual diagram reflecting such evolution is proposed. To do this, a geometric interpretation of the necessary optimality conditions is used as properties of an auxiliary “control” curve in n-dimensional space. Numerical examples of constructing diagrams of optimal control functions for a platform with three oscillators are given.
全文:
Введение. Рассматривается система, состоящая из несущего твердого тела и прикрепленных к нему n линейных пружин с материальными точками на концах (рис. 1). Пружины параллельны горизонтальной оси, вдоль которой платформа движется поступательно. К ней приложена единственная управляющая сила, ограниченная по модулю наперед заданной величиной. Такая модель может приближенно описывать малые перемещения платформы с упругими звеньями или сосуда, частично заполненного жидкостью. Постановки задач управления подобными объектами сформулированы в [1], где с помощью принципа максимума Понтрягина [2] была решена задача наибыстрейшего перемещения платформы с одним осциллятором. Оптимальное управление оказалось кусочно-постоянным с тремя переключениями [1, 3]. В общем случае (для платформы с n осцилляторами) задача до сих пор не была решена. Управляемость такой системы гарантирована, если частоты собственных колебаний осцилляторов попарно различны [1, 4]. Несмотря на линейность системы, управление при дефиците внешних воздействий представляет известную сложность. Задачи перемещения таких объектов с гашением колебаний за конечное время в последнее время рассматривались в [5–7]. Были построены алгоритмы, достигающие цели при действии неизвестных возмущений и при неизмеряемых состояниях осцилляторов [8, 9]. В работе [10] предложен закон управления, переводящего платформу с n осцилляторами за конечное время в требуемое состояние покоя при неполной информации о состоянии и возмущениях, причем для некоторого типа начальных состояний найдена асимптотика времени движения в зависимости от числа n.
Рис. 1. Модель платформы с осцилляторами
В задаче оптимального по быстродействию перемещения платформы с n осцилляторами из одного состояния равновесия в другое, когда трение отсутствует, а фазовое состояние системы в каждый момент измеримо, удается использовать симметрию краевых условий. На этой основе функция оптимального управления была выражена через значения первых n моментов переключения, предварительно определяемых из системы нелинейных уравнений [11]. Для случая оптимальные режимы иллюстрировались на фазовой плоскости одного из осцилляторов [11], а также путем построения наглядного изображения, названного диаграммой функций оптимального управления [12]. Алгоритм построения диаграммы опирался на свойства вспомогательной «контрольной» кривой, геометрически отразившие решения сопряженной системы из принципа максимума Понтрягина. В настоящей работе этот подход обобщается на случай n осцилляторов с учетом того, что для малых перемещений платформы оптимальное управление на полутраектории имеет не более n переключений [13].
- Постановка задачи и ее свойства симметрии. Повторяя использованные в [11] преобразования координат и времени, приведем уравнения движения системы (рис. 1) к форме с безразмерными переменными и временем:
(1.1)
где u – управляющая сила, а значения частот пронумерованы в порядке возрастания (). Переменные под знаками производных являются линейными комбинациями координат платформы и осцилляторов, причем одновременное обращение в нуль значений , , соответствует ненапряженным состояниям пружин, а положение несущего тела характеризуется переменной . Если ее значение при требуемом перемещении платформы меняется на величину 2b, то в середине этого отрезка назначим начало отсчета координаты . Аналогичную «удвоенную» запись введем и для искомого общего времени движения системы, что придаст краевым условиям симметричный вид.
Задача оптимального по быстродействию перемещения платформы с n осцилляторами формулируется следующим образом: требуется определить управление , , переводящее систему (1.1) из состояния
(1.2)
за наименьшее время (заранее неизвестное) в состояние
(1.3)
Поставленную задачу быстродействия будем рассматривать для взаимной вариационной задачи на максимум дальности при заданном времени (ввиду их монотонной взаимозависимости). Обобщая результаты [12], исследуем также эволюцию функций оптимального управления , , с изменением значения T.
На основе принципа максимума Понтрягина было показано [11], что в задаче оптимального быстродействия (1.1) – (1.3) в смещенном времени , , оптимальное управление , а также все решения , будут нечетными функциями, а , – четными функциями. Поэтому в конце оптимальной полутраектории выполняются соотношения
(1.4)
Особые управления здесь невозможны в силу линейной независимости известных решений сопряженной системы из принципа максимума. В результате оптимальное управление будет кусочно-постоянным с нечетным числом переключений.
- Необходимые условия оптимальности и их геометрическая интерпретация. Если моменту времени Т предшествуют j моментов времени переключения управления , , …, , то через них (путем интегрирования дифференциальных уравнений (1.1)) в конце полутраектории можно выразить значения , [11]. Они равны нулю, согласно соотношениям (1.4), поэтому в обозначениях
(2.1)
получается система из нелинейных уравнений:
(2.2)
Дальнейшие рассуждения будут основаны на эволюции корней , системы (2.2) при изменении значений T. Каждой длительности T полутраектории соответствует свое количество j моментов переключения управления, заранее неизвестное, и свое множество корней, удовлетворяющее при этом неравенству
(2.3)
Если в системе (1.1) все числа , – рациональные, то в задаче оптимального быстродействия (1.1) – (1.3) имеют место следующие свойства [11].
Замечание 1. Существует оптимальное движение с одним переключением управления при , где , – общий знаменатель всех несократимых дробей , .
Замечание 2. Если управление с моментами переключения , , …, , T удовлетворяет краевым условиям (2.2), то им также удовлетворит:
1) управление с моментами переключения ;
2) управление с моментами переключения (при условии ).
Замечания 1, 2 дают возможность описать все сценарии оптимального поведения системы, периодически повторяющиеся с ростом параметра T. Если хотя бы одно из значений , иррационально, то в системе (2.2) не будет общего периода всех функций, поэтому с ростом длительности T количество разных типов оптимального движения будет бесконечным, не поддающимся завершенному описанию.
На основе принципа максимума Понтрягина доказано утверждение [11], которое в терминах , можно сформулировать следующим образом.
Утверждение 1. Если в задаче (1.1)–(1.3) полутраектория оптимальна по быстродействию и реализуется кусочно-постоянным управлением с n переключениями на промежутке в моменты времени , то управляющая функция имеет вид
(2.4)
знак константы определяется известным (по условию) значением управления при .
Для каждой заданной длительности полутраектории T сначала нужно найти из системы (2.2) предполагаемый набор значений моментов переключения. Затем нужно проверить его на соответствие необходимым условиям оптимальности, применяя утверждение 1: если при действии управления (2.3) возникнут другие моменты переключения, кроме ожидаемых , то это расписание не оптимально. В случае, когда найденное из системы (2.2) количество переключений превосходит n, т.е. , то для них условие остается прежним [11]: все эти j значений должны автоматически проявиться при действии управления (2.4). Если же у системы (2.2) количество корней , то в формуле для управляющей функции (2.4) вместо определителя берется лишь его левый верхний минор размерами [11].
Геометрический смысл таких необходимых условий оптимальности можно иллюстрировать с помощью линии в n-мерном пространстве, названной в [12] контрольной кривой. Для этого заметим, что равенство нулю определителя равносильно условию
(2.5)
где введена вспомогательная функция
(2.6)
доопределенная значением . Согласно утверждению 1, условие (2.4) должно выполняться лишь при , , т.е. лишь когда первый столбец определителя численно совпадет с одним из n последующих. Эти n столбцов представим как векторы , отложенные от начала О в аффинном пространстве с координатами () и порождающие гиперплоскость. Ее пересечение с гиперплоскостью y0 = 1 даст -мерную плоскость, содержащую все точки (ввиду одинаковости их первой координаты). Поэтому множество векторов , можно однозначно спроецировать на подпространство с координатами , получая лежащие в нем векторы , . Тогда окажется, что все точки принадлежат общей кривой, задаваемой в n–мерном пространстве вектор-функцией
(2.7)
Линию (2.7) назовем контрольной кривой. Ее форма зависит от сочетания значений , , но всегда линия начинается в точке при и проходит через точку при (если ). Ее актуальный участок завершается в точке W с параметром и содержит точки , , расположенные последовательно соответственно значениям их параметров (2.3). В смещенном времени можно следить за движением по контрольной кривой изображающей точки, которая дважды пройдет дугу (из конца W в начало и обратно). При этом определитель будет каждый раз менять знак при прохождении через пункты , т.е. в точках пересечения контрольной кривой с гиперплоскостью . Геометрический смысл необходимого условия оптимальности заключается в том, что контрольная кривая не должна иметь с гиперплоскостью других точек пересечения, кроме тех, чьим параметрам , соответствуют запланированные моменты переключений.
Например, при (случай платформы с двумя осцилляторами) контрольная кривая лежит в двумерной плоскости. На рис. 2 дано ее изображение для значений , , а на рис. 3 – для значений , .
Для платформы с тремя осцилляторами () контрольная кривая лежит в трехмерном пространстве . На рис. 4 показан случай , , (пунктиром отмечены фрагменты кривой, лежащие ниже горизонтальной плоскости ). Проекции этой линии на плоскости и выглядят, как на рис. 2 и рис. 3.
Рис. 2. Контрольная кривая в случае при
Рис. 3. Контрольная кривая в случае при
Рис. 4. Контрольная кривая в случае при
Заметим, что на рис. 2 начальный участок кривой (от до первой точки перегиба) вогнутый, т.е. может содержать только две коллинеарные точки и , но не может содержать третьей. Поэтому здесь прямая – это «гиперплоскость», не имеющая с актуальным участком контрольной кривой других пересечений, кроме и . Отсюда следует, что для достаточно малых значений Т (не превышающих параметр точки перегиба) оптимальное управление имеет не более двух моментов переключения на полутраектории. Аналогично можно показать, что при начальный участок контрольной кривой не может содержать более трех компланарных точек, т.е. на малом промежутке оптимальное управление платформой с тремя осцилляторами будет иметь не более трех переключений. Эта закономерность доказана [13] в виде следующего утверждения.
Утверждение 2. В задаче (1.1)–(1.3) существует такое значение , что для всех функции , , удовлетворяющие необходимым условиям оптимальности, будут иметь не более моментов времени переключения.
Доказательство сводилось к обоснованию того, что на достаточно малом участке контрольной кривой (2.7) любые () ее точек , не могут принадлежать общей гиперплоскости, т.е. вектор не сможет принадлежать подпространству, порождаемому векторами , . Построенный на этих векторах определитель будет положительным [13], по крайней мере, при условии
(2.8)
Такая оценка является весьма грубой и обусловлена стилем доказательства (путем разложения элементов определителя в ряды Маклорена). На рис. 2 (где , ωn = 3) точка W имеет параметр . Другими словами, для платформы с двумя осцилляторами при , , в диапазоне оптимальным полутраекториям соответствуют ровно два момента переключения управления.
Далее для описания эволюции функций оптимального управления , , с изменением параметра Т будем применять наглядное изображение, предложенное в [12] и названное диаграммой функций оптимального управления.
Например, на рис. 5 показана диаграмма для случая , , . Вверх по оси симметрии отложена ось Т. Каждое горизонтальное сечение диаграммы, прочитываемое слева-направо, символизирует одну кусочно-постоянную функцию оптимального управления , . Серым отрезкам горизонтали соответствуют промежутки времени, где , а белым отрезкам – где . Например, сечение задает при функцию оптимального управления с пятью переключениями. Участок кодирует график для «полутраектории», показанный на рис. 6 в несмещенном времени . Моментам переключения соответствуют корни системы (2.2) при , . На контрольной кривой (рис. 2) им отвечают точки W (), () и (). Здесь прямая не имеет других пересечений с дугой , поэтому функция удовлетворяет необходимым условиям оптимальности в задаче быстродействия (1.1)–(1.3).
Рис. 5. Диаграмма функций оптимального управления в случае при
Рис. 6. График функции в случае при ,
При рассмотренных целочисленных значениях , , согласно замечанию 1, величина является «периодом» для повторения формы диаграммы. Ее продолжение, согласно замечанию 2, строится путем зеркального отражения треугольника (с его закрашенными областями) относительно горизонтали , что дало бы симметричный треугольник . При продолжении вертикальной оси Т внутри угла будут периодически повторяться квадраты с их раскрашенными областями.
Далее рассмотрим закономерности, позволяющие строить диаграммы функций управления в задаче оптимального по быстродействию перемещения платформы с n осцилляторами.
- Свойства диаграммы функций оптимального управления при малых значениях параметра Т. Рассмотрим устройство диаграммы в ее самой нижней части, т.е. в окрестности вершины О. Поскольку для , согласно утверждению 2, количество моментов переключений управления , не превышает n, то из вершины О будут выходить не более n кривых. В обозначениях , , где выполнены неравенства (2.3), можно рассматривать эти кривые как графики функций , , . С увеличением параметра T такая эволюция соответствует изменению корней системы n уравнений (2.2), записанной при . При меньшем числе переключений управления в этой системе можно формально считать , .
Далее в предположении о малости значений T (а значит, и всех ) используем разложения в ряды Маклорена:
(3.1)
Подставляя соотношения (3.1) в (2.2), перегруппируем слагаемые, выделяя в них выражения:
(3.2)
Тогда, вводя вектор , преобразуем систему (2.2) к виду
(3.3)
Поскольку определитель Вандермонда
при (),
то из матричного соотношения (3.3) следует , , что приводит к системе n уравнений относительно n переменных , :
(3.4)
Можно показать, что такая система (3.4) всегда имеет n корней , причем значения и , и и т.д. дополняют друг друга до единицы. Детали вычислений приведем отдельно для двух случаев.
С л у ч а й 1. Если n – четное, т.е. , , то можно ввести новые переменные , представив
(3.5)
где
(3.6)
При подстановке выражений (3.5) в систему (3.4) ее каждое второе уравнение повторит предыдущее, так что останется лишь k уравнений, порождающих в новых переменных , , симметрическую систему
Она решается введением симметрических многочленов, числовые значения которых найдутся стандартными процедурами, чтобы затем (согласно теореме Виета) стать коэффициентами «порождающего» алгебраического уравнения k–й степени с корнями . При эти уравнения решаются лишь численно, но для малых k корни находятся в явном виде:
1) при (т.е. ) имеем (т.е. , ),
2) при (т.е. ) имеем , (т.е. , , , ),
3) при (т.е. ) возникает «порождающее» уравнение
корни которого находятся по формулам Кардано
,
Им соответствуют численные значения , , , дающие по формулам (3.5) все корни , системы (3.4).
С л у ч а й 2. Если n – нечетное, т.е. , , то корни системы (3.4) выразятся через новые переменные в виде:
(3.7)
где вновь выполнится неравенство (3.6).
При подстановке выражений (3.7) в систему (3.4) ее нечетные уравнения вырождаются в тождества, а четные выразятся лишь через , , так что при замене , , система в точности повторит вид системы (3.4) для . Иначе говоря, получим значения , где , , – корни системы (3.4) для . Таким образом, получим:
1) при корни , , ,
2) при корни , , , , ,
3) при корни , , , , , , и т.д.
Замечание 3. Подставляя корни , системы (3.4) в выражение
(3.8)
при любом n получим неравенство .
Можно показать (подробности опускаем), что при , , выражение (3.8) принимает значение , а при , , – значение .
Поскольку среди корней системы (3.4), имеющих исходный смысл , , нет нулевых значений, а сама система порождена представлением (3.1), то в предположении о малости T показана справедливость следующего свойства.
Утверждение 3. В задаче быстродействия (1.1)–(1.3) при достаточно малом значении T функция оптимального управления , имеет ровно n переключений. На соответствующей диаграмме из вершины О выходят ровно n кривых , , имеющих в этой точке угловые коэффициенты:
(3.9)
где , , – корни системы (3.4).
В силу гладкости участвующих в (2.2) функций и с учетом вышесказанного, существует диапазон , на котором функции , непрерывны и дифференцируемы, так что если применить разложение
(3.10)
то , , .
Заметим, что система (3.3) порождена приближением (3.1) с учетом n степеней переменной . Если разложение (3.1) дополнить степенью , подразумевая при этом увеличение обсуждаемого диапазона T, то после подстановки в систему (2.2) в ней появилась бы наряду с выражениями (3.2) новая компонента:
(3.11)
Тогда вместо однородного матричного уравнения (3.3) окажется неоднородное
, . (3.12)
Из него методом Крамера последует значение , где матрица получается из заменой первого столбца на столбец q. Поэтому
откуда
(3.13)
Сравнивая соотношения (3.8) и (3.11), получим
т.е. знак нового выражения (3.13) для совпадет со знаком прежнего выражения (3.8) для S. Таким образом, при достаточно малом значении T, согласно утверждению 2 и замечанию 3, ранее имели оценки и . Теперь с небольшим увеличением параметра T знак выражения S сохранится, а знак выражения
(3.14)
станет отрицательным, что приводит к следующему выводу.
Замечание 4. Для достаточно малых значений T выражение убывает, т.е.
(3.15)
Этот факт позволяет для достаточно малых значений T уточнить знак оптимального управления , , при . С этой целью введем в рассмотрение функцию времени t, определенную на промежутке и зависящую от параметра :
Тогда кусочно-постоянную функцию управления , , характеризуемую моментами переключения , , …, , T (где 0<<...<<T) и принимающую значение , можно представить в виде
(3.16)
Если бы в начальный момент было , то в формуле (3.16) правая часть была бы умножена на «–1». Для дифференциального уравнения , , характеризующего перемещение платформы из «нулевого» положения под действием управления (3.16), решением будет
Поэтому перемещение платформы за время T в обозначениях (2.1) примет вид
(3.17)
(с умножением правой части на «–1» в случае ).
Если для малых значений T в выражениях (3.10) ограничиться линейными компонентами, то при их подстановке в (3.17) правая часть выродится в нуль, поскольку равна нулю правая часть в (3.14). Поэтому для отыскания знака величины понадобится выражение (3.10) с учетом квадратичной компоненты. Подставляя его в (3.17), сокращая подобные слагаемые и пренебрегая величинами четвертого порядка малости, получим
(3.18)
(с домножением на «-1» в случае ). Поскольку выражение в квадратных скобках (3.18) отрицательно ввиду неравенства (3.15), то дальность окажется положительной лишь в случае . Таким образом, справедливо следующее свойство.
Утверждение 4. В задаче быстродействия (1.1)–(1.3) при достаточно малом значении T функция оптимального управления , , на начальном этапе (при ) положительна.
- Общий подход к построению диаграммы функций оптимального управления. Все вышеизложенное позволяет начать построение диаграммы функций оптимального управления, выводя из вершины О кривые , с угловыми коэффициентами (3.9), закрашивая серые и белые области между ними в соответствии с утверждением 4.
Эволюцию значений , можно описать, дифференцируя соотношения (2.2) по параметру T. Сокращая каждое i-е уравнение на , получим систему
(4.1)
Она разрешается (ввиду ) относительно производных
(4.2)
где
(4.3)
Определители , , получаются из D заменой на T в i-м столбце с одновременным его переносом на место левее первого столбца.
При численном интегрировании уравнений (4.2) на каждом этапе требуется проверка необходимого условия оптимальности: гиперплоскость, проведенная через точки , (с координатами в виде столбцов определителя D), не должна пересекать контрольную кривую в иных точках. С этой целью для каждого очередного набора T, , можно табулировать параметр , чтобы убедиться, что соотношение (2.5) выполняется только раз. В противном случае промежуток интегрирования признается завершенным, поскольку уравнения (4.2) сохраняют свой смысл только при тех значениях T, которым соответствует ровно n корней системы (2.2).
Частный случай был исследован в [12], где диаграмма могла состоять из нескольких слоев, разделяемых горизонталями , . Внутри каждого слоя происходила своя непрерывная эволюция значений , со своим конкретным количеством j, т.е. интегрировалась очередная система дифференциальных уравнений.
Для произвольного значения n завершение «первого слоя» диаграммы (при ) тоже может быть двух вариантов. Если («тривиальный» вариант), то диаграмма состоит из одного слоя, внутри которого у всех оптимальных полутраекторий управление имеет n переключений. Для «нетривиального» варианта, представляющего интерес в дальнейшем, в конце первого слоя при системе (2.2) соответствует количество корней . Такое уменьшение числа корней может произойти либо из-за обращения в нуль функции , либо из-за совпадения значений , и т.д. При этом если системе (2.2) отвечает решение, в котором численно совпадут два «соседних» значения , то ей удовлетворит и решение, в котором эти два значения заменены нулями. Таким образом, существование управления с количеством переключений при некотором значении T подразумевало бы для системы (2.2) наличие решения , т.е. справедливость условия
, . (4.4)
Замечание 5. Условие (4.4) может выполняться только для изолированных точек на числовой оси T, т.е. не может продолжаться на непрерывном промежутке этой оси.
Действительно, если систему (4.1) при записать «в дифференциалах» (умножив уравнения на ), то из нее не удастся выразить , , через , поскольку получится система (n уравнений с j неизвестными) несовместная (ввиду линейной независимости строк). Поэтому для параметра не найдется продолжения в виде , .
Из замечания 5 вытекает следствие.
Замечание 6. Для непрерывной эволюции функций , их количество должно быть .
Приведем еще два утверждения, относящихся к частным случаям соотношений (4.4).
Замечание 7. Если при некотором значении T система (2.2) допускает множество корней при , , то соответствующее ему управление (с тремя переключениями в моменты времени , T, ) при удовлетворяет необходимым условиям оптимальности.
Действительно, если в задаче (1.1)–(1.3) при некотором n существует режим с тремя переключениями, то он существует и для системы, полученной из (1.1) формальным исключением последних () уравнений. Но для такой платформы с одним осциллятором режим с тремя переключениями является оптимальным [1, 3]. Достигаемая при максимальная дальность будет не меньшей, чем для системы (1.1) при , т.е. для системы с ограничениями в виде дополнительных () дифференциальных уравнений.
Замечание 8. Если при некотором значении T система (2.2) допускает множество корней при , , то соответствующее ему управление (с пятью переключениями в моменты времени , , T, , ) при удовлетворит необходимым условиям оптимальности в том случае, когда хотя бы одна кривая
(4.5)
на плоскости имеет только две общие точки с прямой , проведенной через взятые на кривой точки и с параметрами и .
Доказательство аналогично замечанию 6: если в задаче (1.1)–(1.3) при некотором n существует режим с пятью переключениями, то он существует и для системы меньшего порядка – относительно переменных , , . Для нее выполнено необходимое условие оптимальности в геометрической форме для контрольной кривой (4.5), поэтому достигаемая платформой с двумя осцилляторами дальность будет максимально возможной. Для исходной системы (1.1), стесненной дополнительными дифференциальными уравнениями, дальность не может быть больше.
В замечании 7 к режимам с тремя переключениями не было дополнительных геометрических требований потому, что порождаемое лишь одной точкой (с параметром ) множество, т.е. нульмерная плоскость, заведомо не может иметь других пересечений с контрольной кривой. Что касается замечания 8, то оно заменяет проверку отсутствия «лишних» пересечений контрольной кривой с прямой в n-мерном пространстве. Естественным обобщением замечаний 7 и 8 является следующий факт.
Замечание 9. Если при некотором значении система (2.2) допускает множество корней с условием (4.4), то соответствующее ему управление (с k переключениями на полутраектории, ) при удовлетворит необходимым условиям оптимальности в том случае, когда из чисел , можно выбрать k (перенумерованных) значений , , для которых соответствующая кривая , в k-мерном пространстве имеет только k общих точек с плоскостью , проведенной через взятые на кривой точки с параметрами , .
Далее рассмотрим разновидности нетривиальных сценариев, относя их к завершению не только «первого слоя» диаграммы (при ), но и любого очередного слоя с некоторым номером k (при ). Перечислим некоторые возможные типы завершения непрерывной эволюции -го слоя в связи с изменением количества корней системы (2.2).
Т и п 1. Пусть при количество корней стало (). Это возможно, например, в ситуации обращения в нуль функции , когда на контрольной кривой в n–мерном пространстве изображающая точка совмещается с началом . Согласно замечанию 5, дальнейшая непрерывная эволюция переменных возможна лишь с увеличением их количества. Для оптимальной функции управления это возможно лишь путем добавления двух новых сколь угодно близких моментов переключения [12], что на графике соответствует «игольчатой» вариации. При таком значении параметра на контрольной кривой гиперплоскость должна пройти через точки , , но не должна быть секущей к этой кривой, иначе в графике возникли бы скачкообразные изменения. Поэтому гиперплоскость пройдет как касательная к контрольной кривой. Параметр искомой точки M касания можно определить из условия принадлежности к гиперплоскости не только точки , но и вычисленного в ней касательного вектора , выраженного через функцию . Точка M касания на контрольной кривой получит статус «сдвоенной», как и соответствующие моменты переключения на графике функции управления. На диаграмме на горизонтали добавится точка с параметром , из которой в следующем слое будут выходить две новые кривые, так что эволюция перенумерованных функций , будет описываться системой с количеством дифференциальных уравнений .
Т и п 2. Пусть при количество корней убавилось до (). Это возможно, например, в ситуации сближения «соседних» значений и , вплоть до совпадения, когда на контрольной кривой совместятся изображающие точки и . Для продолжения непрерывной эволюции, согласно замечанию 6, потребуется как минимум еще две переменные , что на контрольной кривой соответствует появлению «сдвоенной» точки. В отличие от предыдущего случая (тип 1), где такая точка определялась построением касательной гиперплоскости, сейчас для такой процедуры недостаточно имеющихся точек . Если через () точек можно было провести не более двух касательных гиперплоскостей к контрольной кривой, то через () точек их можно провести бесконечно много. Поэтому для отыскания на горизонтали «сдвоенной» точки (назовем ее L) удобнее обратиться к системе (4.1). Ее коэффициенты вычисляются при известных значениях и () «старых» переменных . Параметр искомой сдвоенной точки обозначим , считая его общим для двух новых переменных и . В системе будет ровно n неизвестных, в том числе параметр , разность и производные () «старых» переменных. Исключая из системы производные, получим тригонометрическое уравнение с одним неизвестным . Искомый корень должен удовлетворять двум условиям, проверяемым интегрированием множества функций , , на сколь угодно малом промежутке :
а) соблюдение неравенства (2.3),
б) отсутствие лишних точек пересечения контрольной кривой и гиперплоскости, проведенной через точки с параметрами , .
Заметим, что рассмотренные выше типы 1 и 2 дают исчерпывающий перечень возможных «дефицитов» корней (4.4) лишь для случая . Обобщением могут быть ситуации, когда для продолжения непрерывной эволюции, согласно замечанию 6, понадобится три и более недостающих точек . На графике функции это может соответствовать двум и более игольчатым вариациям. Количество возможных сценариев (при разных комбинациях параметров , ) бесконечно, поэтому вместо конечного алгоритма речь можно вести лишь об общем подходе к продолжению диаграммы функций оптимального управления. Он заключается в совместном рассмотрении диаграммы и геометрических свойств контрольной кривой.
Т и п 3. Пусть при у системы (2.2) число корней , . Тогда эволюция функций , опишется набором () дифференциальных уравнений, первые n из которых имеют вид (4.1), а остальные m уравнений получаются дифференцированием по параметру T соотношений вида (2.5), где вместо () подставлены каждая из m переменных , .
Результаты численных экспериментов для платформы с тремя осцилляторами.
Пример 1. На рис. 7 для значений , , показана правая часть диаграммы функций оптимального управления (ее левая часть – зеркальная, но с переменой местами белого и серого цветов). Из вершины О выходят кривые , , с угловыми коэффициентами, вычисленными по формулам (3.9) (для случая 2) в виде
(5.1)
Уравнения (4.2), интегрировались численно с одновременной проверкой отсутствия «лишних» пересечений контрольной кривой с плоскостью, проведенной через точки с параметрами , , . Процесс завершился при , , . Согласно замечанию 1, для целочисленных значений частот величина является «периодом» повторения формы диаграммы, зеркально удвоенной относительно прямой и породившей квадрат. Через его вершину пройдет горизонталь , символизирующая режим с одним моментом переключения управления. Таким образом, рисунок 7 содержит все возможные фрагменты продолжаемой бесконечно диаграммы. При любых значениях T здесь возможны лишь режимы с количествами 1, 3, 7 переключений оптимального управления.
Рис. 7. Правая (зеркальная) часть диаграммы для при , ,
Пример 2. На рис. 8 показана правая (зеркальная) часть диаграммы для случая , , . Кривые , , выходят из вершины О с теми же угловыми коэффициентами (5.1), но интегрирование системы завершается уже при ввиду обращения в нуль функции . Значения , при удовлетворяют не только системе (2.2), но и необходимым условиям оптимальности в виде замечания 8. Действительно, пространственная контрольная кривая (рис. 4) имеет проекцию на плоскость () в виде рис. 2, на котором проведенная через точки и (с параметрами и ) прямая не имеет других пересечений с контрольной кривой. Согласно замечанию 8, этого достаточно, несмотря на то что, например, проекция на плоскость () (рис. 3) такому свойству не удовлетворяет.
Рис. 8. Правая (зеркальная) часть диаграммы для при , ,
На горизонтали наличие лишь двух точек из трех соответствует описанному выше типу 1. Параметр третьей точки M найден из условия касания плоскости с контрольной кривой (эти точки показаны на рис. 4). С увеличением параметра T касательная плоскость превращается в секущую, из пункта M на контрольной кривой выйдут две новые точки. Второй слой диаграммы начинается при перенумерованных значениях переменных , , , причем интегрируется новая система уравнений. Она соответствует типу 3: к трем уравнениям (4.1) добавится четвертое, полученное дифференцированием по параметру T соотношения (2.5) при , куда вместо () подставляется . Результирующая система разрешится относительно производных в виде
(5.2)
Здесь использованы столбцы , и столбец . Определитель третьего порядка , получается из определителя формальной заменой на столбец , , а все определители составлены из столбцов с возрастающими номерами.
Интегрирование системы (5.2) завершается при ввиду совпадения значений функций и . Их графики на диаграмме (рис. 8) пересекаются в вершине H «чечевицы», начатой вверх из точки M. На контрольной кривой в исчезающей «сдвоенной» точке пройдет момент касания с гиперплоскостью, после чего оставшаяся точка () сохранит имя, а .() переименуется в . В роли третьей точки далее выступит (), поскольку, как показывает численная проверка, только такая плоскость не пересекает контрольной кривой в других точках. При эволюция функций , , находится интегрированием уравнений (4.2) при . Этот третий слой завершается значениями , , и является последним на диаграмме (рис. 8). В каждом слое диаграммы цифрой указано соответствующее количество переключений управления , .
Пример 3. На рис. 9 показана правая (зеркальная) часть диаграммы для случая , , . Сюжет подобран для иллюстрации ситуации типа 2, поскольку система (2.2) заведомо допускает решение , , .
Рис. 9. Правая (зеркальная) часть диаграммы для при , ,
Здесь вновь кривые , , выходят из вершины О с теми же угловыми коэффициентами (5.1), но интегрирование системы (4.2) завершается при , где . В этот момент на контрольной кривой точка совместится с . К двум оставшимся точкам и (тип 1) далее добавится третья – после отыскания параметра точки R касания контрольной кривой и плоскости . Во втором слое диаграммы интегрирование системы (5.2) завершается при ввиду . В третьем слое интегрируется система (4.2) при , пока не произойдет пересечение кривых и в точке P. На горизонтали остается лишь одна точка () вместо трех. Для отыскания новой точки L по описанной выше схеме (см. тип 2) составляем систему уравнений (4.1) с заменой в виде
(5.3)
Подставляя значения , , , исключим из системы переменные и , получая уравнение . В актуальном диапазоне () оно имеет пять корней, из которых только удовлетворяет одновременно условиям а) и б), упомянутым в комментариях (см. тип 2).
В четвертом слое диаграммы (рис. 9) из точки L выходят кривые и , которые вместе с определяются интегрированием системы (4.2) при . Процесс прерывается при , когда контрольная кривая касается плоскости в дополнительной точке Q с параметром . На диаграмме в пятом слое из точки R выходят две новые кривые, поэтому к трем уравнениям (4.1) добавятся четвертое и пятое, полученные дифференцированием по параметру T соотношения (2.5) при , куда вместо () подставляются соответственно и . Результирующая система сводится к виду
(5.4)
Здесь к ранее введенным в (5.2) столбцам , добавлен новый . Определитель третьего порядка , получается из определителя формальной заменой на столбец , , а все определители составлены из столбцов с возрастающими номерами.
Интегрирование системы (5.4) завершается при ввиду обращения в нуль переменной . В шестом слое диаграммы интегрируется система четвертого порядка (5.2) до того момента, когда при контрольная кривая пересечется в точке () плоскостью, проходящей через A1, A2, A3 и A4. Далее в седьмом слое диаграммы интегрируется система пятого порядка (5.4) до тех пор, как при в точке V пересекутся кривые и . Оставшиеся три кривые в восьмом слое определяются интегрированием системы (4.2) при . Завершается диаграмма (рис. 9) горизонталью .
В примерах 1–3 были числа , – целые нечетные, поэтому при система (2.2) допускает решение , . Можно показать (разложением слагаемых этой системы в ряды Тейлора), что на диаграмме в окрестности горизонтали во всех трех примерах значения производных будут , , . Практически идентичными выглядят и малые окрестности вершины О, поскольку совпадают угловые коэффициенты выходящих из нее линий. На каждой диаграмме пунктиром помечена своя горизонталь на уровне (2.8), который давал (явно заниженную) оценку диапазона, где гарантировались режимы с переключениями управления на полутраектории.
Поскольку на рис. 7–9 диаграммы завершаются одинаково при , , , то одинаковы и значения соответствующей «полудальности» по формуле (3.17).
На рис. 10 показаны зависимости дальности перемещения платформы от времени движения. Примерам 1, 2 и 3 соответствуют кривые в, б и а.
Рис. 10. Зависимость дальности от времени для разных сочетаний параметров
Заключение. Рассмотрена задача оптимального по быстродействию перемещения (на заданное расстояние) платформы с n осцилляторами из одного состояния покоя в другое. Предложенная схема построения диаграммы функций оптимального управления стала естественным обобщением ранее изученного в [12] случая . Общий подход заключается в совместном рассмотрении диаграммы и геометрических свойств контрольной кривой в n-мерном пространстве. Для малых перемещений платформы функция оптимального управления оказалась кусочно-постоянной с n моментами переключения на полутраектории. Неочевидным оказалось то, что они почти не зависят от соотношения собственных частот осцилляторов. Например, на диаграммах с разными сочетаниями параметров ω1, ω2, ω3 (рис. 7–9) окрестности вершины О практически идентичны в диапазоне , вычисленном по формуле (2.8) для ω3 = 13 (рис. 9). Поэтому, в частности, можно считать завершенным решение исходной задачи в постановке [1], где платформа с n маятниками рассматривалась в линейном приближении, а значит, в предположении о малости перемещений. Для нее итогом исследования будет утверждение о количестве переключений оптимального управления, равном (), а функции управления заимствуются из нижней части соответствующей диаграммы, согласно утверждению 3.
作者简介
O. Kayumov
Branch of Omsk State Pedagogical University
编辑信件的主要联系方式.
Email: Oleg_Kayumov@mail.ru
俄罗斯联邦, Tara
参考
- Черноусько Ф.Л., Акуленко Л.Д., Соколов Б.Н. Управление колебаниями. М.: Наука, 1980. 383 с.
- Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Наука, 1969. 384 с.
- Мамалыга В.М. Об оптимальном управлении одной колебательной системой // Изв. АН СССР. МТТ. 1978. № 3. С. 8–17.
- Каюмов О.Р. О глобальной управляемости некоторых лагранжевых систем // Изв. АН СССР. МТТ. 1986. № 6. С. 16–23.
- Овсеевич А.И., Федоров А.К. Асимптотически оптимальное управление в форме синтеза для системы линейных осцилляторов // ДАН. 2013. Т. 452. № 3. С. 266–270.
- Ананьевский И.М., Анохин Н.В., Овсеевич А.И. Синтез ограниченного управления линейными динамическими системами с помощью общей функции Ляпунова // ДАН. 2010. Т. 434. № 3. С. 319–323.
- Ovseevich A.A. Local Feedback Control Bringing a Linear System to Equilibrium // JOTA. 2015. V. 165. № 2. P. 532–544.
- Ананьевский И.М., Ишханян Т.А. Управление твердым телом, несущим диссипативные осцилляторы, в присутствии возмущений // Изв. РАН. ТиСУ. 2019. № 1. С. 42–51.
- Ананьевский И.М. Управляемое перемещение платформы, несущей упругое звено с неизвестным фазовым состоянием // Изв. РАН. ТиСУ. 2019. № 6. С. 35–42.
- Ананьевский И.М., Овсеевич А.И. Управляемое перемещение линейной цепочки осцилляторов // Изв. РАН. ТиСУ. 2021. № 5. С. 18–26.
- Каюмов О.Р. Оптимальное по быстродействию перемещение платформы с осцилляторами // ПММ. 2021. Т.85. Вып. 6. С. 699–718.
- Каюмов О.Р. Диаграммы функций оптимального управления в задаче наибыстрейшего перемещения платформы с двумя осцилляторами // Изв. РАН. ТиСУ. 2022. № 5. С. 66–83.
- Kayumov O.R. On the Properties of the Time-Optimal Movement of a Platform with Oscillators // Proceedings of 16th Intern. Conf. on Stability and Oscillations of Nonlinear Control Systems (Pyatnitskiy's Conference), STAB 2022. Moscow, 2022. C. 9807541.
补充文件
