Full Text
Пусть управляемый дискретный процесс описывается системой разностных уравнений дробного порядка
(1)
с начальным условием
(2)
где -мерная вектор-функция, являющаяся решением задачи Коши
(3)
(4)
Здесь , заданные -мерные вектор-функции, непрерывные по совокупности переменных вместе с частными производными по , заданный постоянной вектор, , , , заданы, ( ) и ( ) дробные операторы порядков и (см., например, [4, 9–11]), , -мерные вектор-функции управляющих воздействий со значениями из заданного непустого и ограниченного множества и
(5)
Управляющую функцию назовем допустимым управлением, если она удовлетворяет ограничениям (4) и (5), а соответствующий процесс назовем допустимым процессом.
На решениях системы (1)(4), порожденных всевозможными допустимыми управлениями, определим функционал терминального типа
(6)
Здесь , заданные скалярные функции, непрерывные по совокупности переменных вместе с их производными по и соответственно.
Требуется найти минимальное значение функционала (6) при ограничениях (1)(5).
Предполагается, что при каждом заданном допустимом управлении дискретные аналоги задач Коши, т.е. задачи (1)(2) и (3)(4), имеют единственные решения.
Допустимое управление , доставляющее минимум функционалу (6) при ограничениях (1)(5), называется оптимальным управлением, а пара является оптимальным процессом.
Цель работы состоит в выводе ряда необходимых условий оптимальности.
Пусть фиксированное, а , произвольное допустимое управления. Через и , обозначим соответствующие им решения системы (1)(3). Тогда ясно, что будет удовлетворять системе
(7)
(8)
(9)
(10)
Пусть пока неизвестные -мерные вектор-функции. Умножим обе части соотношений (7), (9) слева скалярно на (соответственно, на ) и просуммируем полученные тождества по от до и от до (соответственно, по от до ). В результате получим
(11)
(12)
Положим
Функции , являются аналогами функций Гамильтона Понтрягина для рассматриваемой задачи (1)(6). С учетом тождеств (11), (12) формула для приращения критерия качества (6) записывается в виде
(13)
Займемся преобразованием отдельных слагаемых в этой формуле. С этой целью рассмотрим выражение
Сделав в нем замену переменных , получим
(14)
Делая замену переменных , легко убедиться в справедливости следующих тождеств:
(15)
Далее, с учетом теоремы дробного суммирования по частям (см. [8]) имеем
(16)
(17)
(18)
(19)
Принимая во внимание тождества (14)(18) и (13), получим
Отсюда, используя формулу Тейлора и учитывая введенные обозначения, можно записать тождество (19) в следующем виде:
(20)
Здесь норма вектора , определяемая формулой
а величина более высокого порядка малости, чем , т.е. при . Можно доказать, что
Теперь предположим, что является решением следующей системы линейных однородных разностных уравнений дробного порядка:
(21)
(22)
(23)
(24)
Тогда формула приращения (20) примет вид
(25)
Здесь по определению
(26)
Пусть фиксированное допустимое управление. Предположим, что множества
выпуклы. Тогда через можно определить специальное приращение управления в виде
(27)
Здесь , произвольные числа, а , произвольные допустимые управляющие функции, удовлетворяющие условиям
(28)
(29)
Здесь , , произвольные допустимые управляющие функции, соответствующие и .
Через обозначим специальное приращение вектора состояния , отвечающее приращению (27) управления . В [1, 12] доказаны следующие оценки:
(30)
(31)
, , некоторые постоянные. Из этих оценок следует, что
(32)
где , , некоторые положительные числа.
Принимая во внимание оценки (32), формулы (27), (28), (29), в формуле (26) приходим к разложению
(33)
При помощи разложения (33), используя произвольность и независимость управляющих функций , , приходим к следующему утверждению.
Теорема 1. Если множества
выпуклы, то для оптимальности допустимого управления в задаче (1)(5) необходимо, чтобы соотношения
(34)
(35)
выполнялись для любого , , , соответственно.
Доказанная теорема является аналогом дискретного принципа максимума для рассматриваемой задачи.
Теперь предположим, что вектор-функции , непрерывны по совокупности переменных вместе с частными производными по и , а множества и являются выпуклыми. Тогда специальное приращение допустимого управления можно определить по формуле
(36)
Здесь , произвольные числа, а и произвольные допустимые управляющие функции. Через обозначим специальное приращение траектории , отвечающее приращению (35) управления . Из оценок (30), (31) следует, что
С учетом этих оценок получаем справедливость разложения
(37)
Теорема 2. Пусть множества и выпуклы, а функции , непрерывны по совокупности переменных вместе с частными производными по , соответственно. Тогда для оптимальности допустимого управления необходимо, чтобы соотношения
(38)
(39)
выполнялись для любого , , , соответственно.
Совокупность неравенств (38), (39) есть аналог линеаризованного условия максимума в задаче (1)(5) (см. [2, 3]).