ВВЕДЕНИЕ
Задачи оптимизационной теории, в основе которой лежат классические условия оптимальности, можно рассматривать с двух (в известном смысле принципиально разных) позиций. Если задача такова, что её исходные данные можно и нужно считать известными точно, то мы попадаем в “привычную сферу действия” теории КУО [14] (эта теория, будучи обязанной своим рождением прежде всего потребностям самых различных практических приложений, за прошедшие столетия со времён П. Ферма, Л. Эйлера, Ж. Лагранжа получила фундаментальное развитие, её методы вошли в основной аппарат многих разделов современной математики, других естественных наук). Но оптимизационная задача может быть и такой, что предположение о точном задании её исходных данных находится в противоречии с её содержательным смыслом, и мы вынуждены учитывать возможную погрешность этих данных. Такие задачи часто встречаются в современном естествознании [5]. В этом случае неточность в задании их исходных данных, во-первых, резко диссонирует с основным предположением классической теории, требующим точного знания исходных данных оптимизационных задач при получении КУО, и, во-вторых, порождает необходимость учёта свойственной задачам условной оптимизации некорректности [6], влекущей, как следствие, некорректность самих КУО и потребность в их регуляризации (см., например, [710] и библиографию в этих работах).
Как известно, изучение различных связанных с КУО вопросов лежит в основе развития теории оптимизации распределённых систем. Многообразие, сложность и актуальность этих вопросов вот уже более шести десятков лет постоянно привлекают внимание исследователей [1113]. Отличительной чертой данной работы, продолжающей линию работ [9, 10], является исследование вопросов регуляризации КУО принципа Лагранжа и принципа максимума Понтрягина[1] — MathType@MTEF@5@5@+= feaahqart1ev3aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcqqaaaaaaaaGqSf 2yRbWdbeaaruWqHXwAIjxAaGqbaKqzGfaeaaaaaaaaa8GacaWFuaca aa@3C73@ в выпуклых задачах оптимального управления с операторными ограничениями для линейных распределённых систем вольтеррова типа. Так мы называем управляемые системы, которые могут быть описаны линейными функциональными (иначе, функционально-операторными) уравнениями второго рода общего вида с квазинильпотентным основным линейным оператором правой части. Подобным свойством обладают, прежде всего, различного рода вольтерровы операторы" href="#_ftn2" name="_ftnref2">[2]. Поэтому указанные уравнения можно назвать функциональными уравнениями вольтеррова типа. К таким уравнениям естественным образом (обращением главной части) сводятся самые разнообразные начально-краевые задачи для различных уравнений с частными производными: гиперболических, параболических, интегро-дифференциальных, систем таких уравнений, уравнений с запаздываниями разного рода и др. (см., например, конкретные примеры в [26, гл. 2], обзоры в [26, 28]). Это позволило в настоящей статье получить регуляризованные ПЛ и ПМП единообразно для широкого класса распределённых оптимизационных задач. При этом, как и в [9, 10], существенным образом используется предложенное нами ранее понятие равностепенной квазинильпотентности семейства операторов (историю вопроса см. в [28]). В качестве конкретного иллюстрирующего примера мы рассматриваем задачу оптимального управления, связанную с интегро-дифференциальным уравнением типа уравнения переноса, частным случаем которой является некоторая обратная задача финального наблюдения.
Главное назначение получаемых в данной работе и выражаемых в терминах регулярных классических функций Лагранжа и ГамильтонаПонтрягина регуляризованных КУО устойчивое конструктивное генерирование в рассматриваемой задаче оптимального управления обобщённых минимизирующих последовательностей минимизирующих приближённых решений (МПР)[3] в смысле Дж. Варги [29]. Регуляризованные КУО формулируются как теоремы существования в исходной задаче МПР, состоящих из минималей функции Лагранжа, двойственные переменные для которой генерируются в соответствии с процедурой регуляризации двойственной задачи. Ниже, как и в [9, 10], управляемая система вольтеррова типа задаётся линейным функционально-операторным уравнением второго рода общего вида в пространстве . При этом, как и в [9, 10], операторное ограничение-равенство задано в некотором гильбертовом пространстве, а для упрощения изложения и в соответствии с традициями теории оптимального управления множество допустимых управлений считаем ограниченным.
Данная работа является продолжением работ [9, 10]. Минимизируемый функционал в ней предполагается лишь выпуклым и не обязательно сильно выпуклым. Отметим, что регуляризация КУО в выпуклых задачах оптимального управления с не сильно выпуклыми целевыми функционалами рассматривалась нами в статье [30]. Покажем, в чём сходство и в чём существенное различие получаемых ниже и в [9, 10, 30] результатов.
В рассматриваемой ниже задаче, как и в [9, 10, 30], МПР конструируются из экстремалей (минималей) её функции Лагранжа, взятых при значениях двойственных переменных из некоторой последовательности, вырабатываемой соответствующей процедурой регуляризации двойственной задачи. При этом, как и в [10, 30], в качестве процедуры регуляризации двойственной задачи (эта задача является вогнутой) используется тихоновская стабилизация (см., например, [6, гл. 9]). Отметим, что в [9] с этой целью применяется процедура так называемой итеративной регуляризации [31].
Говоря о различиях, подчеркнём прежде всего, что целевой функционал в данной работе является функционалом общего вида и предполагается лишь выпуклым, тогда как в [9, 10] минимизируемые функционалы являются сильно выпуклыми с аддитивно разделёнными управлением и “фазой”. Далее, чтобы охарактеризовать отличие результатов данной статьи от результатов [30], целесообразно отметить сначала различие подходов [10] и [30]. В случае сильно выпуклого целевого функционала (как в [10]) сильно выпуклой по исходной переменной является и функция Лагранжа и, как следствие, однозначно и корректно определяются элементы МПР, соответствующие выбранной процедуре регуляризации двойственной задачи. В отсутствие же сильной выпуклости функционала качества (как в [30]) и, как следствие, в отсутствие сильной выпуклости функции Лагранжа по исходной переменной при ограниченном множестве допустимых элементов гарантируется лишь существование (но, вообще говоря, не единственность) элементов МПР (как элементов из множества минималей функции Лагранжа, взятых при соответствующих значениях двойственных переменных). В такой ситуации генерирование МПР в силу регуляризованных КУО в существенной степени теряет свою конструктивность. По этой причине ниже в преодоление указанного недостатка регуляризованных КУО в неитерационной форме [30], следуя методу работы [32], вместо одного используем два параметра регуляризации. Один из них, как и в [10, 30], “отвечает” за регуляризацию двойственной задачи, другой содержится в сильно выпуклой регуляризирующей тихоновской добавке к целевому функционалу исходной задачи, обеспечивая тем самым корректность задачи минимизации функции Лагранжа. Так, отказываясь от существенно используемого в [9, 10] условия сильной выпуклости функционала качества, мы “преодолеваем” допускаемую в [30] некорректность задачи минимизации функции Лагранжа. Последняя является базовой задачей во всех формулируемых ниже регуляризованных КУО.
Авторы настоящей статьи считают, что к совокупности методов преодоления свойств некорректности КУО следует относиться как к отдельному разделу теории некорректных задач. Проверка КУО на корректность является самостоятельной сложной математической задачей. В то же время их регуляризация даёт новый класс регуляризирующих алгоритмов регуляризованные КУО, обеспечивающие устойчивое генерирование МПР в оптимизационных задачах со сложными операторными ограничениями для целей практического решения большого числа актуальных естественнонаучных задач. Центральным при этом является введённое ранее в [32] и ориентированное на задачи условной оптимизации понятие МПР-образующего алгоритма (см. ниже определение )[4]. В своей основе эти новые регуляризирующие алгоритмы, формулируемые в терминах регулярных классических функций Лагранжа и ГамильтонаПонтрягина, опираются прежде всего на методы теории регуляризации и теории КУО, являясь, таким образом, продуктами “взаимовыгодного пересечения” двух указанных направлений математической теории.
Выделим важные на наш взгляд особенности получаемых в работе регуляризованных КУО, подчеркивающие актуальность формулируемых ниже результатов (связанные с этим подробности и поясняющие комментарии можно найти в [710]). Регуляризованные КУО: 1) не связаны с “труднопроверяемыми” условиями, используемыми обычно для гарантии выполнимости и устойчивости их классических аналогов; 2) являются секвенциальными обобщениями классических аналогов своих предельных вариантов, сохраняют их общую структуру и могут трактоваться как условия оптимальности, выраженные в секвенциальной форме; 3) “хорошо cопрягаются” с методом возмущений (см., например, [1, п. 3.3.2]), позволяющим, используя для исследования оптимизационных задач аппарат выпуклого анализа, связать свойства сходимости регуляризованных КУО с субдифференциальными свойствами функций значений этих задач (подробнее в п. 5).
Примем следующие обозначения и соглашения: пространство -векторов-столбцов; и евклидовы скалярное произведение и норма в ; векторы, если не оговорено противное, считаются столбцами; знак сопряжения и транспонирования; ограниченное и измеримое по Лебегу множество, играющее роль основного множества изменения независимых переменных, элементы которого обозначаем через ; лебегово пространство со стандартной нормой ( ); ( ); стандартная норма прямого произведения в ; стандартное скалярное произведение в ; пространство -матриц-функций с элементами из ; стандартная норма прямого произведения в ; некоторое гильбертово пространство со скалярным произведением и нормой ; характеристическая функция подотрезка отрезка ; множество всех неотрицательных чисел.
1. ПОСТАНОВКА ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
1.1. Базовая оптимизационная задача
Пусть заданы натуральные числа , , ; функция , из класса ; линейный ограниченный оператор (ЛОО) с нулевым спектральным радиусом; ЛОО . Рассмотрим линейное функциональное уравнение
(1)
считая управляющей функцией (управлением). Ввиду квазинильпотентности оператора уравнение (1) имеет для каждого единственное в решение , причём
(2)
где ЛОО сумма ряда Неймана , Отвечающее управлению решение уравнения (1), задаваемое формулой (2), обозначаем .
Чтобы поставить для управляемой системы (1) задачу оптимального управления, будем считать, что заданы ЛОО , ЛОО , элемент и выпуклые функционалы ( ). Используя (2) как формулу подстановки, зададим на функционалы ( ) и оператор Функционалы ( выпуклые. Пусть выпуклое ограниченное и замкнутое множество пространства . Рассмотрим задачу оптимального управления системой (1) c минимизируемым целевым функционалом при ограничениях
(3)
и множеством допустимых управлений Эту задачу символически запишем в виде
(4)
1.2. Точная и приближённые оптимизационные задачи
Задача (4) полностью определяется набором своих исходных данных
Предположим, что точные исходные данные нам не известны, но мы можем оперировать с приближёнными исходными данными
где меняющийся в некотором фиксированном полуинтервале числовой параметр, характеризующий близость приближённых данных к точным данным в указанном ниже условиями Б и В смысле (положительным значениям параметра соответствует приближённая оптимизационная задача вида (4) c данными , а значению точная оптимизационная задача вида (4) c данными ). Таким образом, считаем, что при каждом существуют следующие объекты: квазинильпотентный ЛОО ; ЛОО ; функция ; ЛОО ; ЛОО ; элемент ; выпуклые функционалы ( ).
Предполагаем, что выполняется
Условие А. Функционалы , , , липшицевы на каждом ограниченном множестве пространства , причём липшицевость равномерна по параметру , т.е. соответствующие постоянные Липшица не зависят от .
Считаем также, что приближённые исходные данные , , связаны с точными исходными данными приведёнными ниже условиями Б, В, Г.
Условие Б. Существует постоянная такая, что при любом имеем
(5)
Условие В. Существует неубывающая функция такая, что для каждого и любого при , выполняются неравенства
(6)
Чтобы сформулировать следующее условие, воспользуемся введённым нами ранее (см., например, [28]) понятием равностепенной квазинильпотентности. Пусть банахово пространство, некоторое множество, семейство зависящих от параметра квазинильпотентных ЛОО (квазинильпотентность ЛОО означает, что при ). Назовём семейство операторов равностепенно квазинильпотентным, если при .
Условие Г. Семейство равностепенно квазинильпотентно.
При любом управляемое функциональное уравнение
(7)
имеет для каждого единственное в классе решение , причём
(8)
где ЛОО сумма ряда Неймана , Отвечающее управлению и задаваемое формулой (8) решение уравнения (7) будем обозначать , . При любом имеем набор ограничений
(9)
где , ( ), и задачу оптимального управления
в которой , . Задачу ( ) называем точной задачей, а задачи ( ), , приближёнными задачами оптимального управления. Обозначим множество всех решений задачи ( ), которое может быть и пустым, через , а для его элементов будем использовать обозначение .
1.3. МПР и МПР-образующий оператор
Для компактности записи введём обозначение . Положим
и пусть . Определим обобщённую нижнюю грань задачи ( ) как предел , где , если , и , если . Вообще говоря, имеет место очевидное неравенство , где классическая нижняя грань задачи ( ). Однако в данном случае (см. ниже замечание ).
Напомним, что последовательность , , называется МПР задачи ( ), если при , причём для некоторой сходящейся к нулю последовательности положительных чисел , . Введём ещё одно основное понятие работы понятие МПР-образующего оператора (алгоритма) [32] в задаче ( ).
Определение 1. Пусть , , сходящаяся к нулю последовательность положительных чисел. Зависящий от , , оператор , ставящий в соответствие каждому набору исходных данных , удовлетворяющих оценкам (5), (6) при , элемент , называется МПР-образующим в задаче ( ), если последовательность , , есть МПР в этой задаче.
2. ЭКВИВАЛЕНТНАЯ ЗАДАЧА ВЫПУКЛОГО ПРОГРАММИРОВАНИЯ
2.1. Задача выпуклого программирования
Задача оптимального управления ( ) при любом имеет форму задачи выпуклого программирования в пространстве Перепишем её в несколько ином виде, позволяющем напрямую воспользоваться результатами работ [7, 32], посвящённых регуляризации КУО в задачах выпуклого программирования и выпуклого оптимального управления в гильбертовом пространстве. Для этого выделим в операторе линейную часть ЛОО :
(10)
Положим , . Очевидно, что при каждом задача оптимального управления ( ) эквивалентна задаче выпуклого программирования в (совпадают множества решений и значения этих задач):
Следствием условия А является равномерная по липшицевость функционалов ( ) на любом ограниченном множестве пространства : существует неубывающая функция такая, что при каждом для любого
Условия Б и Г дают такое свойство семейства операторов (см. [9, лемма 1]).
Лемма 1. Существует число такое, что ,
Из условий Б, В и Г простыми выкладками, используя лемму , получаем следующую связь входных данных задачи ( ) с входными данными задач ( ) при .
Лемма 2. Существует постоянная , зависящая лишь от операторов , , функционалов , функций , , чисел , , и множества , такая, что
(11)
2.2. МПР и МПР-образующий оператор в задаче выпуклого программирования
Имеем , , . Так как обобщённая нижняя грань задачи ( ) определяется фактически той же самой формулой, что и обобщённая нижняя грань задачи ( ), и эти грани совпадают, то мы сохраним за ней то же обозначение . Имеем , , если ; , если . Как уже отмечалось, имеет место очевидное неравенство , где классическая нижняя грань задачи ( ). Однако специфика задачи ( ) такова, что (см. ниже замечание ).
Определение 2. Последовательность элементов множества для которой существует такая стремящаяся к нулю последовательность положительных чисел что ( ) и при , называется минимизирующим приближённым решением задачи ( ).
Замечание 1. Так как ограниченное выпуклое замкнутое множество в гильбертовом пространстве слабо компактно, а непрерывный выпуклый функционал на таком множестве слабо полунепрерывен снизу, то всякая слабая предельная точка любого МПР в задаче ( ) является её решением. Поэтому для задачи ( ), а следовательно, и для эквивалетной задачи ( ). В случае сильной выпуклости непрерывного функционала каждое МПР как в задаче ( ), так и в задаче ( ) сильно сходится к единственному в этом случае решению задачи (см., например, [6, гл. 8, 2, теорема 10]).
Положим . Введём для задачи ( ) согласованное с понятием МПР понятие регуляризирующего оператора [32]. Набором исходных данных задачи ( ) является набор .
Определение 3. Зависящий от оператор , ставящий в соответствие каждому набору исходных данных , удовлетворяющих условиям (11), элемент , называется регуляризирующим в задаче ( ), если при , , при .
Введём понятие МПР-образующего оператора в задаче ( ) как задаче выпуклого программирования (согласованное с одноименным понятием в задаче ( )).
Определение 4. Пусть , , сходящаяся к нулю последовательность. Зависящий от , , оператор , ставящий в соответствие каждому набору исходных данных , удовлетворяющих условиям (11) при , элемент , называется МПР-образующим в задаче ( ), если последовательность , , есть МПР в этой задаче.
Наша задача ( ) является частным случаем задачи ( ) из [32]: набор исходных данных данной работы соответствует набору исходных данных в [32], т.е. к нашей задаче ( ) могут быть применены следующие результаты работы [32]: 1) теорема сходимости метода двойственной регуляризации с дополнительным параметром регуляризации в функционале цели [32, теорема 2]; 2) регуляризованный принцип Лагранжа для задачи выпуклого программирования с выпуклым (вообще говоря, не сильно выпуклым) целевым функционалом [32, теорема 3]. Естественно, мы можем переформулировать указанные теоремы [32] в терминах нашей задачи ( ) и эквивалентной ей задачи ( ); так как исходные данные этих наших задач связаны между собой простыми соотношениями (10) и , , сделаем это сразу в терминах задачи оптимального управления ( ).
3. РЕГУЛЯРИЗАЦИЯ КЛАССИЧЕСКИХ УСЛОВИЙ ОПТИМАЛЬНОСТИ В ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ РАСПРЕДЕЛЁННЫМИ СИСТЕМАМИ
Чтобы переформулировать указанные теоремы [32] в терминах нашей задачи ( ), введём необходимые конструкции. Прежде всего запишем регуляризованные задачи ( )
с (дополнительным) параметром регуляризации в целевом функционале. Очевидно, в каждой из задач ( ) c функционал качества является непрерывным и сильно выпуклым на с постоянной сильной выпуклости . При некоторых конкретных , задача ( ) может не иметь решения из-за возможной пустоты множества допустимых элементов. В случае же непустоты этого множества решение задачи ( ) существует и единственно, будем обозначать его . Примем при этом обозначение , напомнив, что через мы обозначаем элементы множества всех решений задачи ( ), которое может быть и пустым.
Введём регулярную функцию Лагранжа задачи ( )
где , , , . При любых , , и каждом функция сильно выпукла с постоянной сильной выпуклости и непрерывна как функция переменной в , а следовательно, достигает минимума при любых , на ограниченном выпуклом и замкнутом в множестве , причём в единственной точке, которую будем обозначать через (см., например, [6, гл. 8, 2, теорема 10]).
Двойственной к задаче оптимального управления ( ) является задача
Соответственно задача
является двойственной к задаче . Обозначим через единственную точку, дающую на максимум сильно вогнутому функционалу
Переформулируем теоремы 2 и 3 из [32] в терминах нашей задачи ( ).
3.1. Регуляризирующий двойственный алгоритм в задаче оптимального управления
Пусть некоторая положительнозначная функция такая, что
(12)
Теорему 2 из [32] (теорему сходимости метода двойственной регуляризации с дополнительным параметром регуляризации в функционале цели) переформулируем следующим образом.
Теорема 1 (регуляризирующий двойственный алгоритм в задаче оптимального управления). Пусть выполняется условие согласования (12), , , , последовательности сходящихся к нулю положительных чисел. Тогда оператор , ставящий в соответствие набору исходных данных , удовлетворяющих оценкам (5), (6) условий Б, В при , управление , является МПР-образующим в задаче оптимального управления ( ) в смысле определения 1.
3.2. Регуляризованный принцип Лагранжа в задаче оптимального управления
Теорема 3 из [32] (регуляризованный принцип Лагранжа для задачи выпуклого программирования с выпуклым (вообще говоря, не сильно выпуклым) целевым функционалом; подчеркнём, что его формулировка благодаря секвенциальному подходу учитывает одновременно как регулярный, так и нерегулярный случаи задачи) переформулируется так.
Теорема 2 (регуляризованный принцип Лагранжа для задачи ( )). Пусть произвольная фиксированная последовательность сходящихся к нулю положительных чисел. МПР в задаче ( ) существует тогда и только тогда, когда существуют стремящиеся к нулю последовательности положительных чисел , и последовательность пар векторов двойственных переменных такие, что
(13)
и выполняются включения
(14)
а также предельное соотношение
(15)
Если указанные последовательности , и существуют, то последовательность , , является МПР задачи ( ), т.е. помимо (??) выполняется и предельное соотношение (здесь )
Как следствие соотношений (??)(??) выполняется и предельное соотношение
Другими словами, вне зависимости от того, разрешима или нет двойственная к ( ) задача, алгоритм , задаваемый равенством для каждого набора исходных данных , удовлетворяющих оценкам (5), (6) условий Б, В при , является МПР-образующим в смысле определения , причём каждая слабая предельная точка последовательности , , является решением задачи ( ).
В качестве конкретной последовательности , , можно взять последовательность , , о которой идет речь в теореме .[5]
Замечание 2. Можно утверждать, что в случае сильной выпуклости функционала , генерируемая теоремой последовательность , , сильно сходится к единственному в этом случае решению задачи ( ) (см. замечание ), при этом можно считать , (см., например, теоремы 4.1, 4.2 в [7]).
3.3. О минимизации функции Лагранжа
Ключевой задачей процедуры двойственной регуляризации процесса приближённого решения задачи ( ), а также возможного применения регуляризованных КУО для практического решения задач оптимального управления, является задача минимизации функции (функционала) Лагранжа , задачи ( )
(16)
решение которой мы обозначили через . От “качества” решения этой “простейшей” задачи напрямую зависит и “качество” решения исходной задачи на основе регуляризованных КУО. Для упрощения изложения предположим, что при каждом функционалы ( ) дифференцируемы по Фреше. Тогда при каждых , дифференцируемы по Фреше функционалы ( ) и функционал Лагранжа . В этом случае решение выпуклой задачи на минимум (16) удовлетворяет критерию минимума
(17)
где производная Фреше функционала по переменной в точке при фиксированных , . Пусть функция Рисса линейного непрерывного функционала . Критерий (17) можно записать в виде
(18)
Найдём представление функции , , в терминах приближения ( ), , к точной задаче оптимального управления ( ), а точнее в терминах уравнения (7), операторов , и функционалов , , .
Пусть , функции Рисса функционалов , соответственно . По аналогии с [9, разд. 3.2] получаем
(19)
где единственное в решение уравнения
(20)
задаётся формулой
(21)
3.4. Случай ограниченных управлений
Рассмотрим задачу оптимального управления ( ) в ситуации, когда допустимые управления принимают значения из некоторого ограниченного замкнутого и выпуклого множества (т.е. , ). В этом случае получаем из (??) критерий минимума функционала Лагранжа в виде следующего линеаризованного поточечного принципа максимума, который доказывается точно так же как лемма 5 в статье [9].
Лемма 3. Функция является решением задачи (16) тогда и только тогда, когда
(22)
где задаётся формулой (??), в которой решение сопряжённого уравнения (20), а определяется формулой (??).
Обозначим через множество всех управлений из , удовлетворяющих (при сформулированных выше дополнительных условиях дифференцируемости) принципу максимума леммы . Очевидно, что в нашем случае, благодаря сильной выпуклости целевого функционала, множество состоит из одного элемента, обозначим его через , и справедливо равенство . Поэтому непосредственным следствием теоремы и леммы является регуляризованный ПМП для задачи ( ).
Теорема 3. (регуляризованный ПМП в задаче оптимального управления ). При сформулированных дополнительных условиях дифференцируемости все утверждения теоремы останутся справедливыми, если в них заменить на .
4. МЕТОД ВОЗМУЩЕНИЙ, СУБДИФФЕРЕНЦИАЛЫ И ПРЕДЕЛЬНЫЙ ПЕРЕХОД В РЕГУЛЯРИЗОВАННЫХ УСЛОВИЯХ ОПТИМАЛЬНОСТИ
Как отмечено во введении, одной из важных особенностей получаемых в работе регуляризованных КУО является то, что “в пределе” они приводят к своим классическим аналогам. Покажем это. Воспользуемся методом вомущений (см., например, [1, п. 3.3.2]), который позволяет установить жёсткую связь регуляризованных КУО с их классическими аналогами и обосновать новый секвенциальный способ получения КУО в выпуклых задачах на условный экстремум. Этот новый способ доказательства КУО, как необходимых условий оптимальности (доказательство начинается с предположения существования оптимального элемента), опирается на полученные ранее (см., например, [7, 8]) регуляризованные КУО в параметрических выпуклых задачах с сильно выпуклыми целевыми функционалами (до сих пор в настоящей работе рассматривались задачи без параметров). Для перехода к пределу в полученном регуляризованном ПЛ (см. теорему ) c применением метода возмущений рассмотрим вместо задачи ( ) параметрическую (зависящую от параметров в ограничениях) задачу
где , параметры. Задача ( ) формально включается в задачу ( ) при , ; . Соответственно возмущённая параметрическая задача будет иметь вид
Множество всех решений задачи ( ) обозначим через . Введём также обозначения
Определим зависящее от параметров , значение задачи ( ) как величину , , если ; , если . Как уже отмечалось, имеет место очевидное неравенство , где классическая нижняя грань задачи ( ). Однако специфика задачи ( ) (задача является выпуклой с выпуклым функционалом цели и ограниченным , см. замечание ) такова, что , причём величина достигается на любом оптимальном элементе , если не пусто.
Справедливы следующие две важные для применения метода возмущений леммы. Доказательство первой из них можно найти в работе [33, лемма 1.2], второй в [34, теорема 4.3]. Перед их формулировкой напомним о стандартных обозначениях и для соответственно эффективного множества и надграфика функции .
Лемма 4. Функция значений является полунепрерывной снизу и выпуклой.
Лемма 5. (плотность субдифференцируемости). Субдифференциал собственной выпуклой полунепрерывной снизу функции , где гильбертово пространство, не пуст в точках плотного в множества.
Ниже используется обозначение для сингулярного (асимптотического) субдифференциала выпуклой полунепрерывной снизу функции в точке , гильбертово пространство (см., например, [35]), определяемого формулой , где конус нормалей (в смысле выпуклого анализа) к в точке , при этом, как известно, субдифференциал в смысле выпуклого анализа.
Рассмотрим произвольную точку (например, может быть ). В этой точке реализуется хотя бы один из следующих трёх случаев:
1) ;
2) , ;
3) , .
Покажем, что в случаях 1) и 2) предельный переход в соотношениях регуляризованного ПЛ теоремы приводит к классическому ПЛ в рассматриваемой задаче ( ). Случай 3) соответствует ситуации, когда классический ПЛ в задаче ( ) не выполняется (см. теорему 1.1 в [33]).
Заметим, прежде всего, что функционал , является субдифференцируемым (в смысле выпуклого анализа) в точках (это следует из [34, теорема 4.2], так как он определён и непрерывен в точках ). Зафиксируем произвольное управление , где множество всех решений задачи ( ), которое считаем непустым. Рассмотрим вспомогательную задачу ( )
являющуюся задачей оптимального управления (и одновременно выпуклого программирования) с сильно выпуклым и субдифференцируемым целевым функционалом , , с функцией значений , для которой имеют место те же свойства, что и для . Решения этой задачи (единственные) существуют для любых , при этом, очевидно, . Её особенностью является то, что при всех имеет место неравенство , а в точке равенство . При этом и, стало быть, любая нормаль (в смысле выпуклого анализа) к надграфику в точке будет одновременно нормалью (в том же смысле) в той же точке и к надграфику .
Рассмотрим сначала случай 1), предположив, что . По этой причине в задаче с сильно выпуклым целевым функционалом имеет место , причём её единственным оптимальным элементом является . В этой ситуации к задаче может быть применён регуляризованный ПЛ теорем 4.1, 4.2 из [7], а также теоремы 2.4 в [8] (теорема данной работы, а также теорема 2 из [10] сформулированы для непараметрических задач). Пусть
функционал Лагранжа задачи
где , , , , , . При любых , и каждом функция сильно выпукла с постоянной сильной выпуклости, равной единице, и непрерывна как функция переменной в , а следовательно, достигает минимума на ограниченном выпуклом и замкнутом в множестве , причём в единственной точке (см., например, [6, гл. 8, 2, теорема 10]), которую обозначим через .
Двойственной к задаче выпуклого программирования ( ) является задача
Обозначим через единственную точку, дающую на максимум сильно вогнутому функционалу
Итак, в случае разрешимости двойственной к задачи, т.е. в случае , в соответствии с утверждениями указанных теорем из-за сильной сходимости соответствующих МПР , , , к оптимальному элементу задачи , а последовательности двойственных переменных к нормальному решению двойственной задачи
(23)
получаем в пределе при неравенство
(24)
и условие дополняющей нежёсткости
(25)
Таким образом, при , получаем следующие соотношения классического регулярного ПЛ в задаче :
Одновременно в каждой задаче с можно без ограничения общности считать последовательность двойственных переменных , , такой, что в предельном соотношении (23) элемент равен (см. замечание 2.4 и теорему 2.4 в [8]) любой точке, доставляющей максимальное значение в двойственной задаче , . Другими словами, так как совпадает с множеством всех точек максимума этой двойственной задачи, то в предельном соотношении (23) элемент можно считать равным любому фиксированному наперёд выбранному элементу субдифференциала , взятому с обратным знаком. Используем это свойство предельного соотношения (23) при анализе случая 2).
Итак, рассматриваем случай 2), когда , но . Тогда в соответствии со сказанным выше можем также утверждать, что . В этом случае для перехода к пределу в соотношениях теорем 4.1, 4.2 из [7] поступаем несколько иначе. Воспользуемся двумя важными фактами, связанными со свойствами субдифференцируемости выпуклой полунепрерывной снизу функции значений . Первый из них заключается в том, что каждая такая функция в гильбертовом пространстве является субдифференцируемой на плотном подмножестве её эффективного множества (см. лемму ). Второй же связан с известным представлением для асимптотического субдифференциала выпуклого полунепрерывного снизу функционала (см., например, [35, утверждение 4C2]), каковым и является функция значений (см. лемму ):
где символ означает, что , символ означает сходимость к нулю справа, а символ слабый предельный переход.
Умножим неравенство (24) на :
(26)
Для любой слабой предельной точки вида
с можем записать после очевидного предельного перехода в (26) при , , , , неравенство
(27)
Заметим, что при этом предельном переходе применялось предельное соотношение , , которое является следствием слабой сходимости к , числовой сходимости к при , субдифференцируемости в точках и сильной выпуклости функционала . Одновременно в силу условия дополняющей нежёсткости , , (см. (25)) в результате предельного перехода в нём при и уже применённого при получении (27) предельного соотношения , имеем , , что в совокупности с (27) и означает выполнимость нерегулярного невырожденного принципа Лагранжа. При этом мы аппроксимировали решение задачи ( ) точками , доставляющими минимальное значение функциям Лагранжа , , и учли равенство нулю величины при . Таким образом, при , получаем соотношения классического нерегулярного ПЛ в задаче .
И, наконец, пусть реализуется случай 3), когда , . Тогда классический ПЛ в задаче ( ) не выполняется (подробнее см. в [33, теорема 1.1], соответствующие примеры см. в [30]).
5. ПРИМЕР РЕГУЛЯРИЗАЦИИ КЛАССИЧЕСКИХ УСЛОВИЙ ОПТИМАЛЬНОСТИ В ЗАДАЧЕ ОПТИМИЗАЦИИ, СВЯЗАННОЙ С ИНТЕГРО-ДИФФЕРЕНЦИАЛЬНЫМ УРАВНЕНИЕМ ТИПА УРАВНЕНИЯ ПЕРЕНОСА
Естественный переход от начально-краевой задачи к эквивалентному ей функциональному уравнению второго рода вольтеррова типа осуществляется с помощью обращения главной части задачи. Разнообразные конкретные примеры начально-краевых задач (для параболических, гиперболических, интегро-дифференциальных уравнений с частными производными и систем таких уравнений, различных уравнений с запаздывающим аргументом и др.), которые допускают эквивалентное описание с помощью функциональных уравнений вольтеррова типа, можно найти, например, в [26] (см. также обзор в [28]). Из огромного множества разных подобных начально-краевых задач мы для иллюстрации изложенной выше теории выбрали начально-краевую задачу для интегро-дифференциального уравнения типа уравнения переноса. Выпишем основные конструкции, которые участвуют в формулировке регуляризованных КУО (формирующая критерий минимума функционала Лагранжа функция, сопряжённое уравнение и др.). Сформулировать с их помощью соответствующие регуляризованные КУО конкретные реализации теорем , , уже будет не сложно.
Пусть . Рассмотрим на следующую краевую задачу для линейного интегро-дифференциального уравнения (краевая задача (28) подобна смешанной задаче для простейшего линейного нестационарного интегро-дифференциального уравнения переноса, см., например, [3638]):
(28)
где , , , , , , фиксированные измеримые по совокупности переменных и ограниченные скалярные функции, управление. Левую часть уравнения в (28) понимаем как полную производную функции по переменной вдоль характеристики дифференциального выражения, стоящего в левой части. Такую производную от вдоль характеристик будем обозначать . Пусть класс всех функций из , абсолютно непрерывных вдоль почти любой характеристики, и таких, что . Функцию из назовём решением задачи (28), отвечающим управлению если она почти везде (по линейной мере) на почти каждой в удовлетворяет уравнению в (28) и почти всюду удовлетворяет краевым условиям в (28). Характеристика , проходящая через точку , задаётся уравнениями , , , где параметр. Она обязательно пересекает границу в одной из тех её частей, где или , или , , или , ; значение в соответствующей точке пересечения обозначим через . Из краевых условий в задаче (28) следует, что где
(29)
Формула
(30)
устанавливает взаимно однозначное соответствие между классом функций и классом удовлетворяющих краевым условиям в (28) функций из . Задача (28) заменой (30) сводится к эквивалентному функциональному уравнению (1) (это и есть в данном случае процедура обращения главной части краевой задачи (28)), здесь , , , ; , , ; ,
Так как ЛОО квазинильпотентен (это простое следствие признака [27, теорема 2]), то указанное уравнение (1), а вместе с ним и краевая задача (28), имеют единственное решение для любого . Отвечающее управлению решение задачи (28) связано с соответствующим решением уравнения (1) формулой (30).
Пусть и заданы: выпуклые функции , , ; функции , . Формулами
для определены функционалы. Пусть выпуклое ограниченное и замкнутое множество пространства . Рассмотрим задачу оптимального управления системой (28) c минимизируемым целевым функционалом при ограничениях
и множестве допустимых управлений Эту задачу символически запишем в виде
(31)
Сделав в задаче (31) замену (30), получим следующую эквивалентную задачу оптимизации соответствующей управляемой системы (1):
где приняты обозначения: Это задача вида (4), здесь , , .
Пусть набор входных данных задачи (31), которые могут подвергаться возмущению, и точный набор
нам не известен, но можно оперировать с приближёнными наборами
( фиксировано), которые связаны с набором следующими условиями.
Условие 1. Функции и выпуклы при любом и равномерно по липшицевы на любом ограниченном множестве.
Условие 2. Существует число такое, что величины , , , , , , , , при любом не превосходят величины .
Условие 3. Существует неубывающая функция такая, что для каждого и любого величины , при не превосходят .
При любом имеем управляемую краевую задачу
(32)
(её решение, отвечающее управлению , обозначаем через ), минимизируемый функционал , набор ограничений
где и задачу оптимального управления
(33)
Сделав в задаче (33) соответствующую обращению главной части краевой задачи (32) подстановку , , где определяется формулой (29) c заменой , , на , , соответственно, получим эквивалентную задачу оптимизации системы (7), в которой , , , ; , , ;
Запишем её в виде
(34)
где , , .
Задача (34) имеет вид ( ), здесь . Воспользовавшись выкладками [10, пример 2], находим, что при сделанных относительно семейства задач (33), , предположениях семейство задач (34), , удовлетворяет условиям АГ.
Предположив дополнительно, что функции , гладкие, можем выписать для данного примера критерии (??) и (??) решения задачи (16). Операторы, сопряжённые к и , имеют вид
здесь значение в точке пересечения характеристикой той части границы , где либо , либо , , либо , . Положим: ; ; при , и при , ; при , ; при , . Непосредственно вычисляя, получаем
т.е. сопряжённое уравнение (20) имеет вид
(35)
Оно является функциональным (интегральным) уравнением вольтеррова типа, а функция формирующая критерии (??) и (??), которым удовлетворяет решение задачи (16), задаётся формулой
где решение уравнения (35). Единственное в решение этого уравнения принадлежит классу . Уравнение (35) эквивалентно краевой задаче
основное уравнение которой получается из (35) дифференцированием вдоль характеристик, а краевые условия подстановками соответствующих значений независимых переменных.
ЗАКЛЮЧЕНИЕ
Получены регуляризованные принцип Лагранжа и принцип максимума Понтрягина в выпуклой задаче оптимального управления для управляемой системы, задаваемой линейным функционально-операторнымуравнением второго рода общего вида в пространстве (основной оператор правой части уравнения предполагается квазинильпотентным), с выпуклым (не обязательно сильно) целевым функционалом и операторными ограничениями. Показано, что “в пределе” регуляризованные ПЛ и ПМП приводят к своим классическим аналогам. Указанные результаты “расшифрованы” применительно к конкретной задаче рассматриваемого класса, связанной с интегро-дифференциальным уравнением типа уравнения переноса.