Принцип максимума Л.С. Понтрягина для общей задачи оптимального управления: различия между версиями

Материал из sawiki
Перейти к навигации Перейти к поиску
Строка 20: Строка 20:
 
Более того моменты времени \(t_0\) и \(t_1\) не предпологаются фиксированнымии, и все функции и отображения считаются непрерывно дифференцируемыми по времени.
 
Более того моменты времени \(t_0\) и \(t_1\) не предпологаются фиксированнымии, и все функции и отображения считаются непрерывно дифференцируемыми по времени.
  
Задачу \eqref{problem_begin} - \eqref{problem_end}.
+
Задачу \eqref{problem_begin} - \eqref{problem_end} заменой времени удобно свести к задаче с закрепленным временем (ССЫЛКА). Дело тут в том, что задачи с закрепленным временем естественно формулируются как задачи в некотором банаховом пространстве (что позволяет решать их как "обычные" экстремальные задачи), именно, в том или ином пространстве функций на заданном отрезке. Что касается задачи с незакрепленным временем, то ее, по видимому, нельзя сформулировать подобным образом без какого-либо ее преобразования, связанного, в частности с тем, что время трактуется как фазовая координата. При этом требование дифференцируемости по времени становится неизбежным. Более подробно, упомянутая замена обсуждается в (ССЫЛКА)
  
 
== Level 2 ==
 
== Level 2 ==

Версия 19:12, 17 декабря 2021

Общая задача оптимального управления

Постановка: \begin{gather} \mathfrak{J}(x(\cdot),u(\cdot)) = \int\limits_{t_0}^{t_1} f(t, x, u)\,dt \rightarrow \inf; \label{problem_begin}\\ \dot x = \varphi(t,x,u),\\ u \in U \subset \mathbb{R}^r,\\ h_0(x(t_0)) = h_1(x(t_1)) = 0,\\ g_i(t,x(t)) \leqslant 0,\quad t \in [t_0,t_1],\quad i = 1,\dots,k. \label{problem_end} \end{gather}

Предпологается, что функции \begin{equation*} f: \mathbb{R} \times \mathbb{R}^n \times \mathbb{R}^r \rightarrow \mathbb{R}, \quad g_i: \mathbb{R} \times \mathbb{R}^n \rightarrow \mathbb{R} \end{equation*} и отображения \begin{equation*} \varphi: \mathbb{R} \times \mathbb{R}^n \times \mathbb{R}^r \rightarrow \mathbb{R}^n,\quad h_l: \mathbb{R}^n \rightarrow \mathbb{R}^{s_l} \quad (l = 1, 2) \end{equation*} непрерывны и непрерывно дифференцируемы по \(x\). Более того моменты времени \(t_0\) и \(t_1\) не предпологаются фиксированнымии, и все функции и отображения считаются непрерывно дифференцируемыми по времени.

Задачу \eqref{problem_begin} - \eqref{problem_end} заменой времени удобно свести к задаче с закрепленным временем (ССЫЛКА). Дело тут в том, что задачи с закрепленным временем естественно формулируются как задачи в некотором банаховом пространстве (что позволяет решать их как "обычные" экстремальные задачи), именно, в том или ином пространстве функций на заданном отрезке. Что касается задачи с незакрепленным временем, то ее, по видимому, нельзя сформулировать подобным образом без какого-либо ее преобразования, связанного, в частности с тем, что время трактуется как фазовая координата. При этом требование дифференцируемости по времени становится неизбежным. Более подробно, упомянутая замена обсуждается в (ССЫЛКА)

Level 2

Принцип максимума в гамильтоновой форме

Теорема. Пусть \( (x_*(\cdot), u_*(\cdot)) \) --- оптимальный управляемый процесс в задаче !!(ссылка на задачу с закрепленным временем)!!. Тогда существуют не равные одновременно нулю число \( \lambda_0 \), векторы \( l_0 \in \mathbb{R}^{s_0}, \ l_1 \in \mathbb{R}^{s_1},\) вектор-функция \( p(\cdot):[t_0, t_1] \to \mathbb{R}^n \) и неотрицательные регулярные меры \( \mu_i, i = 1, \dots, k, \) на \( [t_0, t_1] \), сосредоточенные соответсвенно на множествах

Level 2