Принцип максимума для задачи быстродействия: различия между версиями

Материал из sawiki
Перейти к навигации Перейти к поиску
Строка 74: Строка 74:
 
достигает своего минимального значения (здесь \(t_1\) - конечный момент времени, не фиксирован).
 
достигает своего минимального значения (здесь \(t_1\) - конечный момент времени, не фиксирован).
  
== Принцип максимума Понтрягина для общей задачи оптимального управления ==
+
Сформулируем принцип максимума Понтрягина для общей задачи оптимального управления введя предварительно несколько определений и обозначений.
  
==== Теорема (Принцип максимума Понтрягина) ====
+
\begin{definition}
Пусть \( \{ x^{*}(\cdot), \; u^{*}(\cdot) \} \) - оптимальная пара для нелинейной задачи быстродействия с автономной системой. Тогда существует непрерывная функция \( \psi(t) \), определенная при \( t \geqslant t_{0} \), являющаяся нетривиальным решением системы
+
Функция $\mathcal{H}(\tilde\psi, x, u)=\mathcal{H}(\psi_{0}, \psi, x, u) = \psi_{0}f^{0}(x,u)+\langle\psi,f(x,u)\rangle$ называется {\it функцией Гамильтона--Понтрягина}. Здесь $\ \tilde\psi = (\psi_0, \psi)' = (\psi_0, \psi_{1}, \ldots, \psi_{n})'$ -- сопряженные переменные.
 +
\end{definition}
 +
 
 +
\begin{definition}
 +
Пусть $\psi:\left[t_{0},\;t_{1}\right] \rightarrow \mathbb{R}^{n}$. Сопряженной системой называется следующая система обыкновенных дифференциальных уравнений:
 +
\begin{equation}\label{soprsyst}
 +
    \frac{d\psi}{dt} = -\frac{\partial\mathcal{H}}{\partial x}.
 +
\end{equation}
 +
\end{definition}
 +
 
 +
 +
Обозначим $\mathcal{M}(\psi_{0}, \psi, x) = \sup\limits_{u(\cdot)} \mathcal{H}(\psi_{0}, \psi, x, u)$.
 +
 
 +
Пусть $x_{0} \in S_{0}$ и $x_{1} \in S_{1}$ -- некоторые точки, а $T_{0}$ и $T_{1}$ -- касательные плоскости, проведенные к многообразиям $S_{0}$ и $S_{1}$ в этих точках.
 +
 
 +
Справедлива следующая теорема.
 +
 
 +
\begin{theorem}
 +
(Принцип максимума Понтрягина) Пусть $u(t), \; t_{0} \leqslant t \leqslant t_{1}$ -- допустимое управление, переводящее фазовую точку из некоторого положения  $x_{0} \in S_{0}$ в положение $x_{1} \in S_{1}$, а $x(t)$ -- соответствующая траектория. Для того, чтобы пара $\{x(\cdot), u(\cdot)\}$ была оптимальной для задачи оптимального управления с подвижными концами, необходимо существование такой непрерывной и отличной от тождественного нуля вектор-функции $\tilde\psi:\left[t_0,\;t_1\right] \rightarrow \mathbb{R}^{n+1}$, $\tilde\psi(t) = \left(\psi_0(t), \; \psi(t)\right) $, удовлетворяющей сопряженной системе $(\ref{soprsyst})$, что
 +
\begin{enumerate}
 +
    \item $\mathcal{H}(\psi_{0}, \psi, x, u) = \mathcal{M}(\psi_{0}, \psi, x)$, при любом $t \in \left[t_{0}, t_{1}\right]$;
 +
    \item $\psi_{0} = const \leqslant 0;$
 +
    \item $\psi(t_{0}) \perp T_0$ (Условие трансверсальности на левом конце);
 +
    \item $\psi(t_{1}) \perp T_{1}$ (Условие трансверсальности на правом конце).
 +
\end{enumerate}
 +
\end{theorem}

Версия 18:45, 13 декабря 2021

Случай линейной системы

Общая постановка линейной задачи быстродействия

В самом общем случае линейная задача быстродействия имеет следующую постановку:

\[ \begin{cases} \dot x(t) = A(t)x(t) + B(t)u(t) + f(t), \quad t \in \left[ t_{0}, t_{1} \right]\\ x, f \in \mathbb{R}^{n}, \quad A \in \mathbb{R}^{n\times n}, \quad u \in \mathbb{R}^{m}, \quad B \in \mathbb{R}^{n\times m}, \\ A(\cdot), B{(\cdot)}, f(\cdot) \in C\left[t_{0}, t_{1} \right]\\ u(t) \in \mathcal{P}(t), \quad \forall t\\ x(t_{0}) \in \mathcal{X}_{0} \in \text{conv}\;\mathbb{R}^{n}, \quad x(t_{1}) \in \mathcal{X}_{1} \in \text{conv} \mathbb{R}^{n}\\ J = t_{1} - t_{0} \rightarrow \min \end{cases} \]

Здесь \(\mathcal{X}_{0}\) - начальное множество значений фазового вектора, \(\mathcal{X}_{1}\) - целевое множество значений фазового вектора, \(\mathcal{P}(\cdot)\) - область управления. Считаем, что допустимое управление принадлежит классу кусочно-непрерывных функций.

Принцип максимума Понтрягина для линейной задачи быстродействия

Необходимым условием оптимальности управления является принцип максимума Понтрягина. Сформулируем его для линейной задачи быстродействия, поставленной в общем виде.

Теорема (Принцип максимума Понтрягина)

Пусть \( \{ x^{*}(\cdot), \; u^{*}(\cdot) \} \) - оптимальная пара для линейной задачи быстродействия. Тогда существует непрерывная функция \( \psi(t) \), определенная при \( t \geqslant t_{0} \), являющаяся нетривиальным решением системы

\[ \begin{cases} \dot \psi(t) = -A^{T}(t)\psi(t) \\ \psi(t_{0}) = \psi_{0} \neq \theta \end{cases} \]

и такая, что выполнены условия:

  1. \(\langle\psi(t), B(t)u^{*}(t)\rangle = \rho\left(\psi(t)| B(t) \mathcal{P}(t)\right) \quad\)(принцип максимума),
  2. \(\langle\psi(t_{0}), x^{*}(t_{0})\rangle = \rho(\psi(t_{0})| \mathcal{X}_{0}) \quad\)(условие трансверсальности на левом конце),
  3. \(\langle-\psi(t_{1}), x^{*}(t_{1})\rangle = \rho(-\psi(t_{1})| \mathcal{X}_{1}) \quad\)(условие трансверсальности на правом конце).

Случай нелинейной системы

Общая постановка задачи оптимального управления

Сформулируем задачу оптимального управления для автономной нелинейной системы в общем виде.

Пусть имеется управляемый процесс, описываемый автономной системой обыкновенных дифференциальных уравнений:

\[ \begin{cases} \dot x^{1} = f^{1}\left(x^{1}(t), \ldots , x^{n}(t), u^{1}(t), \ldots , u^{m}(t) \right) \\ \dot x^{2} = f^{2}\left(x^{1}(t), \ldots , x^{n}(t), u^{1}(t), \ldots , u^{m}(t) \right) \\ \cdots \\ \dot x^{n} = f^{n}\left(x^{1}(t), \ldots , x^{n}(t), u^{1}(t), \ldots , u^{m}(t) \right), \\ \end{cases} \]

или, в векторной форме:

\[ \dot x = f(x, u), \\ \]

где \(x = (x^{1}, \ldots , x^{n})', \;f = (f^{1}, \ldots , f^{n})', \; u=(u^{1}, \ldots, u^{m})'\). Здесь \(t\) - время, \(x^1, \,\ldots\,, x^n\) - фазовые координаты управляемого объекта, определяющие его состояние в каждый момент времени \(t\), и \(u^1, \,\ldots\,, u^m\) - параметры управления, определяющие ход процесса.

Функции \( f^{i}(x, u), \; i=\overline{1, n} \), предполагаются непрерывными по совокупности переменных \( (x, \,u) \) и непрерывно дифференцируемыми по \( x \). Заметим, что данная система автономна, то есть правые ее части не зависят явно от времени \( t \).

Класс допустимых управлений состоит из кусочно-непрерывных функций \(u(t)\) со значениями в некотором множестве \(U \subset \mathbb{R}^m \), называемом областью управления. В фазовом пространстве заданы начальное множество \( S_{0} \) и целевое множество \( S_{1} \), являющиеся гладкими многообразиями. Фиксирован начальный момент времени \(t_0\).

Требуется найти допустимое управление \(u(t)\), которое переводит фазовую точку из некоторого (заранее не заданного) положения \(x_{0} \in S_{0}\) в момент времени \(t_0\) в некоторое (заранее не заданное) положение \(x_{1} \in S_{1}\) в момент времени \(t_1\), и на котором функционал

\[ J = \int\limits_{t_{0}}^{t_{1}} f^{0}(x(t), u(t)) dt \]

достигает своего минимального значения (здесь \(t_1\) - конечный момент времени, не фиксирован).

Сформулируем принцип максимума Понтрягина для общей задачи оптимального управления введя предварительно несколько определений и обозначений.

\begin{definition} Функция $\mathcal{H}(\tilde\psi, x, u)=\mathcal{H}(\psi_{0}, \psi, x, u) = \psi_{0}f^{0}(x,u)+\langle\psi,f(x,u)\rangle$ называется {\it функцией Гамильтона--Понтрягина}. Здесь $\ \tilde\psi = (\psi_0, \psi)' = (\psi_0, \psi_{1}, \ldots, \psi_{n})'$ -- сопряженные переменные. \end{definition}

\begin{definition} Пусть $\psi:\left[t_{0},\;t_{1}\right] \rightarrow \mathbb{R}^{n}$. Сопряженной системой называется следующая система обыкновенных дифференциальных уравнений: \begin{equation}\label{soprsyst} \frac{d\psi}{dt} = -\frac{\partial\mathcal{H}}{\partial x}. \end{equation} \end{definition}


Обозначим $\mathcal{M}(\psi_{0}, \psi, x) = \sup\limits_{u(\cdot)} \mathcal{H}(\psi_{0}, \psi, x, u)$.

Пусть $x_{0} \in S_{0}$ и $x_{1} \in S_{1}$ -- некоторые точки, а $T_{0}$ и $T_{1}$ -- касательные плоскости, проведенные к многообразиям $S_{0}$ и $S_{1}$ в этих точках.

Справедлива следующая теорема.

\begin{theorem} (Принцип максимума Понтрягина) Пусть $u(t), \; t_{0} \leqslant t \leqslant t_{1}$ -- допустимое управление, переводящее фазовую точку из некоторого положения $x_{0} \in S_{0}$ в положение $x_{1} \in S_{1}$, а $x(t)$ -- соответствующая траектория. Для того, чтобы пара $\{x(\cdot), u(\cdot)\}$ была оптимальной для задачи оптимального управления с подвижными концами, необходимо существование такой непрерывной и отличной от тождественного нуля вектор-функции $\tilde\psi:\left[t_0,\;t_1\right] \rightarrow \mathbb{R}^{n+1}$, $\tilde\psi(t) = \left(\psi_0(t), \; \psi(t)\right) $, удовлетворяющей сопряженной системе $(\ref{soprsyst})$, что \begin{enumerate} \item $\mathcal{H}(\psi_{0}, \psi, x, u) = \mathcal{M}(\psi_{0}, \psi, x)$, при любом $t \in \left[t_{0}, t_{1}\right]$; \item $\psi_{0} = const \leqslant 0;$ \item $\psi(t_{0}) \perp T_0$ (Условие трансверсальности на левом конце); \item $\psi(t_{1}) \perp T_{1}$ (Условие трансверсальности на правом конце). \end{enumerate} \end{theorem}