Содержание

1 Случай линейной системы
- 1.1 Общая постановка линейной задачи быстродействия
- 1.2 Принцип максимума Понтрягина для линейной задачи быстродействия
  - 1.2.1 Теорема (Принцип максимума Понтрягина)
2 Случай нелинейной системы
- 2.1 Общая задача оптимального управления
  - 2.1.1 Постановка задачи оптимального управления в общем виде
  - 2.1.2 Принцип максимума Понтрягина для общей задачи оптимального управления
- 2.2 Нелинейная задача быстродействия
  - 2.2.1 Постановка нелинейной задачи быстродействия
  - 2.2.2 Принцип максимума Понтрягина для нелинейной задачи быстродействия
    - 2.2.2.1 Теорема (Принцип максимума Понтрягина для нелинейной задачи быстродействия)

Случай линейной системы

Общая постановка линейной задачи быстродействия

В самом общем случае линейная задача быстродействия имеет следующую постановку:

\[ \begin{cases} \dot x(t) = A(t)x(t) + B(t)u(t) + f(t), \quad t \in \left[ t_{0}, t_{1} \right]\\ x, f \in \mathbb{R}^{n}, \quad A \in \mathbb{R}^{n\times n}, \quad u \in \mathbb{R}^{m}, \quad B \in \mathbb{R}^{n\times m}, \\ A(\cdot), B{(\cdot)}, f(\cdot) \in C\left[t_{0}, t_{1} \right]\\ u(t) \in \mathcal{P}(t), \quad \forall t\\ x(t_{0}) \in \mathcal{X}_{0} \in \text{conv}\;\mathbb{R}^{n}, \quad x(t_{1}) \in \mathcal{X}_{1} \in \text{conv} \mathbb{R}^{n}\\ J = t_{1} - t_{0} \rightarrow \min \end{cases} \]

Здесь \(\mathcal{X}_{0}\) - начальное множество значений фазового вектора, \(\mathcal{X}_{1}\) - целевое множество значений фазового вектора, \(\mathcal{P}(\cdot)\) - область управления. Считаем, что допустимое управление принадлежит классу кусочно-непрерывных функций.

Принцип максимума Понтрягина для линейной задачи быстродействия

Необходимым условием оптимальности управления является принцип максимума Понтрягина. Сформулируем его для линейной задачи быстродействия, поставленной в общем виде.

Теорема (Принцип максимума Понтрягина)

Пусть \( \{ x^{*}(\cdot), \; u^{*}(\cdot) \} \) - оптимальная пара для линейной задачи быстродействия. Тогда существует непрерывная функция \( \psi(t) \), определенная при \( t \geqslant t_{0} \), являющаяся нетривиальным решением системы

\[ \begin{cases} \dot \psi(t) = -A^{T}(t)\psi(t) \\ \psi(t_{0}) = \psi_{0} \neq \theta \end{cases} \]

и такая, что выполнены условия:

\(\langle\psi(t), B(t)u^{*}(t)\rangle = \rho\left(\psi(t)| B(t) \mathcal{P}(t)\right) \quad\)(принцип максимума),
\(\langle\psi(t_{0}), x^{*}(t_{0})\rangle = \rho(\psi(t_{0})| \mathcal{X}_{0}) \quad\)(условие трансверсальности на левом конце),
\(\langle-\psi(t_{1}), x^{*}(t_{1})\rangle = \rho(-\psi(t_{1})| \mathcal{X}_{1}) \quad\)(условие трансверсальности на правом конце).

Случай нелинейной системы

Общая задача оптимального управления

Постановка задачи оптимального управления в общем виде

Сформулируем задачу оптимального управления для автономной нелинейной системы в общем виде.

Пусть имеется управляемый процесс, описываемый автономной системой обыкновенных дифференциальных уравнений:

\[ \begin{cases} \dot x^{1} = f^{1}\left(x^{1}(t), \ldots , x^{n}(t), u^{1}(t), \ldots , u^{m}(t) \right) \\ \dot x^{2} = f^{2}\left(x^{1}(t), \ldots , x^{n}(t), u^{1}(t), \ldots , u^{m}(t) \right) \\ \cdots \\ \dot x^{n} = f^{n}\left(x^{1}(t), \ldots , x^{n}(t), u^{1}(t), \ldots , u^{m}(t) \right), \\ \end{cases} \]

или, в векторной форме:

\[ \dot x = f(x, u), \\ \]

где \(x = (x^{1}, \ldots , x^{n})', \;f = (f^{1}, \ldots , f^{n})', \; u=(u^{1}, \ldots, u^{m})'\). Здесь \(t\) - время, \(x^1, \,\ldots\,, x^n\) - фазовые координаты управляемого объекта, определяющие его состояние в каждый момент времени \(t\), и \(u^1, \,\ldots\,, u^m\) - параметры управления, определяющие ход процесса.

Функции \( f^{i}(x, u), \; i=\overline{1, n} \), предполагаются непрерывными по совокупности переменных \( (x, \,u) \) и непрерывно дифференцируемыми по \( x \). Заметим, что данная система автономна, то есть правые ее части не зависят явно от времени \( t \).

Класс допустимых управлений состоит из кусочно-непрерывных функций \(u(t)\) со значениями в некотором множестве \(U \subset \mathbb{R}^m \), называемом областью управления. В фазовом пространстве заданы начальное множество \( S_{0} \) и целевое множество \( S_{1} \), являющиеся гладкими многообразиями. Фиксирован начальный момент времени \(t_0\).

Пусть, далее, задана еще одна функция \(f^{0}(x, u)\), непрерывная по совокупности переменных \((x, u)\) и непрерывно дифференцируемая по \(x\).

Требуется найти допустимое управление \(u(t)\), которое переводит фазовую точку из некоторого (заранее не заданного) положения \(x_{0} \in S_{0}\) в момент времени \(t_0\) в некоторое (заранее не заданное) положение \(x_{1} \in S_{1}\) в момент времени \(t_1\), и на котором функционал

\[ J = \int\limits_{t_{0}}^{t_{1}} f^{0}(x(t), u(t)) dt \]

достигает своего минимального значения (здесь \(t_1\) - конечный момент времени, не фиксирован).

Принцип максимума Понтрягина для общей задачи оптимального управления

Сформулируем принцип максимума Понтрягина для общей задачи оптимального управления, введя предварительно несколько определений и обозначений.

Определение 1

Функция \( \mathcal{H}(\tilde\psi, x, u)=\mathcal{H}(\psi_{0}, \psi, x, u) = \psi_{0}f^{0}(x,u)+\langle\psi,f(x,u)\rangle \) называется функцией Гамильтона–Понтрягина. Здесь \( \ \tilde\psi = (\psi_0, \psi)' = (\psi_0, \psi_{1}, \ldots, \psi_{n})' \) – сопряженные переменные.

Определение 2

Пусть \( \psi:\left[t_{0},\;t_{1}\right] \rightarrow \mathbb{R}^{n} \). Сопряженной системой называется следующая система обыкновенных дифференциальных уравнений:

\[ \frac{d\psi}{dt} = -\frac{\partial\mathcal{H}}{\partial x}. \]

Обозначим \( \mathcal{M}(\psi_{0}, \psi, x) = \sup\limits_{u(\cdot)} \mathcal{H}(\psi_{0}, \psi, x, u) \).

Пусть \(x_{0} \in S_{0}\) и \(x_{1} \in S_{1}\) – некоторые точки, а \(T_{0}\) и \(T_{1}\) – касательные плоскости, проведенные к многообразиям \(S_{0}\) и \(S_{1}\) в этих точках.

Справедлива следующая теорема.

Теорема (Принцип максимума Понтрягина)

Пусть \(u(t), \; t_{0} \leqslant t \leqslant t_{1}\) – допустимое управление, переводящее фазовую точку из некоторого положения \(x_{0} \in S_{0}\) в положение \(x_{1} \in S_{1}\), а \(x(t)\) - соответствующая траектория. Для того, чтобы пара \(\{x(\cdot), u(\cdot)\}\) была оптимальной для задачи оптимального управления с подвижными концами, необходимо существование такой непрерывной и отличной от тождественного нуля вектор-функции \(\tilde\psi:\left[t_0,\;t_1\right] \rightarrow \mathbb{R}^{n+1}\), \(\tilde\psi(t) = \left(\psi_0(t), \; \psi(t)\right) \), удовлетворяющей сопряженной системе, что

\( \mathcal{H}(\psi_{0}, \psi, x, u) = \mathcal{M}(\psi_{0}, \psi, x) \equiv 0 \), при любом \(t \in \left[t_{0}, t_{1}\right]\);
\( \psi_{0} = const \leqslant 0;\)
\( \psi(t_{0}) \perp T_0\) (Условие трансверсальности на левом конце);
\( \psi(t_{1}) \perp T_{1}\) (Условие трансверсальности на правом конце).

Нелинейная задача быстродействия

Постановка нелинейной задачи быстродействия

Нелинейная задача быстродействия представляет собой общую задачу оптимального управления, в которой функционал \( J \) имеет следующий вид:

\[ J = t_1 - t_0. \]

Другими словами, это общая задача ОУ, в которой \(f^0(x,u)\equiv 1\).

Принцип максимума Понтрягина для нелинейной задачи быстродействия

Выведем теперь Принцип максимума Понтрягина для оптимальности по быстродействию. Для этого в принципе максимума для общей задачи ОУ следует положить \(f^0(x,u)\equiv 1\). Функция \( \mathcal{H} \) принимает в этом случае следующий вид:

\[ \mathcal{H} = \psi_0 + \sum_{i=1}^{n} \psi_i f^i(x,u). \]

Имея \( n \)-мерный вектор \(\psi=(\psi_1,\ldots,\psi_n) \) и вводя функцию

\[ H(\psi, x, u) = \langle\psi, f\rangle = \sum_{i=1}^{n} \psi_i f^i(x,u) \]

мы можем записать сопряженную систему в следующем модифицированном виде:

\[ \frac{d\psi}{dt}=-\frac{\partial H}{\partial x}. \]

При фиксированных значениях \(\psi\) и \(x\) функция \(H\) становится функцией параметра \(u\); верхнюю грань значений этой функции мы обозначим через \(M(\psi, x)\):

\[ M(\psi,x)=\sup_{u \in U} H(\psi, x, u). \]

В силу соотношения \(H(\psi, x, u) = \mathcal{H}(\psi, x, u) - \psi_0\) мы получаем

\[ M(\psi,x)=\mathcal{M}(\psi, x) - \psi_0, \]

и потому условия 1 и 2 принципа максимума для общей задачи ОУ принимают теперь вид

\[ H(\psi(t),x(t),u(t)) = M(\psi(t), x(t)) = -\psi_0 \geqslant 0. \]

Таким образом, мы получаем следующую теорему.

Теорема (Принцип максимума Понтрягина для нелинейной задачи быстродействия)

Пусть \(u(t), \; t_{0} \leqslant t \leqslant t_{1}\) – допустимое управление, переводящее фазовую точку из некоторого положения \(x_{0} \in S_{0}\) в положение \(x_{1} \in S_{1}\), а \(x(t)\) - соответствующая траектория. Для того, чтобы пара \(\{x(\cdot), u(\cdot)\}\) была оптимальной для задачи оптимального быстродействия, необходимо существование такой непрерывной и отличной от тождественного нуля вектор-функции \(\psi:\left[t_0,\;t_1\right] \rightarrow \mathbb{R}^{n}\), удовлетворяющей модифицированной сопряженной системе, что

\( H(\psi, x, u) = M(\psi, x) = const \geqslant 0 \), при любом \(t \in \left[t_{0}, t_{1}\right]\);
\( \psi(t_{0}) \perp T_0\) (Условие трансверсальности на левом конце);
\( \psi(t_{1}) \perp T_{1}\) (Условие трансверсальности на правом конце).

Принцип максимума для задачи быстродействия

Содержание

Случай линейной системы

Общая постановка линейной задачи быстродействия

Принцип максимума Понтрягина для линейной задачи быстродействия

Теорема (Принцип максимума Понтрягина)

Случай нелинейной системы

Общая задача оптимального управления

Постановка задачи оптимального управления в общем виде

Принцип максимума Понтрягина для общей задачи оптимального управления

Определение 1

Определение 2

Теорема (Принцип максимума Понтрягина)

Нелинейная задача быстродействия

Постановка нелинейной задачи быстродействия

Принцип максимума Понтрягина для нелинейной задачи быстродействия

Теорема (Принцип максимума Понтрягина для нелинейной задачи быстродействия)

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты