Версия 20:45, 13 декабря 2021

Содержание

1 Случай линейной системы
- 1.1 Общая постановка линейной задачи быстродействия
- 1.2 Принцип максимума Понтрягина для линейной задачи быстродействия
  - 1.2.1 Теорема (Принцип максимума Понтрягина)
2 Случай нелинейной системы
- 2.1 Общая задача оптимального управления
  - 2.1.1 Постановка задачи оптимального управления в общем виде
  - 2.1.2 Принцип максимума Понтрягина для общей задачи оптимального управления
- 2.2 Нелинейная задача быстродействия
  - 2.2.1 Постановка нелинейной задачи быстродействия

Случай линейной системы

Общая постановка линейной задачи быстродействия

В самом общем случае линейная задача быстродействия имеет следующую постановку:

\[ \begin{cases} \dot x(t) = A(t)x(t) + B(t)u(t) + f(t), \quad t \in \left[ t_{0}, t_{1} \right]\\ x, f \in \mathbb{R}^{n}, \quad A \in \mathbb{R}^{n\times n}, \quad u \in \mathbb{R}^{m}, \quad B \in \mathbb{R}^{n\times m}, \\ A(\cdot), B{(\cdot)}, f(\cdot) \in C\left[t_{0}, t_{1} \right]\\ u(t) \in \mathcal{P}(t), \quad \forall t\\ x(t_{0}) \in \mathcal{X}_{0} \in \text{conv}\;\mathbb{R}^{n}, \quad x(t_{1}) \in \mathcal{X}_{1} \in \text{conv} \mathbb{R}^{n}\\ J = t_{1} - t_{0} \rightarrow \min \end{cases} \]

Здесь \(\mathcal{X}_{0}\) - начальное множество значений фазового вектора, \(\mathcal{X}_{1}\) - целевое множество значений фазового вектора, \(\mathcal{P}(\cdot)\) - область управления. Считаем, что допустимое управление принадлежит классу кусочно-непрерывных функций.

Принцип максимума Понтрягина для линейной задачи быстродействия

Необходимым условием оптимальности управления является принцип максимума Понтрягина. Сформулируем его для линейной задачи быстродействия, поставленной в общем виде.

Теорема (Принцип максимума Понтрягина)

Пусть \( \{ x^{*}(\cdot), \; u^{*}(\cdot) \} \) - оптимальная пара для линейной задачи быстродействия. Тогда существует непрерывная функция \( \psi(t) \), определенная при \( t \geqslant t_{0} \), являющаяся нетривиальным решением системы

\[ \begin{cases} \dot \psi(t) = -A^{T}(t)\psi(t) \\ \psi(t_{0}) = \psi_{0} \neq \theta \end{cases} \]

и такая, что выполнены условия:

\(\langle\psi(t), B(t)u^{*}(t)\rangle = \rho\left(\psi(t)| B(t) \mathcal{P}(t)\right) \quad\)(принцип максимума),
\(\langle\psi(t_{0}), x^{*}(t_{0})\rangle = \rho(\psi(t_{0})| \mathcal{X}_{0}) \quad\)(условие трансверсальности на левом конце),
\(\langle-\psi(t_{1}), x^{*}(t_{1})\rangle = \rho(-\psi(t_{1})| \mathcal{X}_{1}) \quad\)(условие трансверсальности на правом конце).

Случай нелинейной системы

Общая задача оптимального управления

Постановка задачи оптимального управления в общем виде

Сформулируем задачу оптимального управления для автономной нелинейной системы в общем виде.

Пусть имеется управляемый процесс, описываемый автономной системой обыкновенных дифференциальных уравнений:

\[ \begin{cases} \dot x^{1} = f^{1}\left(x^{1}(t), \ldots , x^{n}(t), u^{1}(t), \ldots , u^{m}(t) \right) \\ \dot x^{2} = f^{2}\left(x^{1}(t), \ldots , x^{n}(t), u^{1}(t), \ldots , u^{m}(t) \right) \\ \cdots \\ \dot x^{n} = f^{n}\left(x^{1}(t), \ldots , x^{n}(t), u^{1}(t), \ldots , u^{m}(t) \right), \\ \end{cases} \]

или, в векторной форме:

\[ \dot x = f(x, u), \\ \]

где \(x = (x^{1}, \ldots , x^{n})', \;f = (f^{1}, \ldots , f^{n})', \; u=(u^{1}, \ldots, u^{m})'\). Здесь \(t\) - время, \(x^1, \,\ldots\,, x^n\) - фазовые координаты управляемого объекта, определяющие его состояние в каждый момент времени \(t\), и \(u^1, \,\ldots\,, u^m\) - параметры управления, определяющие ход процесса.

Функции \( f^{i}(x, u), \; i=\overline{1, n} \), предполагаются непрерывными по совокупности переменных \( (x, \,u) \) и непрерывно дифференцируемыми по \( x \). Заметим, что данная система автономна, то есть правые ее части не зависят явно от времени \( t \).

Класс допустимых управлений состоит из кусочно-непрерывных функций \(u(t)\) со значениями в некотором множестве \(U \subset \mathbb{R}^m \), называемом областью управления. В фазовом пространстве заданы начальное множество \( S_{0} \) и целевое множество \( S_{1} \), являющиеся гладкими многообразиями. Фиксирован начальный момент времени \(t_0\).

Пусть, далее, задана еще одна функция \(f^{0}(x, u)\), непрерывная по совокупности переменных \((x, u)\) и непрерывно дифференцируемая по \(x\).

Требуется найти допустимое управление \(u(t)\), которое переводит фазовую точку из некоторого (заранее не заданного) положения \(x_{0} \in S_{0}\) в момент времени \(t_0\) в некоторое (заранее не заданное) положение \(x_{1} \in S_{1}\) в момент времени \(t_1\), и на котором функционал

\[ J = \int\limits_{t_{0}}^{t_{1}} f^{0}(x(t), u(t)) dt \]

достигает своего минимального значения (здесь \(t_1\) - конечный момент времени, не фиксирован).

Принцип максимума Понтрягина для общей задачи оптимального управления

Сформулируем принцип максимума Понтрягина для общей задачи оптимального управления, введя предварительно несколько определений и обозначений.

Определение 1

Функция \( \mathcal{H}(\tilde\psi, x, u)=\mathcal{H}(\psi_{0}, \psi, x, u) = \psi_{0}f^{0}(x,u)+\langle\psi,f(x,u)\rangle \) называется функцией Гамильтона–Понтрягина. Здесь \( \ \tilde\psi = (\psi_0, \psi)' = (\psi_0, \psi_{1}, \ldots, \psi_{n})' \) – сопряженные переменные.

Определение 2

Пусть \( \psi:\left[t_{0},\;t_{1}\right] \rightarrow \mathbb{R}^{n} \). Сопряженной системой называется следующая система обыкновенных дифференциальных уравнений:

\[ \frac{d\psi}{dt} = -\frac{\partial\mathcal{H}}{\partial x}. \]

Обозначим \( \mathcal{M}(\psi_{0}, \psi, x) = \sup\limits_{u(\cdot)} \mathcal{H}(\psi_{0}, \psi, x, u) \).

Пусть \(x_{0} \in S_{0}\) и \(x_{1} \in S_{1}\) – некоторые точки, а \(T_{0}\) и \(T_{1}\) – касательные плоскости, проведенные к многообразиям \(S_{0}\) и \(S_{1}\) в этих точках.

Справедлива следующая теорема.

Теорема (Принцип максимума Понтрягина)

Пусть \(u(t), \; t_{0} \leqslant t \leqslant t_{1}\) – допустимое управление, переводящее фазовую точку из некоторого положения \(x_{0} \in S_{0}\) в положение \(x_{1} \in S_{1}\), а \(x(t)\) - соответствующая траектория. Для того, чтобы пара \(\{x(\cdot), u(\cdot)\}\) была оптимальной для задачи оптимального управления с подвижными концами, необходимо существование такой непрерывной и отличной от тождественного нуля вектор-функции \(\tilde\psi:\left[t_0,\;t_1\right] \rightarrow \mathbb{R}^{n+1}\), \(\tilde\psi(t) = \left(\psi_0(t), \; \psi(t)\right) \), удовлетворяющей сопряженной системе, что

\( \mathcal{H}(\psi_{0}, \psi, x, u) = \mathcal{M}(\psi_{0}, \psi, x)\), при любом \(t \in \left[t_{0}, t_{1}\right]\);
\( \psi_{0} = const \leqslant 0;\)
\( \psi(t_{0}) \perp T_0\) (Условие трансверсальности на левом конце);
\( \psi(t_{1}) \perp T_{1}\) (Условие трансверсальности на правом конце).

Нелинейная задача быстродействия

Постановка нелинейной задачи быстродействия

Нелинейная задача быстродействия представляет собой задачу оптимального управления, в которой функционал \(J)\ имеет следующий вид:

\[ J = t_1 - t_0. \]

@@ Строка 107: / Строка 107: @@
 == Нелинейная задача быстродействия ==
+=== Постановка нелинейной задачи быстродействия ===
+Нелинейная задача быстродействия представляет собой задачу оптимального управления, в которой функционал \(J)\ имеет следующий вид:
+\[
+    J = t_1 - t_0.
+\]

Принцип максимума для задачи быстродействия: различия между версиями

Версия 20:45, 13 декабря 2021

Содержание

Случай линейной системы

Общая постановка линейной задачи быстродействия

Принцип максимума Понтрягина для линейной задачи быстродействия

Теорема (Принцип максимума Понтрягина)

Случай нелинейной системы

Общая задача оптимального управления

Постановка задачи оптимального управления в общем виде

Принцип максимума Понтрягина для общей задачи оптимального управления

Определение 1

Определение 2

Теорема (Принцип максимума Понтрягина)

Нелинейная задача быстродействия

Постановка нелинейной задачи быстродействия

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты