Задача оптимального управления "из точки в точку" с интегральным функционалом

Материал из sawiki
Перейти к навигации Перейти к поиску

Постановка задачи оптимального управления

\begin{gather} \dot{x}(t) = f(t,x,u), & \text{ - уравнение состояния} \label{prb:1:1}\\ u(t) \in \mathcal{P}, \label{prb:1:2}\\ \mathfrak{J}(x(\cdot),u(\cdot)) = \int\limits_{t_0}^{t_1} f^0(t, x, u)\,dt \stackrel{u(\cdot)}{\longrightarrow} \inf, & \text{ - минимизируемый функционал} \label{prb:1:3}\\ x(t_0) = x_0, x(t_1) = x_1. & \text{ - граничные условия} \label{prb:1:4} \end{gather}

Здесь \(x(t)\) — вектор состояния \(u(t)\) — управление, \(t_0,t_1\) — начальный и конечный моменты времени, \(\mathcal{P}\) - множество допустимых управлений. Считаем, что \(x_0, x_1, t_0, t_1\) фиксированы.


Задача оптимального управления заключается в нахождении функций состояния \(x(t)\) и управления \(u(t) \in \mathcal{P}\) для времени \({t_{0}}\leq {t}\leq {t_{1}}\), которые минимизируют заданный функционал \(\mathfrak{J}\).

Задача оптимального управления "из точки в точку" с интегральным функционалом - задача перевода системы из начального фиксированного положения \(x_0\) в конечное \(x_1\), также фиксированное, обеспечивающего минимум заданного интегрального функционала \(\mathfrak{J}\) \eqref{prb:1:3}.

При заданном управлении уравнение \eqref{prb:1:1} становится обычным дифференциальным уравнением относительно \(x\). Всякое его решение, соответствующее управлению \(u(\cdot)\), называется фазовой траекторией, а пара \((x(\cdot),u(\cdot))\), связанная уравнением \eqref{prb:1:1}, называется управляемым процессом.

Функция \(f^0\) называется интегрантом. Предполагается, что функция \(f^0: \mathbb{R} \times \mathbb{R}^n \times \mathbb{R}^r \rightarrow \mathbb{R}\) непрерывна по совокупности переменных и непрерывно дифференцируема по \(x\). Более того, моменты времени \(t_0\) и \(t_1\) не предполагаются фиксированными, и все функции и отображения считаются непрерывно дифференцируемыми по времени.

Пример 1

При \(f^0(t, x, u) = 1\) минимизируемый функционал \begin{equation*} \mathfrak{J}(x(\cdot),u(\cdot)) = \int\limits_{t_0}^{t_1} f^0(t, x, u)\,dt = \int\limits_{t_0}^{t_1} \,dt = t_1 - t_0. \end{equation*} Задача с таким функционалом называется задачей быстродействия "из точки в точку".

Пример 2

Интегрант функционала может представлять собой квадратичную форму координат объекта и управления. В ряде случаев функционал содержит еще и слагаемое, которое учитывает конечное состояние системы. Таким образом, квадратичный критерий записывается в виде \begin{equation*} \mathfrak{J}(x(\cdot),u(\cdot)) = \int\limits_{t_0}^{t_1} (x^TQ(t)x + u^TR(t)u)\,dt + x^T(t_1)Fx(t_1), \end{equation*} где \(Q(t) \in \mathbb {R}^{n*n}\), \(R(t) \in \mathbb {R}^{r*r}\), \(F \in \mathbb {R}^{n*n}\) - симметрические матрицы. Индекс "T" означает операцию транспонирования.



Список литературы

  • Л.C. Понтрягин, В.Г. Болтянский, Р.В. Гамкрелидзе, Е.Ф. Мищенко. "Математическая теория оптимальных процессов". — М.: Наука, 1983,
  • В.В. Морозов. Курс лекций "Теория игр и исследование операций": 2021.
  • А.В. Арутюнов. "Лекции по выпуклому и многозначному анализу". Москва, Физматлит, 2014