Задача Майера-Больца: различия между версиями

Материал из sawiki
Перейти к навигации Перейти к поиску
Строка 90: Строка 90:
 
Пусть $$ u $$ кусочно-непрерывна и непрерывна слева, тогда в качестве $$\epsilon$$-окрестности (вариации) мы можем рассмотреть '''игольчатую вариацию''' следующего вида :
 
Пусть $$ u $$ кусочно-непрерывна и непрерывна слева, тогда в качестве $$\epsilon$$-окрестности (вариации) мы можем рассмотреть '''игольчатую вариацию''' следующего вида :
 
\begin{gather*}
 
\begin{gather*}
t_{0} < \tau \leqslant t_{1}, 0 < \epsilon \leqslant \tau - t_{0}, v \in \mathcal{P}
+
t_{0} < \tau \leqslant t_{1}, 0 < \epsilon \leqslant \tau - t_{0}, v \in \mathcal{P} \\
 +
u_{\epsilon} \displaystyle =
 +
    \begin{cases}
 +
        u^{*}(t), t \in [t_{0}, t_{1} ] \ (\tau - \epsilon, \tau] \\
 +
        v, t \in (\tau - \epsilon, \tau]
 +
    \end{cases}
 +
\end{gather*}
 +
Получаем
 +
\begin{gather*}
 +
    \displaystyle \mathcal{J}[u_{\epsilon}(\cdot)] \geqlant \mathcal{J}[u(\cdot)] \Rightarrow {\epsilon > 0} \Rightarrow
 +
    \frac{ \mathcal{J}[u_{\epsilon}(\cdot)] - \mathcal{J}[u(\cdot)]}{\epsilon} \geqslant 0 \Rightarrow \\
 +
    \Rightarrow \lim_{\epsilon \to +0} \inf \frac{ \mathcal{J}[u_{\epsilon}(\cdot)] - \mathcal{J}[u(\cdot)]}{\epsilon} \geqslant 0
 
\end{gather*}
 
\end{gather*}

Версия 02:05, 30 ноября 2021

Задача Майера-Больца - это задача оптимального управления со свободным правым концом и интегрально-терминальным функционалом.

Определение

Рассмотрим задачу оптимального управления \begin{gather*} \begin{cases} \dot{x} = f(t, x, u) \\ x(t_{0}) = x^{0} \end{cases} \end{gather*} $$t_{0}, x^{0}, t_{1}$$ - фиксированы. \begin{gather*} \mathcal{J} \displaystyle = \int\limits_{t_{0}}^{t_{1}} f^{0}(x(t), u(t))dt + \phi(x(t_{1})) \to \inf_{u(\cdot)}. \end{gather*} Полученная задача называется задачей Майера-Больца.

Формулировка Принципа максимума Л.С. Понтрягина

Проведем стандартную замену: $$ \hat{x}^{0}, \hat{t}_{0}, \hat{t}_{1} $$ \begin{gather*} \begin{cases} \dot{x}^{0} = f^{0} \\ x^{0}(t_{0}) = 0 \end{cases} \end{gather*} И получаем \begin{gather*} \mathcal{J} = x^{0}(t_{1}) + \phi(x(t_{1})). \end{gather*} Для остальных ограничений получим \begin{equation*} \varphi_{1} = t_{0} - \hat{t}_{0} \\ \varphi_{2} = t_{1} - \hat{t}_{1} \\ \varphi_{3} = x^{0}_{0} \\ \varphi_{4} = x^{0}_{1} - \hat{x}^{0}_{1} \\ \ldots \\ \varphi_{n+3} = x^{0}_{n} - \hat{x}^{0}_{n}. \end{equation*} Принцип максимума Понтрягина. Пусть $$ (x^{*}(t), u^{*}(t)) $$ - оптимальная пара, тогда $$ \exists \psi^{*} : [t^{*}_{0}, t^{*}_{1}] \to \mathbb{R}^{n+1} $$ :

  • Условие нетривиальности

\begin{gather} \psi^{*}(t) \neq 0, \forall t \in [t^{*}_{0}, t^{*}_{1}]. \end{gather}

  • Сопряженная система

\begin{gather} \frac{d\psi}{dt} = -\frac{d\mathcal{H} }{dt}\bigg|_{x=x^{*} \\ u=u^{*}}. \end{gather}

  • Условие максимума

\begin{gather} \mathcal{H}\bigg|_{x=x^{*} \\ u=u^{*} \\ \psi = \psi^{*}} = \sup_{u(\cdot)} \mathcal{H}\bigg|_{x=x^{*} \\ \psi=\psi^{*}}. \end{gather}

  • Условие трансверсальности

\begin{gather} \psi^{*}(t^{*}_{1}) = (\lambda_{0}, \lambda_{0} \frac{\partial \phi}{\partial x})^{T} \\ \psi^{*}(t^{*}_{1}) = (\lambda_{3}, \lambda_{4}, \ldots, \lambda_{n+3})^{T} \\ \mathcal{H}|_{t=t^{*}_{1}} = -\lambda_{2} \\ \mathcal{H}|_{t=t^{*}_{0}} = \lambda_{1} \end{gather}

Второе и третье условие из (УТ) являются неинформативными. Из первого же следует, что \begin{gather*} \psi^{*}_{0} \equiv const = \lambda_{0} \leqslant 0 \Rightarrow \lambda_{0} < 0 \end{gather*} иначе нарушится условие нетривиальности. Возьмем $$ \lambda_{0} = -1 $$ и перепишем условие трансверсальности следующим образом: \begin{gather} \psi^{*}_{0} \equiv -1, \, \, \, \psi^{*}(t^{*}_{1}) = - \frac{\partial \phi}{\partial x} \end{gather} Далее докажем ПМП (1), (2), (3), (8) для задачи Майера-Больца.

Доказательство ПМП и вариация управления

Пусть $$ (x^{*}(t), u^{*}(t)) $$ - оптимальная пара. \begin{gather*} \psi^{*}(t) \displaystyle = - \frac{\partial \phi(x^{*}(t^{*}_{1})}{\partial x} + \\ \int\limits_{t}^{t_{1}} \bigg( - \psi^{*}_{0} \frac{\partial f^{0}(x^{*}(s), u^{*}(s))}{\partial x}- \bigg( \frac{\partial f}{\partial x} (x^{*}(s), u^{*}(s)) \bigg)^{T} \psi^{*}(s) \bigg) ds \\ \begin{cases} \displaystyle \frac{d\psi^{*}(t)}{dt} = \frac{\partial f^{0}}{\partial x}(x^{*}(t), u^{*}(t)) - \bigg( \frac{\partial f}{\partial x} \bigg)^{T} \psi^{*}(t) , \\ \displaystyle \psi^{*}(t_{1}) = - \frac{\partial \psi(x^{*}(t_{1}))}{\partial x}. \end{cases} \end{gather*} Осталось доказать условие максимума : \begin{gather*} -f^{0}(x^{*}(t), u^{*}(t)) + \langle \psi^{*}(t), f(x^{*}(t), u^{*}(t)) \rangle \geqslant -f^{0}(x^{*}(t), v) + \langle \psi^{*}(t), f(x^{*}(t), v) \rangle \end{gather*} $$ \forall v \in \mathcal{P} $$ ( $$ v $$ - конечномерный вектор). \begin{gather*} \mathcal{J}[u(\cdot)] \displaystyle = \int\limits_{t_{0}}^{t_{1}} f^{0}(x(t), u(t)) dt + \phi(x(t_{1}) \geqslant \mathcal{J}[u^{*}(\cdot)], \\ \forall u(\cdot) \in U_{\epsilon}(u(\cdot)) \end{gather*} Пусть $$ u $$ кусочно-непрерывна и непрерывна слева, тогда в качестве $$\epsilon$$-окрестности (вариации) мы можем рассмотреть игольчатую вариацию следующего вида : \begin{gather*} t_{0} < \tau \leqslant t_{1}, 0 < \epsilon \leqslant \tau - t_{0}, v \in \mathcal{P} \\ u_{\epsilon} \displaystyle = \begin{cases} u^{*}(t), t \in [t_{0}, t_{1} ] \ (\tau - \epsilon, \tau] \\ v, t \in (\tau - \epsilon, \tau] \end{cases} \end{gather*} Получаем \begin{gather*} \displaystyle \mathcal{J}[u_{\epsilon}(\cdot)] \geqlant \mathcal{J}[u(\cdot)] \Rightarrow {\epsilon > 0} \Rightarrow \frac{ \mathcal{J}[u_{\epsilon}(\cdot)] - \mathcal{J}[u(\cdot)]}{\epsilon} \geqslant 0 \Rightarrow \\ \Rightarrow \lim_{\epsilon \to +0} \inf \frac{ \mathcal{J}[u_{\epsilon}(\cdot)] - \mathcal{J}[u(\cdot)]}{\epsilon} \geqslant 0 \end{gather*}