Задача Майера-Больца

Материал из sawiki
Перейти к навигации Перейти к поиску

Задача Майера-Больца - это задача оптимального управления со свободным правым концом и интегрально-терминальным функционалом.

Определение

Рассмотрим задачу оптимального управления \begin{gather*} \begin{cases} \dot{x} = f(t, x, u) \\ x(t_{0}) = x^{0} \end{cases} \end{gather*} $$t_{0}, x^{0}, t_{1}$$ - фиксированы. \begin{gather*} \mathcal{J} \displaystyle = \int\limits_{t_{0}}^{t_{1}} f^{0}(x(t), u(t))dt + \phi(x(t_{1})) \to \inf_{u(\cdot)}. \end{gather*} Полученная задача называется задачей Майера-Больца.

Формулировка Принципа максимума Л.С. Понтрягина

Проведем стандартную замену: $$ \hat{x}^{0}, \hat{t}_{0}, \hat{t}_{1} $$ \begin{gather*} \begin{cases} \dot{x}^{0} = f^{0} \\ x^{0}(t_{0}) = 0 \end{cases} \end{gather*} И получаем \begin{gather*} \mathcal{J} = x^{0}(t_{1}) + \phi(x(t_{1})). \end{gather*} Для остальных ограничений получим \begin{equation*} \varphi_{1} = t_{0} - \hat{t}_{0} \\ \varphi_{2} = t_{1} - \hat{t}_{1} \\ \varphi_{3} = x^{0}_{0} \\ \varphi_{4} = x^{0}_{1} - \hat{x}^{0}_{1} \\ \ldots \\ \varphi_{n+3} = x^{0}_{n} - \hat{x}^{0}_{n}. \end{equation*} Принцип максимума Понтрягина. Пусть $$ (x^{*}(t), u^{*}(t)) $$ - оптимальная пара, тогда $$ \exists \psi^{*} : [t^{*}_{0}, t^{*}_{1}] \to \mathbb{R}^{n+1} $$ :

  • Условие нетривиальности

\begin{gather} \psi^{*}(t) \neq 0, \forall t \in [t^{*}_{0}, t^{*}_{1}]. \end{gather}

  • Сопряженная система

\begin{gather} \frac{d\psi}{dt} = -\frac{d\mathcal{H} }{dt}\bigg|_{x=x^{*} \\ u=u^{*}}. \end{gather}

  • Условие максимума

\begin{gather} \mathcal{H}\bigg|_{x=x^{*} \\ u=u^{*} \\ \psi = \psi^{*}} = \sup_{u(\cdot)} \mathcal{H}\bigg|_{x=x^{*} \\ \psi=\psi^{*}}. \end{gather}

  • Условие трансверсальности

\begin{gather} \psi^{*}(t^{*}_{1}) = (\lambda_{0}, \lambda_{0} \frac{\partial \phi}{\partial x})^{T} \\ \psi^{*}(t^{*}_{1}) = (\lambda_{3}, \lambda_{4}, \ldots, \lambda_{n+3})^{T} \\ \mathcal{H}|_{t=t^{*}_{1}} = -\lambda_{2} \\ \mathcal{H}|_{t=t^{*}_{0}} = \lambda_{1} \end{gather}

Второе и третье условие из (УТ) являются неинформативными. Из первого же следует, что \begin{gather*} \psi^{*}_{0} \equiv const = \lambda_{0} \leqslant 0 \Rightarrow \lambda_{0} < 0 \end{gather*} иначе нарушится условие нетривиальности. Возьмем $$ \lambda_{0} = -1 $$ и перепишем условие трансверсальности следующим образом: \begin{gather} \psi^{*}_{0} \equiv -1, \, \, \, \psi^{*}(t^{*}_{1}) = - \frac{\partial \phi}{\partial x} \end{gather} Далее докажем ПМП (1), (2), (3), (8) для задачи Майера-Больца.

Доказательство ПМП и вариация управления

Пусть $$ (x^{*}(t), u^{*}(t)) $$ - оптимальная пара. \begin{gather*} \psi^{*}(t) \displaystyle = - \frac{\partial \phi(x^{*}(t^{*}_{1})}{\partial x} + \\ \int\limits_{t}^{t_{1}} \bigg( - \psi^{*}_{0} \frac{\partial f^{0}(x^{*}(s), u^{*}(s))}{\partial x}- \bigg( \frac{\partial f}{\partial x} (x^{*}(s), u^{*}(s)) \bigg)^{T} \psi^{*}(s) \bigg) ds \\ \begin{cases} \displaystyle \frac{d\psi^{*}(t)}{dt} = \frac{\partial f^{0}}{\partial x}(x^{*}(t), u^{*}(t)) - \bigg( \frac{\partial f}{\partial x} \bigg)^{T} \psi^{*}(t) , \\ \displaystyle \psi^{*}(t_{1}) = - \frac{\partial \psi(x^{*}(t_{1}))}{\partial x}. \end{cases} \end{gather*} Осталось доказать условие максимума : \begin{gather*} -f^{0}(x^{*}(t), u^{*}(t)) + \langle \psi^{*}(t), f(x^{*}(t), u^{*}(t)) \rangle \geqslant -f^{0}(x^{*}(t), v) + \langle \psi^{*}(t), f(x^{*}(t), v) \rangle \end{gather*} $$ \forall v \in \mathcal{P} $$ ( $$ v $$ - конечномерный вектор). \begin{gather*} \mathcal{J}[u(\cdot)] \displaystyle = \int\limits_{t_{0}}^{t_{1}} f^{0}(x(t), u(t)) dt + \phi(x(t_{1}) \geqslant \mathcal{J}[u^{*}(\cdot)], \\ \forall u(\cdot) \in U_{\varepsilon}(u(\cdot)) \end{gather*} Пусть $$ u $$ кусочно-непрерывна и непрерывна слева, тогда в качестве $$\varepsilon$$-окрестности (вариации) мы можем рассмотреть игольчатую вариацию следующего вида : \begin{gather*} t_{0} < \tau \leqslant t_{1}, 0 < \varepsilon \leqslant \tau - t_{0}, v \in \mathcal{P} \\ u_{\varepsilon} \displaystyle = \begin{cases} u^{*}(t), t \in [t_{0}, t_{1} ] \ (\tau - \varepsilon, \tau] \\ v, t \in (\tau - \varepsilon, \tau] \end{cases} \end{gather*} Получаем \begin{gather*} \displaystyle \mathcal{J}[u_{\varepsilon}(\cdot)] \geqslant \mathcal{J}[u(\cdot)] \Rightarrow {\varepsilon > 0} \Rightarrow \frac{ \mathcal{J}[u_{\varepsilon}(\cdot)] - \mathcal{J}[u(\cdot)]}{\varepsilon} \geqslant 0 \Rightarrow \\ \Rightarrow \lim_{\varepsilon \to +0} \inf \frac{ \mathcal{J}[u_{\varepsilon}(\cdot)] - \mathcal{J}[u(\cdot)]}{\varepsilon} \geqslant 0 \end{gather*} Лемма. $$ x_{\varepsilon}(t) = x^{*}(t) + \varepsilon \delta x(t) + \bar o(\varepsilon) $$, где \begin{gather*} \displaystyle \begin{cases} \frac{d}{dt} (\delta x(t)) = \bigg( \frac{\partial f(x^{*}(t), u^{*}(st))}{\partial x} \bigg) \delta x(t), t \geqslant \tau, \\ \delta x(\tau) = f(x^{*}(\tau), v) + f(x^{*}(\tau), u^{*}(\tau)), \end{cases} \end{gather*} при $$t < \tau $$ выполняется $$ \delta x(t) = 0 $$, то есть $$x_{\varepsilon}(t) = x^{*}(t), t < \tau $$ и при $$ t \geqslant \tau $$ \begin{gather*} \displaystyle \frac{x_{\varepsilon}(t) - x^{*}(t)}{\varepsilon} \xrightarrow[\varepsilon \to +0]{} \delta x(t) \end{gather*} Доказательство леммы. \begin{gather*} x^{*}(t) \displaystyle = x^{0} + \int\limits_{t_{0}}^{t} f(x^{*}(s), u^{*}(s)) ds \\ x_{\varepsilon}(t) \displaystyle = x^{0} + \int\limits_{t_{0}}^{t} f(x_{\varepsilon}(s), u_{\varepsilon}(s)) ds \\ \end{gather*} При $$ t < \tau $$ возьмем $$\varepsilon \in (0, \tau - t) \Rightarrow x^{*}(t) = x_{\varepsilon}(t).$$ При $$t \geqslant \tau $$ \begin{gather*} \displaystyle x_{\varepsilon}(\tau) - x^{*}(\tau) = \int\limits_{\tau - \varepsilon}^{\tau} [ f(x_{\varepsilon}(s), u_{\varepsilon}(s)) - f(x^{*}(s), u^{*}(s))] ds \end{gather*} $$x_{\varepsilon}(t) $$ удовлетворяет системе: \begin{gather*} \begin{cases} \displaystyle \frac{d x_{\varepsilon}(t)}{dt} = f(x_{\varepsilon}(t), v), \\ x_{\varepsilon}(t - \varepsilon) = x^{*}(\tau - \varepsilon). \end{cases} \end{gather*} Таким образом из доказанных теорем о непрерывности решение системы $$ x(t, \tau - \varepsilon, x^{*}(t - \varepsilon) $$ - непрерывно и $$ x_{\varepsilon}(s) $$ непрерывна по $$(s, \varepsilon)$$. Тогда \begin{gather*} \displaystyle \frac{x_{\varepsilon}(\tau) - x^{*}(\tau)}{\varepsilon} = \frac{1}{\varepsilon} \int\limits_{\tau - \varepsilon}^{\tau} [\ldots]ds \xrightarrow[\varepsilon \to +0]{т. о ср.} f(x^{*}(\tau), v) - f(x^{*}(\tau), u^{*}(\tau)) = \delta x(\tau), t >\tau. \\ \begin{cases} \displaystyle \frac{d x_{\varepsilon}(t)}{dt} = f(x_{\varepsilon}(t), u^{*}(t)), x_{\varepsilon}(\tau) = x^{*}(\tau) + \varepsilon \delta x(\tau) + \bar o(\varepsilon). \end{cases} \end{gather*} По теореме о дифференцируемости по начальным данным \begin{gather*} \exists y(t) = \displaystyle \lim_{\varpsilon \to +0} \frac{x_{\varepsilon}(t) - x^{*}(t)}{\varepsilon}, \end{gather*} для которого справедливо уравнение в вариациях \begin{gather*} \displaystyle \frac{dy(t)}{dt} = \bigg( \frac{\partial f}{\partial x} \bigg) y(t), \\ y(\tau) = \delta x(\tau), \end{gather*} следовательно, $$ \delta x(t) = y(t) $$. Лемма доказана