Лемма о перестановке интеграла и супремума: различия между версиями

Текущая версия на 17:01, 6 декабря 2021

Лемма, возникающая в задаче быстродействия (т.е. поиска управления, оптимального по времени) и используемая для облегчения расчета опорной функции множества достижимости.

Содержание

1 Задача быстродействия
2 Множество достижимости
3 Лемма о перестановке интеграла и супремума
4 Применение
5 Список литературы

Задача быстродействия

Тип задач оптимального управления, заключающихся в переводе системы из начального фиксированного положения в конечное, также фиксированное, за минимальное время.

В этой статье предполагается, что данная система задается следующими условиями:

\begin{equation}\label{ms} \begin{cases} \dot{x} = A(t)x(t) + B(t)u(t)+f(t), \\ x(t_0) = x^0, \\ x(t_1) = x^1, \\ u(\tau) \in \mathcal{P}(\tau) \in \textit{conv}R^m, \\ t_1 - t_0 \longrightarrow \text{inf}, \end{cases} \end{equation}

где $$ x^0,\,x^1,\,t_0 $$ $$-$$ фиксированы, $$ A(t),\,B(t),\,f(t) $$ $$-$$ непрерывны, а $$ \mathcal{P}(\tau) $$ непрерывно, как многозначное отображение (это требование гарантирует непрерывность опорной функции $$ \mathcal{\rho(l|\mathcal{P}(\tau))} $$ по $$ \tau $$ для любого $$ l $$).

Множество достижимости

Трубка достижимости $$-$$ это функция, отображающая время на соответствующее множество достижимости (обозначается: $$ \mathcal{X}[\cdot] $$). Ее графиком называют множество:

\[ \mathcal{X}[\cdot] = \{(t,\,x): x\in \mathcal{X}[t]\}. \]

Множество достижимости $$ \mathcal{X}[t_1] $$ определяется следующим образом:

\[ \mathcal{X}[t_1] = \mathcal{X}(t_1,t_0,x^0) = \{x = x(t_1,t_0,x^0\,|\,u(\cdot)), u(\tau) \in \mathcal{P}(\tau)\}. \]

Обозначение $$ \mathcal{X}[t_1] $$ подразумевает, что в данный момент интерес представляет зависимость $$ \mathcal{X} $$ только от переменной $$ t_1 $$, хотя в общем случае значение $$ \mathcal{X} $$ зависит от большего числа переменных.

Опорная функция множества достижимости рассчитываться по следующей формуле:

\[ \rho(l\,|\,\mathcal{X}[t_1]) = \sup\limits_{u(\cdot)} \left[ \langle l,\,X(t_1,t_0) \rangle + \int\limits^{t_1}_{t_0}\langle B^T(\tau)X^T(t_1,\tau)l,\,u(\tau) \rangle d\tau + \int\limits^{t_1}_{t_0}\langle l,\,X(t_1,\tau)f(\tau) \rangle d\tau \right] = \] \[ = \langle l,\,X(t_1,t_0) \rangle + \int\limits^{t_1}_{t_0}\langle l,\,X(t_1,\tau)f(\tau) \rangle d\tau + \sup\limits_{u(\cdot)} \left[ \int\limits^{t_1}_{t_0}\langle B^T(\tau)X^T(t_1,\tau)l,\,u(\tau) \rangle d\tau \right], \]

где $$X(t,\tau)$$ $$-$$ фундаментальная матрица Коши.

Лемма о перестановке интеграла и супремума

Пусть рассматривается задача быстродействия \eqref{ms}. Тогда, обозначая $$s(\tau) = B^T(\tau)X^T(t_1,\tau)l$$, можно получить верное тождество: \[ \sup\limits_{u(\cdot)}\left[ \int\limits^{t_1}_{t_0} \langle s(\tau),\,u(\tau) \rangle \,d\tau\right] = \int\limits^{t_1}_{t_0}\left[\sup\limits_{u \in \mathcal{P}} \langle s(\tau),\,u \rangle\right] d\tau. \]

Доказательство.

Так как $$ s(\tau) $$ $$-$$ непрерывная функция, то опорная функция $$ \rho(s(\tau)|\mathcal{P}(\tau)) = \sup\limits_{u \in \mathcal{P}(\tau)} \langle s(\tau),\,u \rangle $$ также непрерывна по $$ \tau $$, и, следовательно, интегрируема.

Рассматривая $$ \mathcal{P}^*(\tau) = \underset{u(\cdot) \in \mathcal{P}(\tau)}{\text{Arg}\,\text{max}} \langle s(\tau),\,u \rangle $$, нужно проверить, что это многозначное отображение является измеримым. Для этого достаточно доказать его полунепрерывность сверху.

Так как полунепрерывность сверху равносильна замкнутости графика $$ \mathcal{P}^*(\tau) $$, то нам надо показать, что из $$ \tau^n \longrightarrow \tau $$, $$ u^n \longrightarrow u $$, $$ u^n \in \mathcal{P}^*(\tau^n) $$, при $$ n \longrightarrow \infty $$, следует, что $$ u \in \mathcal{P}^*(\tau) $$.

Для $$ u^n $$ и $$ \tau^n $$ выполнены следующие соотношения: \[ \langle s(\tau^n),\,u^n \rangle = \rho(s(\tau^n)\,|\,\mathcal{P}(\tau^n)), \] \[ \langle l,\,u^n \rangle \leq \rho(l\,|\,\mathcal{P}^*(\tau^n)), \]

Тогда, при переходе к пределу при $$ n \longrightarrow \infty $$ справедливо:

\[ \langle s(\tau),\,u \rangle = \rho(s(\tau)\,|\,\mathcal{P}(\tau)), \] \[ \langle l,\,u \rangle \leq \rho(l\,|\,\mathcal{P}^*(\tau)), \]

Значит $$ u \in \mathcal{P}^*(\tau) $$, что и дает замкнутость графика, и, следовательно, измеримость.

Лемма об измеримом селекторе описывается в курсе выпуклого анализа [1].

"Если многозначное отображение $$\mathcal{P}^*(\cdot)$$ измеримо, то существует такая измеримая функция (селектор) $$ u^*(\cdot) $$, что $$ u^*(\tau) \in \mathcal{P}^*(\tau) $$ для почти всех $$ \tau $$."

Пусть $$ u^*(\cdot) $$ $$ - $$ искомый измеримый селектор для $$ \mathcal{P}^*(\cdot) $$. Тогда, для него выполнено следующее неравенство: $$ \langle s(\tau),\,u^*(\tau) \rangle \leq \rho(s(\tau)\,|\,\mathcal{P}(\tau)) $$. Это означает, что интегралы из условия доказываемой леммы существуют. Следовательно, точная верхняя грань достигается на $$ u^*(\tau) \in \mathcal{P}^*(\tau) $$, т.е. тождество верно, что и требовалось доказать. $$\blacksquare$$

Применение

Таким образом можно выписать окончательный вид опорной функции: \[ \rho(l\,|\,\mathcal{X}[t_1]) = \langle l,\,X(t_1,t_0) \rangle + \int\limits^{t_1}_{t_0}\langle l,\,X(t_1,\tau)f(\tau) \rangle d\tau + \int\limits^{t_1}_{t_0}\rho(B^T(\tau)X^T(t_1,\tau)l\,|\,\mathcal{P}(\tau))d\tau. \]

Итак, оптимальное управление доставляет максимум выражению \[ \max\limits_{u \in \mathcal{P}(\tau)} \langle B^T(\tau)X^T(t_1,\tau)l,\,u \rangle \]

Обозначая $$ \psi(\tau) = X^T(t_1,\tau)l $$, можно получить финальную формулу для опорной функции: \[ \rho(l\,|\,\mathcal{X}[t_1]) = \langle \psi(t_0),\,x_0 \rangle + \int\limits^{t_1}_{t_0}\langle \psi(\tau),\,f(\tau) \rangle d\tau + \int\limits^{t_1}_{t_0}\rho(B^T(\tau)\psi(\tau)\,|\,\mathcal{P}(\tau))d\tau. \]

При этом $$ \psi(\tau) $$ называют сопряженной переменной (функцией). Из определения фундаментальной матрицы ясно, что $$ \psi(\tau) $$ удовлетворяет условиям и является решением системы:

\[ \begin{cases} \dot{\psi} = -A^T(\tau)\psi, \\ \psi(t_1) = l. \end{cases} \]

Список литературы

1) Арутюнов А.В. "Лекции по выпуклому и многозначному анализу" М.: ФИЗМАТЛИТ, 2016

2) Лекции по курсу "Оптимальное управление". Лектор: Комаров Юрий, 2020/2021.

@@ Строка 1: / Строка 1: @@
-Условия перестановки интеграла и супремума складываются в лемму, которая возникает в [https://sawiki.cs.msu.ru//index.php/%D0%97%D0%B0%D0%B4%D0%B0%D1%87%D0%B0_%D0%B1%D1%8B%D1%81%D1%82%D1%80%D0%BE%D0%B4%D0%B5%D0%B9%D1%81%D1%82%D0%B2%D0%B8%D1%8F задаче быстродействия] (т.е. поиска управления, оптимального по времени) и применяется для облегчения расчета [https://sawiki.cs.msu.ru/index.php/%D0%9E%D0%BF%D0%BE%D1%80%D0%BD%D0%B0%D1%8F_%D1%84%D1%83%D0%BD%D0%BA%D1%86%D0%B8%D1%8F_%D0%BC%D0%BD%D0%BE%D0%B6%D0%B5%D1%81%D1%82%D0%B2%D0%B0 опорной функции] множества достижимости.
+Лемма, возникающая в [[Задача быстродействия | задаче быстродействия]] (т.е. поиска управления, оптимального по времени) и используемая для облегчения расчета [[Опорная функция множества | опорной функции]] множества достижимости.
 == Задача быстродействия ==
-Тип задач оптимального управления, заключающегося в переводе системы из начального фиксированного положения в конечное, также фиксированное, за минимальное время.
+Тип задач оптимального управления, заключающихся в переводе системы из начального фиксированного положения в конечное, также фиксированное, за минимальное время.
-Пусть наша система описывается следующими условиями:
+В этой статье предполагается, что данная система задается следующими условиями:
 \begin{equation}\label{ms}
@@ Строка 13: / Строка 13: @@
      x(t_0) = x^0, \\
      x(t_1) = x^1, \\
-     u(\tau) \in \mathcal{P} \in \textit{conv}R^m, \\
+     u(\tau) \in \mathcal{P}(\tau) \in \textit{conv}R^m, \\
      t_1 - t_0 \longrightarrow \text{inf},
      \end{cases}
 \end{equation}
-где $$ x^0,\,x^1,\,t_0 $$ - фиксированы, $$ A(t),\,B(t),\,f(t) $$ - непрерывны, а $$ \mathcal{P} $$ непрерывно, как многозначное отображение (это требование гарантирует нам непрерывность [https://sawiki.cs.msu.ru/index.php/%D0%9E%D0%BF%D0%BE%D1%80%D0%BD%D0%B0%D1%8F_%D1%84%D1%83%D0%BD%D0%BA%D1%86%D0%B8%D1%8F_%D0%BC%D0%BD%D0%BE%D0%B6%D0%B5%D1%81%D1%82%D0%B2%D0%B0 опорной функции] $$ \mathcal{\rho(l|\mathcal{P}(\tau))} $$ по $$ \tau $$ для любого $$ l $$).
+где $$ x^0,\,x^1,\,t_0 $$ $$-$$ фиксированы, $$ A(t),\,B(t),\,f(t) $$ $$-$$ непрерывны, а $$ \mathcal{P}(\tau) $$ непрерывно, как многозначное отображение (это требование гарантирует непрерывность [[Опорная функция множества | опорной функции]] $$ \mathcal{\rho(l|\mathcal{P}(\tau))} $$ по $$ \tau $$ для любого $$ l $$).
 == Множество достижимости ==
-Введем множество достижимости $$ \mathcal{X}[t_1] $$:
+Трубка достижимости $$-$$ это функция, отображающая время на соответствующее множество достижимости (обозначается: $$ \mathcal{X}[\cdot] $$). Ее графиком называют множество:
 \[
-     \mathcal{X}[t_1] = \mathcal{X}(t_1,t_0,x^0) = \{x = x(t_1,t_0,x^0\,|\,u(\cdot)), u(\tau) \in \mathcal{P}\}.
+     \mathcal{X}[\cdot] = \{(t,\,x): x\in \mathcal{X}[t]\}.
 \]
-Обозначение $$ \mathcal{X}[t_1] $$ означает, что в данный момент нам интересна зависимость $$ \mathcal{X} $$ только от переменной $$ t_1 $$, хотя в общем случае значение $$ \mathcal{X} $$ зависит от большего числа переменных.
+[[Множество достижимости линейной системы | Множество достижимости]] $$ \mathcal{X}[t_1] $$ определяется следующим образом:
-Введем также трубку достижимости (функцию, отображающую время на соответствующее множество достижимости) как $$ \mathcal{X}[\cdot] $$. Ее графиком будем называть множество:
 \[
-     \mathcal{X}[\cdot] = \{(t,\,x): x\in \mathcal{X}[t]\}.
+     \mathcal{X}[t_1] = \mathcal{X}(t_1,t_0,x^0) = \{x = x(t_1,t_0,x^0\,|\,u(\cdot)), u(\tau) \in \mathcal{P}(\tau)\}.
 \]
-Тогда [https://ru.wikipedia.org/wiki/%D0%9E%D0%BF%D0%BE%D1%80%D0%BD%D0%B0%D1%8F_%D1%84%D1%83%D0%BD%D0%BA%D1%86%D0%B8%D1%8F опорная функция] множества достижимости будет рассчитываться по следующей формуле:
+Обозначение $$ \mathcal{X}[t_1] $$ подразумевает, что в данный момент интерес представляет зависимость $$ \mathcal{X} $$ только от переменной $$ t_1 $$, хотя в общем случае значение $$ \mathcal{X} $$ зависит от большего числа переменных.
+[[Опорная функция множества | Опорная функция]] [[Множество достижимости линейной системы | множества достижимости]] рассчитываться по следующей формуле:
 \[
@@ Строка 44: / Строка 44: @@
 \[
      = \langle l,\,X(t_1,t_0) \rangle + \int\limits^{t_1}_{t_0}\langle l,\,X(t_1,\tau)f(\tau) \rangle d\tau + \sup\limits_{u(\cdot)} \left[
-     \int\limits^{t_1}_{t_0}\langle B^T(\tau)X^T(t_1,\tau)l,\,u(\tau) \rangle d\tau  \right].
+     \int\limits^{t_1}_{t_0}\langle B^T(\tau)X^T(t_1,\tau)l,\,u(\tau) \rangle d\tau  \right],
 \]
-Теперь, у нас все готово для рассмотрения основной леммы.
+где $$X(t,\tau)$$ $$-$$ [[Фундаментальная матрица Коши | фундаментальная матрица Коши]].
-== Формулировка леммы о перестановке интеграла и супремума ==
+== Лемма о перестановке интеграла и супремума ==
-''Пусть рассматривается задача быстродействия \eqref{ms}. Тогда, обозначив $$s(\tau) = B^T(\tau)X^T(t_1,\tau)l$$, получим верное тождество:''
+''Пусть рассматривается [[Задача быстродействия | задача быстродействия]] \eqref{ms}. Тогда, обозначая $$s(\tau) = B^T(\tau)X^T(t_1,\tau)l$$, можно получить верное тождество:''
 \[
      \sup\limits_{u(\cdot)}\left[ \int\limits^{t_1}_{t_0} \langle s(\tau),\,u(\tau) \rangle \,d\tau\right] = \int\limits^{t_1}_{t_0}\left[\sup\limits_{u \in
@@ Строка 56: / Строка 56: @@
 \]
-== Доказательство леммы ==
+'''Доказательство'''.
-Так как $$ s(\tau) $$ - непрерывная функция, то $$ \rho(s(\tau)|\mathcal{P}(t)) = \sup\limits_{u \in \mathcal{P}(\tau)} \langle s(\tau),\,u \rangle $$ непрерывно по $$ \tau $$, и, следовательно, интегрируема.
-Рассмотрим $$ \mathcal{P}^*(\tau) = \underset{u(\cdot) \in \mathcal{P}(\tau)}{Arg\,max} \langle s(\tau),\,u \rangle $$. Проверим, что это многозначное отображение является измеримым. Для этого достаточно доказать его полунепрерывность сверху. Так как полунепрерывность сверху равносильна замкнутости графика $$ \mathcal{P}^*(\tau) $$, то нам надо показать, что из $$ \tau^n \longrightarrow \tau $$, $$ u^n \longrightarrow u $$, $$ u^n \in \mathcal{P}^*(\tau^n) $$, при $$ n \longrightarrow \infty $$, следует, что $$ u \in \mathcal{P}^*(\tau) $$. Это равносильно соотношениям:
+Так как $$ s(\tau) $$ $$-$$ непрерывная функция, то опорная функция $$ \rho(s(\tau)|\mathcal{P}(\tau)) = \sup\limits_{u \in \mathcal{P}(\tau)} \langle s(\tau),\,u \rangle $$ также непрерывна по $$ \tau $$, и, следовательно, интегрируема.
+Рассматривая $$ \mathcal{P}^*(\tau) = \underset{u(\cdot) \in \mathcal{P}(\tau)}{\text{Arg}\,\text{max}} \langle s(\tau),\,u \rangle $$, нужно проверить, что это многозначное отображение является измеримым. Для этого достаточно доказать его полунепрерывность сверху.
+Так как полунепрерывность сверху равносильна замкнутости графика $$ \mathcal{P}^*(\tau) $$, то нам надо показать, что из $$ \tau^n \longrightarrow \tau $$, $$ u^n \longrightarrow u $$, $$ u^n \in \mathcal{P}^*(\tau^n) $$, при $$ n \longrightarrow \infty $$, следует, что $$ u \in \mathcal{P}^*(\tau) $$.
+Для $$ u^n $$ и $$ \tau^n $$ выполнены следующие соотношения:
 \[
      \langle s(\tau^n),\,u^n \rangle = \rho(s(\tau^n)\,|\,\mathcal{P}(\tau^n)),
@@ Строка 66: / Строка 72: @@
 \]
-для любого $$ l $$. Тогда
+Тогда, при переходе к пределу при $$ n \longrightarrow \infty $$ справедливо:
 \[
@@ Строка 75: / Строка 81: @@
 \]
-что верно, и, стало быть, $$ u \in \mathcal{P}^*(\tau) $$, что и дает нам замкнутость графика, и, следовательно, измеримость.
+Значит $$ u \in \mathcal{P}^*(\tau) $$, что и дает замкнутость графика, и, следовательно, измеримость.
+''Лемма об измеримом селекторе'' описывается в курсе выпуклого анализа [https://www.litres.ru/aram-arutunov/lekcii-po-vypuklomu-i-mnogoznachnomu-analizu-16957972/].
-Воспользуемся ''леммой об измеримом селекторе'' из курса многозначного анализа:
+''"Если многозначное отображение $$\mathcal{P}^*(\cdot)$$ измеримо, то существует такая измеримая функция (селектор) $$ u^*(\cdot) $$, что $$ u^*(\tau) \in \mathcal{P}^*(\tau) $$ для почти всех $$ \tau $$."''
-''"Если многозначное отображение $$\mathcal{P}^*$$ измеримо, то существует такая измеримая функция (селектор) $$ u^*(\cdot) $$, что $$ u^*(\tau) \in \mathcal{P}^*(\tau) $$ для почти всех $$ \tau $$."''
-Для этого селектора $$ \langle s(\tau),\,u^*(\tau) \rangle \leq \rho(s(\tau)\,|\,\mathcal{P}(\tau)) $$, интегралы в условии леммы существуют, что влечет за собой достижение точной верхней грани на $$ u(\tau) \in \mathcal{P}^*(\tau) $$, что и требовалось доказать. $$\blacksquare$$
+Пусть $$ u^*(\cdot) $$ $$ - $$ искомый измеримый селектор для $$ \mathcal{P}^*(\cdot) $$. Тогда, для него выполнено следующее неравенство: $$ \langle s(\tau),\,u^*(\tau) \rangle \leq \rho(s(\tau)\,|\,\mathcal{P}(\tau)) $$. Это означает, что интегралы из условия доказываемой леммы существуют. Следовательно, точная верхняя грань достигается на $$ u^*(\tau) \in \mathcal{P}^*(\tau) $$, т.е. тождество верно, что и требовалось доказать. $$\blacksquare$$
-== Результаты применения леммы ==
+== Применение ==
-Таким образом мы можем выписать окончательный вид опорной функции:
+Таким образом можно выписать окончательный вид опорной функции:
 \[
      \rho(l\,|\,\mathcal{X}[t_1]) = \langle l,\,X(t_1,t_0) \rangle + \int\limits^{t_1}_{t_0}\langle l,\,X(t_1,\tau)f(\tau) \rangle d\tau + \int\limits^{t_1}_{t_0}\rho(B^T(\tau)X^T(t_1,\tau)l\,|\,\mathcal{P}(\tau))d\tau.
@@ Строка 94: / Строка 102: @@
 \]
-Обозначая $$ \psi(\tau) = X^T(t_1,\tau)l $$, получим финальную формулу для оптимального управления:
+Обозначая $$ \psi(\tau) = X^T(t_1,\tau)l $$, можно получить финальную формулу для опорной функции:
 \[
      \rho(l\,|\,\mathcal{X}[t_1]) = \langle \psi(t_0),\,x_0 \rangle + \int\limits^{t_1}_{t_0}\langle \psi(\tau),\,f(\tau) \rangle d\tau + \int\limits^{t_1}_{t_0}\rho(B^T(\tau)\psi(\tau)\,|\,\mathcal{P}(\tau))d\tau.
 \]
-При этом $$ \psi(\tau) $$ называют ''сопряженной переменной (функцией)''. Из определения [https://sawiki.cs.msu.ru/index.php/%D0%A4%D1%83%D0%BD%D0%B4%D0%B0%D0%BC%D0%B5%D0%BD%D1%82%D0%B0%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F_%D0%BC%D0%B0%D1%82%D1%80%D0%B8%D1%86%D0%B0_%D0%9A%D0%BE%D1%88%D0%B8 фундаментальной матрицы] ясно, что $$ \psi(\tau) $$ удовлетворяет условиям и является решением системы:
+При этом $$ \psi(\tau) $$ называют ''сопряженной переменной (функцией)''. Из определения [[Фундаментальная матрица Коши | фундаментальной матрицы]] ясно, что $$ \psi(\tau) $$ удовлетворяет условиям и является решением системы:
 \[
@@ Строка 107: / Строка 115: @@
      \end{cases}
 \]
+== Список литературы ==
+[https://www.litres.ru/aram-arutunov/lekcii-po-vypuklomu-i-mnogoznachnomu-analizu-16957972/ 1)] Арутюнов А.В. "Лекции по выпуклому и многозначному анализу" М.: ФИЗМАТЛИТ, 2016
+) Лекции по курсу "Оптимальное управление". Лектор: Комаров Юрий, 2020/2021.
 [[Категория:ОУ]]

Лемма о перестановке интеграла и супремума: различия между версиями

Текущая версия на 17:01, 6 декабря 2021

Содержание

Задача быстродействия

Множество достижимости

Лемма о перестановке интеграла и супремума

Применение

Список литературы

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты