Лемма о перестановке интеграла и супремума: различия между версиями
Polina (обсуждение | вклад) |
Polina (обсуждение | вклад) |
||
(не показаны 62 промежуточные версии этого же участника) | |||
Строка 1: | Строка 1: | ||
− | + | Лемма, возникающая в [[Задача быстродействия | задаче быстродействия]] (т.е. поиска управления, оптимального по времени) и используемая для облегчения расчета [[Опорная функция множества | опорной функции]] множества достижимости. | |
== Задача быстродействия == | == Задача быстродействия == | ||
− | Тип задач оптимального управления, | + | Тип задач оптимального управления, заключающихся в переводе системы из начального фиксированного положения в конечное, также фиксированное, за минимальное время. |
− | + | В этой статье предполагается, что данная система задается следующими условиями: | |
\begin{equation}\label{ms} | \begin{equation}\label{ms} | ||
Строка 13: | Строка 13: | ||
x(t_0) = x^0, \\ | x(t_0) = x^0, \\ | ||
x(t_1) = x^1, \\ | x(t_1) = x^1, \\ | ||
− | u(\tau) \in \mathcal{P} \in \textit{conv}R^m, \\ | + | u(\tau) \in \mathcal{P}(\tau) \in \textit{conv}R^m, \\ |
t_1 - t_0 \longrightarrow \text{inf}, | t_1 - t_0 \longrightarrow \text{inf}, | ||
\end{cases} | \end{cases} | ||
\end{equation} | \end{equation} | ||
− | где $$ x^0,\,x^1,\,t_0 $$ - фиксированы, $$ A(t),\,B(t),\,f(t) $$ - непрерывны, а $$ \mathcal{P} $$ непрерывно, как многозначное отображение (это требование гарантирует | + | где $$ x^0,\,x^1,\,t_0 $$ $$-$$ фиксированы, $$ A(t),\,B(t),\,f(t) $$ $$-$$ непрерывны, а $$ \mathcal{P}(\tau) $$ непрерывно, как многозначное отображение (это требование гарантирует непрерывность [[Опорная функция множества | опорной функции]] $$ \mathcal{\rho(l|\mathcal{P}(\tau))} $$ по $$ \tau $$ для любого $$ l $$). |
== Множество достижимости == | == Множество достижимости == | ||
− | + | Трубка достижимости $$-$$ это функция, отображающая время на соответствующее множество достижимости (обозначается: $$ \mathcal{X}[\cdot] $$). Ее графиком называют множество: | |
\[ | \[ | ||
− | \mathcal{X}[ | + | \mathcal{X}[\cdot] = \{(t,\,x): x\in \mathcal{X}[t]\}. |
\] | \] | ||
− | + | [[Множество достижимости линейной системы | Множество достижимости]] $$ \mathcal{X}[t_1] $$ определяется следующим образом: | |
− | |||
− | |||
\[ | \[ | ||
− | \mathcal{X}[ | + | \mathcal{X}[t_1] = \mathcal{X}(t_1,t_0,x^0) = \{x = x(t_1,t_0,x^0\,|\,u(\cdot)), u(\tau) \in \mathcal{P}(\tau)\}. |
\] | \] | ||
− | + | Обозначение $$ \mathcal{X}[t_1] $$ подразумевает, что в данный момент интерес представляет зависимость $$ \mathcal{X} $$ только от переменной $$ t_1 $$, хотя в общем случае значение $$ \mathcal{X} $$ зависит от большего числа переменных. | |
+ | |||
+ | [[Опорная функция множества | Опорная функция]] [[Множество достижимости линейной системы | множества достижимости]] рассчитываться по следующей формуле: | ||
\[ | \[ | ||
Строка 44: | Строка 44: | ||
\[ | \[ | ||
= \langle l,\,X(t_1,t_0) \rangle + \int\limits^{t_1}_{t_0}\langle l,\,X(t_1,\tau)f(\tau) \rangle d\tau + \sup\limits_{u(\cdot)} \left[ | = \langle l,\,X(t_1,t_0) \rangle + \int\limits^{t_1}_{t_0}\langle l,\,X(t_1,\tau)f(\tau) \rangle d\tau + \sup\limits_{u(\cdot)} \left[ | ||
− | \int\limits^{t_1}_{t_0}\langle B^T(\tau)X^T(t_1,\tau)l,\,u(\tau) \rangle d\tau \right] | + | \int\limits^{t_1}_{t_0}\langle B^T(\tau)X^T(t_1,\tau)l,\,u(\tau) \rangle d\tau \right], |
\] | \] | ||
− | + | где $$X(t,\tau)$$ $$-$$ [[Фундаментальная матрица Коши | фундаментальная матрица Коши]]. | |
− | == | + | == Лемма о перестановке интеграла и супремума == |
− | ''Пусть рассматривается задача быстродействия \eqref{ms}. Тогда, | + | ''Пусть рассматривается [[Задача быстродействия | задача быстродействия]] \eqref{ms}. Тогда, обозначая $$s(\tau) = B^T(\tau)X^T(t_1,\tau)l$$, можно получить верное тождество:'' |
\[ | \[ | ||
\sup\limits_{u(\cdot)}\left[ \int\limits^{t_1}_{t_0} \langle s(\tau),\,u(\tau) \rangle \,d\tau\right] = \int\limits^{t_1}_{t_0}\left[\sup\limits_{u \in | \sup\limits_{u(\cdot)}\left[ \int\limits^{t_1}_{t_0} \langle s(\tau),\,u(\tau) \rangle \,d\tau\right] = \int\limits^{t_1}_{t_0}\left[\sup\limits_{u \in | ||
Строка 56: | Строка 56: | ||
\] | \] | ||
− | + | '''Доказательство'''. | |
− | Так как $$ s(\tau) $$ - непрерывная функция, то $$ \rho(s(\tau)|\mathcal{P}( | + | |
− | + | Так как $$ s(\tau) $$ $$-$$ непрерывная функция, то опорная функция $$ \rho(s(\tau)|\mathcal{P}(\tau)) = \sup\limits_{u \in \mathcal{P}(\tau)} \langle s(\tau),\,u \rangle $$ также непрерывна по $$ \tau $$, и, следовательно, интегрируема. | |
+ | |||
+ | Рассматривая $$ \mathcal{P}^*(\tau) = \underset{u(\cdot) \in \mathcal{P}(\tau)}{\text{Arg}\,\text{max}} \langle s(\tau),\,u \rangle $$, нужно проверить, что это многозначное отображение является измеримым. Для этого достаточно доказать его полунепрерывность сверху. | ||
+ | |||
+ | Так как полунепрерывность сверху равносильна замкнутости графика $$ \mathcal{P}^*(\tau) $$, то нам надо показать, что из $$ \tau^n \longrightarrow \tau $$, $$ u^n \longrightarrow u $$, $$ u^n \in \mathcal{P}^*(\tau^n) $$, при $$ n \longrightarrow \infty $$, следует, что $$ u \in \mathcal{P}^*(\tau) $$. | ||
+ | |||
+ | Для $$ u^n $$ и $$ \tau^n $$ выполнены следующие соотношения: | ||
\[ | \[ | ||
\langle s(\tau^n),\,u^n \rangle = \rho(s(\tau^n)\,|\,\mathcal{P}(\tau^n)), | \langle s(\tau^n),\,u^n \rangle = \rho(s(\tau^n)\,|\,\mathcal{P}(\tau^n)), | ||
Строка 66: | Строка 72: | ||
\] | \] | ||
− | + | Тогда, при переходе к пределу при $$ n \longrightarrow \infty $$ справедливо: | |
\[ | \[ | ||
Строка 75: | Строка 81: | ||
\] | \] | ||
− | + | Значит $$ u \in \mathcal{P}^*(\tau) $$, что и дает замкнутость графика, и, следовательно, измеримость. | |
+ | |||
+ | |||
+ | ''Лемма об измеримом селекторе'' описывается в курсе выпуклого анализа [https://www.litres.ru/aram-arutunov/lekcii-po-vypuklomu-i-mnogoznachnomu-analizu-16957972/]. | ||
− | + | ''"Если многозначное отображение $$\mathcal{P}^*(\cdot)$$ измеримо, то существует такая измеримая функция (селектор) $$ u^*(\cdot) $$, что $$ u^*(\tau) \in \mathcal{P}^*(\tau) $$ для почти всех $$ \tau $$."'' | |
− | |||
− | + | Пусть $$ u^*(\cdot) $$ $$ - $$ искомый измеримый селектор для $$ \mathcal{P}^*(\cdot) $$. Тогда, для него выполнено следующее неравенство: $$ \langle s(\tau),\,u^*(\tau) \rangle \leq \rho(s(\tau)\,|\,\mathcal{P}(\tau)) $$. Это означает, что интегралы из условия доказываемой леммы существуют. Следовательно, точная верхняя грань достигается на $$ u^*(\tau) \in \mathcal{P}^*(\tau) $$, т.е. тождество верно, что и требовалось доказать. $$\blacksquare$$ | |
− | == | + | == Применение == |
− | Таким образом | + | Таким образом можно выписать окончательный вид опорной функции: |
\[ | \[ | ||
\rho(l\,|\,\mathcal{X}[t_1]) = \langle l,\,X(t_1,t_0) \rangle + \int\limits^{t_1}_{t_0}\langle l,\,X(t_1,\tau)f(\tau) \rangle d\tau + \int\limits^{t_1}_{t_0}\rho(B^T(\tau)X^T(t_1,\tau)l\,|\,\mathcal{P}(\tau))d\tau. | \rho(l\,|\,\mathcal{X}[t_1]) = \langle l,\,X(t_1,t_0) \rangle + \int\limits^{t_1}_{t_0}\langle l,\,X(t_1,\tau)f(\tau) \rangle d\tau + \int\limits^{t_1}_{t_0}\rho(B^T(\tau)X^T(t_1,\tau)l\,|\,\mathcal{P}(\tau))d\tau. | ||
Строка 94: | Строка 102: | ||
\] | \] | ||
− | Обозначая $$ \psi(\tau) = X^T(t_1,\tau)l $$, | + | Обозначая $$ \psi(\tau) = X^T(t_1,\tau)l $$, можно получить финальную формулу для опорной функции: |
\[ | \[ | ||
\rho(l\,|\,\mathcal{X}[t_1]) = \langle \psi(t_0),\,x_0 \rangle + \int\limits^{t_1}_{t_0}\langle \psi(\tau),\,f(\tau) \rangle d\tau + \int\limits^{t_1}_{t_0}\rho(B^T(\tau)\psi(\tau)\,|\,\mathcal{P}(\tau))d\tau. | \rho(l\,|\,\mathcal{X}[t_1]) = \langle \psi(t_0),\,x_0 \rangle + \int\limits^{t_1}_{t_0}\langle \psi(\tau),\,f(\tau) \rangle d\tau + \int\limits^{t_1}_{t_0}\rho(B^T(\tau)\psi(\tau)\,|\,\mathcal{P}(\tau))d\tau. | ||
\] | \] | ||
− | При этом $$ \psi(\tau) $$ называют ''сопряженной переменной (функцией)''. Из определения [ | + | При этом $$ \psi(\tau) $$ называют ''сопряженной переменной (функцией)''. Из определения [[Фундаментальная матрица Коши | фундаментальной матрицы]] ясно, что $$ \psi(\tau) $$ удовлетворяет условиям и является решением системы: |
\[ | \[ | ||
Строка 107: | Строка 115: | ||
\end{cases} | \end{cases} | ||
\] | \] | ||
+ | |||
+ | == Список литературы == | ||
+ | |||
+ | [https://www.litres.ru/aram-arutunov/lekcii-po-vypuklomu-i-mnogoznachnomu-analizu-16957972/ 1)] Арутюнов А.В. "Лекции по выпуклому и многозначному анализу" М.: ФИЗМАТЛИТ, 2016 | ||
+ | |||
+ | 2) Лекции по курсу "Оптимальное управление". Лектор: Комаров Юрий, 2020/2021. | ||
[[Категория:ОУ]] | [[Категория:ОУ]] |
Текущая версия на 17:01, 6 декабря 2021
Лемма, возникающая в задаче быстродействия (т.е. поиска управления, оптимального по времени) и используемая для облегчения расчета опорной функции множества достижимости.
Содержание
Задача быстродействия
Тип задач оптимального управления, заключающихся в переводе системы из начального фиксированного положения в конечное, также фиксированное, за минимальное время.
В этой статье предполагается, что данная система задается следующими условиями:
\begin{equation}\label{ms} \begin{cases} \dot{x} = A(t)x(t) + B(t)u(t)+f(t), \\ x(t_0) = x^0, \\ x(t_1) = x^1, \\ u(\tau) \in \mathcal{P}(\tau) \in \textit{conv}R^m, \\ t_1 - t_0 \longrightarrow \text{inf}, \end{cases} \end{equation}
где $$ x^0,\,x^1,\,t_0 $$ $$-$$ фиксированы, $$ A(t),\,B(t),\,f(t) $$ $$-$$ непрерывны, а $$ \mathcal{P}(\tau) $$ непрерывно, как многозначное отображение (это требование гарантирует непрерывность опорной функции $$ \mathcal{\rho(l|\mathcal{P}(\tau))} $$ по $$ \tau $$ для любого $$ l $$).
Множество достижимости
Трубка достижимости $$-$$ это функция, отображающая время на соответствующее множество достижимости (обозначается: $$ \mathcal{X}[\cdot] $$). Ее графиком называют множество:
\[ \mathcal{X}[\cdot] = \{(t,\,x): x\in \mathcal{X}[t]\}. \]
Множество достижимости $$ \mathcal{X}[t_1] $$ определяется следующим образом:
\[ \mathcal{X}[t_1] = \mathcal{X}(t_1,t_0,x^0) = \{x = x(t_1,t_0,x^0\,|\,u(\cdot)), u(\tau) \in \mathcal{P}(\tau)\}. \]
Обозначение $$ \mathcal{X}[t_1] $$ подразумевает, что в данный момент интерес представляет зависимость $$ \mathcal{X} $$ только от переменной $$ t_1 $$, хотя в общем случае значение $$ \mathcal{X} $$ зависит от большего числа переменных.
Опорная функция множества достижимости рассчитываться по следующей формуле:
\[ \rho(l\,|\,\mathcal{X}[t_1]) = \sup\limits_{u(\cdot)} \left[ \langle l,\,X(t_1,t_0) \rangle + \int\limits^{t_1}_{t_0}\langle B^T(\tau)X^T(t_1,\tau)l,\,u(\tau) \rangle d\tau + \int\limits^{t_1}_{t_0}\langle l,\,X(t_1,\tau)f(\tau) \rangle d\tau \right] = \] \[ = \langle l,\,X(t_1,t_0) \rangle + \int\limits^{t_1}_{t_0}\langle l,\,X(t_1,\tau)f(\tau) \rangle d\tau + \sup\limits_{u(\cdot)} \left[ \int\limits^{t_1}_{t_0}\langle B^T(\tau)X^T(t_1,\tau)l,\,u(\tau) \rangle d\tau \right], \]
где $$X(t,\tau)$$ $$-$$ фундаментальная матрица Коши.
Лемма о перестановке интеграла и супремума
Пусть рассматривается задача быстродействия \eqref{ms}. Тогда, обозначая $$s(\tau) = B^T(\tau)X^T(t_1,\tau)l$$, можно получить верное тождество: \[ \sup\limits_{u(\cdot)}\left[ \int\limits^{t_1}_{t_0} \langle s(\tau),\,u(\tau) \rangle \,d\tau\right] = \int\limits^{t_1}_{t_0}\left[\sup\limits_{u \in \mathcal{P}} \langle s(\tau),\,u \rangle\right] d\tau. \]
Доказательство.
Так как $$ s(\tau) $$ $$-$$ непрерывная функция, то опорная функция $$ \rho(s(\tau)|\mathcal{P}(\tau)) = \sup\limits_{u \in \mathcal{P}(\tau)} \langle s(\tau),\,u \rangle $$ также непрерывна по $$ \tau $$, и, следовательно, интегрируема.
Рассматривая $$ \mathcal{P}^*(\tau) = \underset{u(\cdot) \in \mathcal{P}(\tau)}{\text{Arg}\,\text{max}} \langle s(\tau),\,u \rangle $$, нужно проверить, что это многозначное отображение является измеримым. Для этого достаточно доказать его полунепрерывность сверху.
Так как полунепрерывность сверху равносильна замкнутости графика $$ \mathcal{P}^*(\tau) $$, то нам надо показать, что из $$ \tau^n \longrightarrow \tau $$, $$ u^n \longrightarrow u $$, $$ u^n \in \mathcal{P}^*(\tau^n) $$, при $$ n \longrightarrow \infty $$, следует, что $$ u \in \mathcal{P}^*(\tau) $$.
Для $$ u^n $$ и $$ \tau^n $$ выполнены следующие соотношения: \[ \langle s(\tau^n),\,u^n \rangle = \rho(s(\tau^n)\,|\,\mathcal{P}(\tau^n)), \] \[ \langle l,\,u^n \rangle \leq \rho(l\,|\,\mathcal{P}^*(\tau^n)), \]
Тогда, при переходе к пределу при $$ n \longrightarrow \infty $$ справедливо:
\[ \langle s(\tau),\,u \rangle = \rho(s(\tau)\,|\,\mathcal{P}(\tau)), \] \[ \langle l,\,u \rangle \leq \rho(l\,|\,\mathcal{P}^*(\tau)), \]
Значит $$ u \in \mathcal{P}^*(\tau) $$, что и дает замкнутость графика, и, следовательно, измеримость.
Лемма об измеримом селекторе описывается в курсе выпуклого анализа [1].
"Если многозначное отображение $$\mathcal{P}^*(\cdot)$$ измеримо, то существует такая измеримая функция (селектор) $$ u^*(\cdot) $$, что $$ u^*(\tau) \in \mathcal{P}^*(\tau) $$ для почти всех $$ \tau $$."
Пусть $$ u^*(\cdot) $$ $$ - $$ искомый измеримый селектор для $$ \mathcal{P}^*(\cdot) $$. Тогда, для него выполнено следующее неравенство: $$ \langle s(\tau),\,u^*(\tau) \rangle \leq \rho(s(\tau)\,|\,\mathcal{P}(\tau)) $$. Это означает, что интегралы из условия доказываемой леммы существуют. Следовательно, точная верхняя грань достигается на $$ u^*(\tau) \in \mathcal{P}^*(\tau) $$, т.е. тождество верно, что и требовалось доказать. $$\blacksquare$$
Применение
Таким образом можно выписать окончательный вид опорной функции: \[ \rho(l\,|\,\mathcal{X}[t_1]) = \langle l,\,X(t_1,t_0) \rangle + \int\limits^{t_1}_{t_0}\langle l,\,X(t_1,\tau)f(\tau) \rangle d\tau + \int\limits^{t_1}_{t_0}\rho(B^T(\tau)X^T(t_1,\tau)l\,|\,\mathcal{P}(\tau))d\tau. \]
Итак, оптимальное управление доставляет максимум выражению \[ \max\limits_{u \in \mathcal{P}(\tau)} \langle B^T(\tau)X^T(t_1,\tau)l,\,u \rangle \]
Обозначая $$ \psi(\tau) = X^T(t_1,\tau)l $$, можно получить финальную формулу для опорной функции: \[ \rho(l\,|\,\mathcal{X}[t_1]) = \langle \psi(t_0),\,x_0 \rangle + \int\limits^{t_1}_{t_0}\langle \psi(\tau),\,f(\tau) \rangle d\tau + \int\limits^{t_1}_{t_0}\rho(B^T(\tau)\psi(\tau)\,|\,\mathcal{P}(\tau))d\tau. \]
При этом $$ \psi(\tau) $$ называют сопряженной переменной (функцией). Из определения фундаментальной матрицы ясно, что $$ \psi(\tau) $$ удовлетворяет условиям и является решением системы:
\[ \begin{cases} \dot{\psi} = -A^T(\tau)\psi, \\ \psi(t_1) = l. \end{cases} \]
Список литературы
1) Арутюнов А.В. "Лекции по выпуклому и многозначному анализу" М.: ФИЗМАТЛИТ, 2016
2) Лекции по курсу "Оптимальное управление". Лектор: Комаров Юрий, 2020/2021.