Лемма о перестановке интеграла и супремума: различия между версиями

Материал из sawiki
Перейти к навигации Перейти к поиску
Строка 61: Строка 61:
 
Рассмотрим $$ \mathcal{P}^*(\tau) = \underset{u(\cdot) \in \mathcal{P}(\tau)}{Arg\,max} \langle s(\tau),\,u \rangle $$. Проверим, что это многозначное отображение является измеримым. Для этого достаточно доказать его полунепрерывность сверху. Так как полунепрерывность сверху равносильна замкнутости графика $$ \mathcal{P}^*(\tau) $$, то нам надо показать, что из $$ \tau^n \longrightarrow \tau $$, $$ u^n \longrightarrow u $$, $$ u^n \in \mathcal{P}^*(\tau^n) $$, при $$ n \longrightarrow \infty $$, следует, что $$ u \in \mathcal{P}^*(\tau) $$. Это равносильно соотношениям:
 
Рассмотрим $$ \mathcal{P}^*(\tau) = \underset{u(\cdot) \in \mathcal{P}(\tau)}{Arg\,max} \langle s(\tau),\,u \rangle $$. Проверим, что это многозначное отображение является измеримым. Для этого достаточно доказать его полунепрерывность сверху. Так как полунепрерывность сверху равносильна замкнутости графика $$ \mathcal{P}^*(\tau) $$, то нам надо показать, что из $$ \tau^n \longrightarrow \tau $$, $$ u^n \longrightarrow u $$, $$ u^n \in \mathcal{P}^*(\tau^n) $$, при $$ n \longrightarrow \infty $$, следует, что $$ u \in \mathcal{P}^*(\tau) $$. Это равносильно соотношениям:
 
\[
 
\[
     \langle s(\tau^n),\,u^n \rangle = \pho(s(\tau^n)\,|\,\mathcal{P}(\tau^n)),
+
     \langle s(\tau^n),\,u^n \rangle = \rho(s(\tau^n)\,|\,\mathcal{P}(\tau^n)),
 
\]  
 
\]  
 
\[
 
\[
     \langle l,\,u^n \rangle \leq \pho(l\,|\,\mathcal{P}^*(\tau^n)),
+
     \langle l,\,u^n \rangle \leq \rho(l\,|\,\mathcal{P}^*(\tau^n)),
 
\]  
 
\]  
  
Строка 70: Строка 70:
  
 
\[
 
\[
     \langle s(\tau),\,u \rangle = \pho(s(\tau)\,|\,\mathcal{P}(\tau)),
+
     \langle s(\tau),\,u \rangle = \rho(s(\tau)\,|\,\mathcal{P}(\tau)),
 
\]
 
\]
 
\[
 
\[
     \langle l,\,u \rangle \leq \pho(l\,|\,\mathcal{P}^*(\tau)),
+
     \langle l,\,u \rangle \leq \rho(l\,|\,\mathcal{P}^*(\tau)),
 
\]  
 
\]  
  

Версия 17:12, 29 ноября 2021

Условия перестановки интеграла и супремума складываются в лемму, которая возникает в задаче быстродействия (т.е. поиска управления, оптимального по времени) и применяется для облегчения расчета опорной функции множества достижимости.

Задача быстродействия

Тип задач оптимального управления, заключающегося в переводе системы из начального фиксированного положения в конечное, также фиксированное, за минимальное время.

Пусть наша система описывается следующими условиями:

\begin{equation}\label{ms} \begin{cases} \dot{x} = A(t)x(t) + B(t)u(t)+f(t), \\ x(t_0) = x^0, \\ x(t_1) = x^1, \\ u(\tau) \in \mathcal{P} \in \textit{conv}R^m, \\ t_1 - t_0 \longrightarrow \text{inf}, \end{cases} \end{equation}

где $$ x^0,\,x^1,\,t_0 $$ - фиксированы, $$ A(t),\,B(t),\,f(t) $$ - непрерывны, а $$ \mathcal{P} $$ непрерывно, как многозначное отображение (это требование гарантирует нам непрерывность опорной функции $$ \mathcal{\rho(l|\mathcal{P}(\tau))} $$ по $$ \tau $$ для любого $$ l $$).

Множество достижимости

Введем множество достижимости $$ \mathcal{X}[t_1] $$:

\[ \mathcal{X}[t_1] = \mathcal{X}(t_1,t_0,x^0) = \{x = x(t_1,t_0,x^0\,|\,u(\cdot)), u(\tau) \in \mathcal{P}\}. \]

Обозначение $$ \mathcal{X}[t_1] $$ означает, что в данный момент нам интересна зависимость $$ \mathcal{X} $$ только от переменной $$ t_1 $$, хотя в общем случае значение $$ \mathcal{X} $$ зависит от большего числа переменных.

Введем также трубку достижимости (функцию, отображающую время на соответствующее множество достижимости) как $$ \mathcal{X}[\cdot] $$. Ее графиком будем называть множество:

\[ \mathcal{X}[\cdot] = \{(t,\,x): x\in \mathcal{X}[t]\}. \]

Тогда опорная функция множества достижимости будет рассчитываться по следующей формуле:

\[ \rho(l\,|\,\mathcal{X}[t_1]) = \sup\limits_{u(\cdot)} \left[ \langle l,\,X(t_1,t_0) \rangle + \int\limits^{t_1}_{t_0}\langle B^T(\tau)X^T(t_1,\tau)l,\,u(\tau) \rangle d\tau + \int\limits^{t_1}_{t_0}\langle l,\,X(t_1,\tau)f(\tau) \rangle d\tau \right] = \] \[ = \langle l,\,X(t_1,t_0) \rangle + \int\limits^{t_1}_{t_0}\langle l,\,X(t_1,\tau)f(\tau) \rangle d\tau + \sup\limits_{u(\cdot)} \left[ \int\limits^{t_1}_{t_0}\langle B^T(\tau)X^T(t_1,\tau)l,\,u(\tau) \rangle d\tau \right]. \]

Теперь, у нас все готово для рассмотрения основной леммы.

Формулировка леммы о перестановке интеграла и супремума

Пусть рассматривается задача быстродействия \eqref{ms}. Тогда, обозначив $$s(\tau) = B^T(\tau)X^T(t_1,\tau)l$$, получим верное тождество: \[ \sup\limits_{u(\cdot)}\left[ \int\limits^{t_1}_{t_0} \langle s(\tau),\,u(\tau) \rangle \,d\tau\right] = \int\limits^{t_1}_{t_0}\left[\sup\limits_{u \in \mathcal{P}} \langle s(\tau),\,u \rangle\right] d\tau. \]

Доказательство леммы

Так как $$ s(\tau) $$ - непрерывная функция, то $$ \rho(s(\tau)|\mathcal{P}(t)) = \sup\limits_{u \in \mathcal{P}(\tau)} \langle s(\tau),\,u \rangle $$ непрерывно по $$ \tau $$, и, следовательно, интегрируема. Рассмотрим $$ \mathcal{P}^*(\tau) = \underset{u(\cdot) \in \mathcal{P}(\tau)}{Arg\,max} \langle s(\tau),\,u \rangle $$. Проверим, что это многозначное отображение является измеримым. Для этого достаточно доказать его полунепрерывность сверху. Так как полунепрерывность сверху равносильна замкнутости графика $$ \mathcal{P}^*(\tau) $$, то нам надо показать, что из $$ \tau^n \longrightarrow \tau $$, $$ u^n \longrightarrow u $$, $$ u^n \in \mathcal{P}^*(\tau^n) $$, при $$ n \longrightarrow \infty $$, следует, что $$ u \in \mathcal{P}^*(\tau) $$. Это равносильно соотношениям: \[ \langle s(\tau^n),\,u^n \rangle = \rho(s(\tau^n)\,|\,\mathcal{P}(\tau^n)), \] \[ \langle l,\,u^n \rangle \leq \rho(l\,|\,\mathcal{P}^*(\tau^n)), \]

для любого $$ l $$. Тогда

\[ \langle s(\tau),\,u \rangle = \rho(s(\tau)\,|\,\mathcal{P}(\tau)), \] \[ \langle l,\,u \rangle \leq \rho(l\,|\,\mathcal{P}^*(\tau)), \]

что верно, и, стало быть, $$ u \in \mathcal{P}^*(\tau) $$, что и дает нам замкнутость графика, и, следовательно, измеримость.

Воспользуемся леммой об измеримом селекторе из курса многозначного анализа:


"Если многозначное отображение $$\mathcal{P}^*$$ измеримо, то существует такая измеримая функция (селектор) $$ u^*(\cdot) $$, что $$ u^*(\tau) \in \mathcal{P}^*(\tau) $$ для почти всех $$ \tau $$."

Для этого селектора $$ \langle s(\tau),\,u^*(\tau) \rangle \leq \pho(s(\tau)\,|\,\mathcal{P}(\tau)) $$, интегралы в условии леммы существуют, что влечет за собой достижение точной верхней грани на $$ u(\tau) \in \mathcal{P}^*(\tau) $$, что и требовалось доказать. $$\blacksquare$$

Доказательство леммы