Непрерывность и дифференцируемость траекторий по начальным данным: различия между версиями

Материал из sawiki
Перейти к навигации Перейти к поиску
Строка 55: Строка 55:
 
   \end{aligned}</math>
 
   \end{aligned}</math>
  
Раз <math>y_j(t)</math>  — <math>\varepsilon</math>-решение, то справедливо <math>\left\lVert\dot y(t) - g(t, y(t)) \right\rVert \leqslant\varepsilon_j.</math> Обозначим <math> z_j (t) = \dot y_j(t) - g(t, y_j(t)).</math> Ясно, что <math>\left\lVert z{j} \right\rVert \leqslant\varepsilon_j.</math> Проинтегрируем <math>z_j(t):</math>
+
Раз <math>y_j(t)</math>  — <math>\varepsilon</math>-решение, то справедливо <math>\left\lVert\dot y(t) - g(t, y(t)) \right\rVert \leqslant\varepsilon_j.</math> Обозначим <math> z_j (t) = \dot y_j(t) - g(t, y_j(t)).</math> Ясно, что <math>\left\lVert z_j \right\rVert \leqslant\varepsilon_j.</math> Проинтегрируем <math>z_j(t):</math>
  
 
<math>\begin{aligned}
 
<math>\begin{aligned}

Версия 02:24, 21 декабря 2021

Рассмотрим следующую задачу Коши\[\begin{aligned} \left\{ \begin{aligned} &\dot x(t) = g(t, x(t)),\\ &x(t_0) = x^0. \end{aligned} \right.\end{aligned}\] Решение системы обозначим \(x[t] \stackrel{\text{def}}{=}x(t, t_0, x^0).\)

Непрерывность, частный случай

Будем предполагать, что \(\begin{aligned} g: [T_0, T_1] \times \mathbb{R}^n \to \mathbb{R}^n, -\infty \leqslant T_0 < T_1 \leqslant+\infty.\end{aligned}\) Также наложим следующие ограничения (Restrictions):

  1. \(\begin{aligned}[t]\label{technical} &g(t) \text{ измерима по } t \in [T_0, T_1] \forall x \in \mathbb{R}^n, \\ &g(t) \text { непрерывна по } x \text{ для почти всех } \dot \forall t \in [T_0, T_1], \end{aligned}\)
  2. \(\begin{aligned}[t]\label{Lipsh} \exists L = const > 0: \left\lVert g(t, x_1) - g(t, x_2) \right\rVert \leqslant L\left\lVert x_1 - x_2 \right\rVert \quad \forall x_1, x_2 \in \mathbb{R}^n, \dot \forall t \in [T_0, T_1], \end{aligned}\)
  3. \(\begin{aligned}[t]\label{sublinear} \exists A, B = const: A, B > 0: \left\lVert g(t, x) \right\rVert \leqslant A\left\lVert x \right\rVert + B \quad \forall x \in \mathbb{R}^n,\dot \forall t \in [T_0, T_1]. \end{aligned}\)

Под записью \(\dot \forall t\) подразумевается "для почти всех \(t\)". Ограничения (1.) носят технический характер и необходимы для обеспечения существования решения. Ограничениe (2.)  —условие Липшица. Ограничениe (3.) называется условием сублинейного роста (в данных теоремах оно не потребуется, однако оно потребуется в дальнейшем для продолжимости решения).

Далее введем введем переобозначения и будем рассматривать следующую систему (System)\[\begin{aligned} \label{newSys} \left\{ \begin{aligned} &\dot x(t) = g(t, x(t)),\\ &x(\tau) = \xi,\\ & \tau \in (T_0, T_1). \end{aligned} \right.\end{aligned}\]

функция \(y(t)\) называется \(\varepsilon-\)решением системы (System), если

\(\begin{aligned} &y(t) \in AC([\tau_0, \tau_1, \mathbb{R}^n]),\\ &\left\lVert\dot y(t)- g(t, y(t)) \right\rVert \leqslant\varepsilon,\\ &\dot \forall t \in [\tau_0, \tau_1]. \end{aligned}\)

То есть производная абсолютно непрерывной функции \(y(t)\) является решением уравнения \(\dot y(t) = g(t, y(t))\) с погрешностью не больше, чем \(\varepsilon.\)

Пусть \(y_1(t)\)  — \(\varepsilon_1\)-решение, а \(y_2(t)\)  — \(\varepsilon_2\)-решение задачи (System), \(\varepsilon_1, \varepsilon_2 > 0, y_1(\tau), y_2(\tau)\) определены на \([\tau_0, \tau_1],\) \(T_0 < \tau_0 < \tau < \tau_1 < T_1\) и \(\left\lVert y_1(\tau) - y_2(\tau) \right\rVert \leqslant\delta.\) Тогда \(\begin{aligned} \left\lVert y_1(t) - y_2(t) \right\rVert \leqslant\delta e^{L\left|t - \tau\right|} + \frac{\varepsilon}{L}\left(e^{L\left|t - \tau\right|} - 1\right), \varepsilon= \varepsilon_1 + \varepsilon_2 \geqslant 0, \tau_0 < t < \tau_1. \end{aligned}\)

Раз \(y_j(t)\)  — \(\varepsilon\)-решение, то справедливо \(\left\lVert\dot y(t) - g(t, y(t)) \right\rVert \leqslant\varepsilon_j.\) Обозначим \( z_j (t) = \dot y_j(t) - g(t, y_j(t)).\) Ясно, что \(\left\lVert z_j \right\rVert \leqslant\varepsilon_j.\) Проинтегрируем \(z_j(t):\)

\(\begin{aligned} \int \limits_{\tau}^{t}z_j(s)ds = y_j(t) - y_j(\tau) - \int \limits_{\tau}^{t}g(s, y_j(s)ds. \end{aligned}\)

Вычтем друг из друг равенства для \(j = 1, 2:\)

\(\begin{aligned} \int \limits_{\tau}^{t}\left[z_1(s) - z_2(s)ds\right] = y_1(t) - y_1(\tau) - (y_2(t) - y_2(\tau) )- - \int \limits_{\tau}^{t}\left[g(s, y_1(s) - g(s, y_2(s)) \right]ds. \end{aligned}\)

Обозначим \(\Delta y(t) = y_1(t) - y_2(t), r(t) = \left\lVert\Delta y(t) \right\rVert.\) Воспользовавшись Липшицевостью функции \(g(t, y_j(t))\) и тем, что \(\left\lVert z_j(t) \right\rVert < \varepsilon_j,\) получим следующее равенство (Eq1)\[\begin{aligned} \label{lem1:eq1} r(t) \leqslant r(\tau) + L \int \limits_{\min (t, \tau)}^{\max (t, \tau)}r(s)ds + \varepsilon\left|t - \tau\right|. \end{aligned}\]

Не ограничивая общности положим \(t > \tau\) (если не так, просто переобозначим \(t = \tau, \tau = t\)). Обозначим \(r(t) = \dot R(t).\) Тогда после того, как воспользуемся условием \(r(\tau) < \delta\), (Eq1) примет вид\[\begin{aligned} \dot R(t) - LR(t) \leqslant\delta + \varepsilon(t - \tau). \end{aligned}\]

Домножим на интегрирующий множитель \(e^{-Lt},\) и получим\[\begin{aligned} \frac{d}{dt}(R e^{Lt}) \leqslant(\delta + \varepsilon(t - \tau))e^{-Lt}. \end{aligned}\]

Проинтегрировав на отрезке \([\tau, t]\) и домножив на \(e^{Lt}\) получим\[\begin{aligned} R(t) = \frac{\delta}{L}\left(e^{-L(t - \tau)} -1 \right) - \frac{\varepsilon}{L}(t - \tau) + \frac{\varepsilon}{L^2}\left(e^{L(t - \tau)} -1 \right). \end{aligned}\]

Подставим получившийся результат в (Eq1) вместо интеграла, получим\[\begin{aligned} r(t) \leqslant\delta + \delta \left(e^{l(t - \tau)} -1 \right) + \varepsilon\left( \frac{e^{L(t - \tau)} - 1}{L}\right). \end{aligned}\]

Пусть \(x(t, \tau, \xi)\)  — решение задачи (System) и выполняются условия (Restrictions). Тогда \(x(t, \tau, \xi) \in C((T_0, T_1)^2 \times \mathbb{R}^n).\)

Обозначим \(V = (T_0, T_1)^2 \times \mathbb{R}^n.\) Решение будем строить методом последовательных приближений. Положим

\(\begin{aligned} x_0(t, \tau, \xi) = y[t] + \xi - y[\tau], \end{aligned}\)

где \(y[t] = x(t, t_0, x_0)\)  — решение для некоторого \(T_0 < t_0 < T_1.\) То есть

\(\begin{aligned} y(t) = y(\tau) + \int \limits_{\tau}^{t}g(s, y(s))ds. \end{aligned}\)

Положим \(k\)-ое приближение\[\begin{aligned} x_k(t, \tau, \xi) = \xi + \int \limits_{\tau}^{t}g(s, x_{k-1}(s, \tau, \xi))ds. \end{aligned}\]

Далее под индукции покажем оценку для \(\left\lVert x_k(t, \tau, \xi) - x_{k-1}(t, \tau, \xi) \right\rVert.\) База\[\begin{aligned} \left\lVert x_1(t, \tau, \xi) - x_{0}(t, \tau, \xi) \right\rVert = =\left\lVert\int \limits_{tau}^{t} \left[g(s, x_0(s, \tau, \xi)) - g(s, y[s])ds\right] \right\rVert \leqslant L\left\lVert\xi - y[\tau] \right\rVert\left|t - \tau\right|. \end{aligned}\]

Аналогично для произвольного \(k\) имеем

\(\begin{aligned} \left\lVert x_k(t, \tau, \xi) - x_{k-1}(t, \tau, \xi) \right\rVert \leqslant L^{k+1}\frac{\left|t - \tau\right|^{k+1}}{(k+1)!}\left\lVert\xi -y[\tau] \right\rVert \to 0, k \to +\infty. \end{aligned}\)

Представим \(x_k(t, \tau, \xi) = \sum \limits_{i = 0}^{k}x_{i}(t, \tau, \xi) - x_{i-1}(t, \tau, \xi).\) Тогда подставив полученные выше оценки получим\[\begin{aligned} \left\lVert x_k(t, \tau, \xi) - y[t] \right\rVert = \left\lVert\sum \limits_{i = 1}^{k}x_{i}(t, \tau, \xi) - x_{i-1}(t, \tau, \xi) \right\rVert \leqslant \sum \limits_{i = 1}^{k}\left\lVert x_{i}(t, \tau, \xi) - x_{i-1}(t, \tau, \xi) \right\rVert \leqslant \leqslant\sum \limits_{i = 1}^{k} L^{i+1}\frac{\left|t - \tau\right|^{i+1}}{(i+1)!}\left\lVert\xi -y[\tau] \right\rVert \leqslant e^{L(t - \tau)}\left\lVert\xi - y[\tau] \right\rVert. \end{aligned}\]

Получили, что функциональный ряд ограничен сверху на любом компакте \(K \subset V\), значит по признаку Даламбера он равномерно сходится. Из непрерывности \(y[t]\) (Restrictions) следует непрерывность \(x_k(t, \tau, \xi).\) При этом заметим, что \(x\)  — неподвижная точка сжимающего отображения \(G(x) = \xi + \int \limits_{\tau}^{t}g(s, x(s, \tau, t)),\) значит

\(\begin{aligned} x_k[t] \rightrightarrows x[t], k \to \infty \end{aligned}\)

Тогда выполнив предельный переход, получаем, что

\(\begin{aligned} \left\lVert x(t, \tau, \xi) - y[t] \right\rVert \leqslant e^{L(t - \tau)}\left\lVert\xi - y[\tau] \right\rVert. \end{aligned}\)

При этом в силу непрерывности \(x_k[t]\) и равномерной сходимости следует, что \(x[t]\) непрерывна.

\(x(t, \tau, \cdot)\) является гомеоморфизмом, т. е. \(x(t, \tau, \cdot): \mathbb{R}^n \to \mathbb{R}^n\) взаимооднозначное непрерывное, и обратное также непрерывно, при этом\[\begin{aligned} \left\{ \begin{aligned} &\dot x(t) = f(t, x(t), u(t)),\\ &x(t_0) = x_0,\\ & u(t) \in {\mathcal{P}}(t). \end{aligned} \right.\end{aligned}\]

\({\mathcal{X}}[t] = {\mathcal{X}}(t, t_0, x_0).\) Тогда если \(\xi \in \int {\mathcal{X}}[\tau],\) \(\forall t > \tau, \forall u(\cdot), s \in [t, \tau]\)

\(\begin{aligned} x[s] = x(s, \tau, \xi | u(\cdot)).\end{aligned}\)

Если \(\xi \in \int {\mathcal{X}}[\tau],\) то некоторая окрестность \(U(\xi) \subset {\mathcal{X}}[\tau].\) Тогда возьмем \(x \in U(\xi)\) и рассмотрим \(y[s] = x(s, \tau, x|u(\cdot)):\) \(\begin{aligned} \bigcup \limits_{x \in U(\xi)}\{y[s]\} \subset {\mathcal{X}}[s] \Rightarrow x[s] \in \int \bigcup \limits_{x \in U(\xi)} \{y[s]\}. \end{aligned}\)

То есть если в какой-то момент времени траектория провалилась внутрь трубки достижимости, то обратно на границу она вернуться не может. В линейных система траектория движется вдоль границы постоянно.

Дифференцируемость

Пусть выполнены условия (Restrictions) и, кроме того, производная \(\frac{\partial g}{\partial x}\) существует \(\forall x \in \mathbb{R}^n, \dot \forall t \in [T_0, T_1],\) измерима по \(t\) непрерывна по \(x\) а также удовлетворяет следующему условию регулярности: пусть \(\forall \tau_0, \tau_1: T_0 < \tau_0 < \tau_1 < T_1, \forall \varepsilon> 0, \forall D \subset \mathbb{R}^n, D\)  — непустой компакт, \(\exists \delta(\varepsilon, \tau_0, \tau_1, D) > 0:\)

\(\begin{aligned} \forall x_1, x_2 \in D: \left\lVert x_1 - x_2 \right\rVert \leqslant\delta \Rightarrow \Rightarrow \left\lVert\frac{\partial g}{\partial x}(t, x_1) - \frac{\partial g}{\partial x}(t, x_2) \right\rVert \leqslant\varepsilon \forall t \in [\tau_0, \tau_1]. \end{aligned}\)

Тогда \(\exists \frac{\partial x(t, \tau, \xi)}{\partial \xi} \left|_{(t, t_0, x_0)} \right. = Y(t, \tau, \xi), Y[\cdot] \in AC,\) удовлетворяет уравнению в вариациях\[\begin{aligned} \left\{ \begin{aligned} &\dot Y[t] = \frac{\partial g(t, x(t, \tau, \xi))}{\partial x}Y[t],\\ &Y[\tau] = E. \end{aligned} \right. \end{aligned}\]

Обозначим \(y[t] = x(t, \tau, \xi),\) зафиксируем \(\forall h \in \mathbb{R}^n\) и рассмотрим \(x_h(t) = x(t, \tau, \xi + \alpha h).\) Обозначим \(\nu_h(t, \tau, \xi, \alpha) = x_h[t] - y[t].\) Применим Лемму (1) для оценки нормы этой величины\[\begin{aligned} \left\lVert\nu_h(t, \tau, \xi, \alpha) \right\rVert \leqslant\left|\alpha\right| \left\lVert h \right\rVert e^{L(t - \tau)} \xrightarrow{\alpha \to 0}0, \end{aligned}\]

При этом сходимость равномерная по \((t, \tau, \xi)\) на произвольном компакте. Продифференцируем \(\nu_h\) по времени\[\begin{aligned} \frac{d \nu_h(t, \tau, \xi, \alpha)}{dt} = g(t, x_h[t]) - g(t, y[t]) =\{\text{формула конечных приращений}\} = =\left[ \frac{\partial g}{\partial x} (t, y[t] + \beta(t)(x_h[t] - y[t]) \right]\nu_h(t, \tau, \xi, \alpha) = **, \end{aligned}\]

где \(\beta(t) \in (0, 1)\)  — множитель из формулы конечных приращений. Выберем \(\tau_0, \tau_1: T_0 < \tau_0 < \tau_1 < T_1\) и \(D \subset \mathbb{R}^n\)  — компакт такой, что

\(\begin{aligned} \forall \left\{ \begin{aligned} &t \in [\tau_0, \tau_1], \\ &\beta \in [0, 1], \\ &\tau \in [\tau_0, \tau_1], \\ &\alpha: \left|\alpha\right| < \alpha_0,\\ \end{aligned} \right| \Rightarrow y[t] + \beta \nu_h(t, \tau, \xi, \alpha) \in D. \end{aligned}\)

Такое сделать возможно ввиду ограниченности \(y[t]\) и оценки на \(\nu_h.\) Из условий регулярности на \(g:\)

\(\begin{aligned} \forall \varepsilon> 0 \exists \delta = \delta(\varepsilon, \tau_0, \tau_1, D) > 0: \left\lVert\frac{\partial g(t, y[t])}{\partial x} - \frac{\partial g(t, y[t] + \beta[t]\nu_h)}{\partial x} \right\rVert \leqslant\varepsilon, \quad \left\lVert\nu_h \right\rVert \leqslant\delta. \end{aligned}\)

Введем обозначение\[\Gamma \stackrel{\text{def}}{=}-\frac{\partial g(t, y[t])}{\partial x} - \frac{\partial g(t, y[t] + \beta[t]\nu_h)}{\partial x}.\] Тогда продолжая равенство \(**\) получим\[\begin{aligned} ** = \left[ \frac{\partial g}{\partial x}(t, y[t]) + \Gamma \right] \nu_h(t, \tau, \xi, \alpha) = \{\gamma: \alpha \gamma = \Gamma \nu_h \Rightarrow \left\lVert\gamma \right\rVert \leqslant\left\lVert\Gamma \right\rVert\left\lVert h \right\rVert e^{L\left|t - \tau\right|} \} = = \frac{\partial g}{\partial x}(t, y[t])\nu_h(t, \tau, \xi, \alpha) + \gamma \alpha. \end{aligned}\]

Введем еще одну функцию \(\varphi_h(t, \tau, \xi, \alpha) \stackrel{\text{def}}{=}\frac{\nu_h(t, \tau, \xi, \alpha)}{\alpha}.\) Для нее справедливо\[\begin{aligned} \frac{\partial \varphi_h}{\partial t}(t, \tau, \xi, \alpha) = \frac{\partial g}{\partial x}(t, y[t])\varphi_h(t, \tau, \xi, \alpha) + \gamma. \end{aligned}\]

То есть \(\varphi_h\)  — \(\tilde \varepsilon\)-решение уравнения в вариациях.

\(\begin{aligned} \dot z[t] = \frac{\partial g}{\partial x}(t, y[t])z[t], \end{aligned}\)

где в качестве \(\tilde \varepsilon\) выступает \(\gamma: \left\lVert\gamma \right\rVert \leqslant\tilde \varepsilon.\) Пусть \(\psi_h[\cdot] = \psi_h(\cdot, \tau)\)  — решение уравнения в вариациях из условия теоремы c начальный условием \(\psi_h[\tau] = h.\) Тогда верно, что

\(\begin{aligned} \varphi_h(\tau, \tau, \xi, \alpha) = \frac{x_h[\tau] - y[\tau]}{\alpha} = \frac{\xi + \alpha h - \xi}{\alpha} = h. \end{aligned}\)

Значит верно, что

\(\begin{aligned} \left\lVert\varphi_h(\tau, \tau, \xi, \alpha) - \psi_h(\tau, \tau) \right\rVert = 0. \end{aligned}\)

Применим лемму 1: при \(\delta = 0, \varepsilon_1 = \tilde \varepsilon, \varepsilon_2 = 0\) верно\[\begin{aligned} \left\lVert\varphi_h(t, \tau, \xi, \alpha) - \psi_h(t, \tau) \right\rVert \leqslant \frac{\varepsilon}{L}(e^{L\left|t - \tau\right|} - 1) < \varepsilon^*, \end{aligned}\]

где \(\varepsilon^*\)  — требуемая на этом шаге оценка. Она выполняется при \(\left|alpha\right| \leqslant\alpha_0.\) Далее раскручивая цепочку замен для \(\varepsilon^* \to \tilde \varepsilon\to \varepsilon\to \delta,\) воспользуемся ранее полученной оценкой

\(\begin{aligned} \left\lVert\nu_h \right\rVert \leqslant\left|\alpha\right|\left\lVert h \right\rVert e^{L\left|t - \tau\right|}. \end{aligned}\)

Из нее можно очевидным образом

\(\begin{aligned} \forall \varepsilon^* > 0 \exists \tilde \alpha > 0: \left|\alpha\right| \leqslant\tilde \alpha \Rightarrow \left\lVert\nu_h \right\rVert \leqslant\delta. \end{aligned}\)

То есть

\(\begin{aligned} \varphi_h \rightrightarrows \psi_h, \quad \alpha \to 0, \end{aligned}\)

на компакте \(K = [\tau_0, \tau_1]^2.\) То есть искомый предел существует, и теперь можно вычислять \(\frac{\partial x}{\partial h}\)  — производная по направлению \(h.\) В силу того, что \(h\) произвольный, можем вместо него подставить по очереди произвольный ортонормированный базис \(e_1, \dots, e_n.\) Чтобы получить итоговое \(Y[\cdot],\) найдем \(\frac{\partial x}{\partial e_1}, \dots, \frac{\partial x}{\partial e_n},\) и результаты запишем в матрицу. Тогда получим \(Y[\cdot],\) которое удовлетворяем уравнению в вариациях и начальному условию \(Y[\tau] = I.\)

Чувствительность к вариации в начале\[\begin{aligned} x(t, \tau, \xi) = x(t, \tau, \xi_0) + Y[t, \tau, \xi_0](\xi - \xi_0) + o(\left\lVert\xi - \xi_0 \right\rVert). \end{aligned}\]

Ограничим \(u\) замкнутым шаром радиуса \(C > 0: B_C(0),\) выберем \(\forall D \subset \mathbb{R}^n\)  — компакт. Тогда \(\forall [\tau_0, \tau_1] \Rightarrow K = [\tau_0, \tau_1] \times D \times B_C(0)\)  — компакт. А значит из непрерывности \(\frac{\partial f}{\partial x}(t, x, u)\) следует равномерная непрерывность на \(K.\) Тогда

\(\begin{aligned} \left\lVert\frac{\partial f}{\partial x}(t, x_1, u) - \frac{\partial f}{\partial x}(t, x_2, u) \right\rVert \leqslant\varepsilon\quad \forall x_1, x_2 \in K, \tau \in [\tau_0, \tau_1], u \in B_C(0). \end{aligned}\)

В силу произвольности \(K\) получаем требуемое утверждение.

Список литературы

1) Комаров Ю. Лекции по курсу "Оптимальное управление", 2020/2021.

2) Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. "Математическая теория оптимальных процессов", М.: Наука, 1983.