Теорема о чередовании нулей и её приложения

Материал из sawiki
Перейти к навигации Перейти к поиску

Постановка задачи

Рассмотрим движение материальной точки в нелинейном поле:

\begin{equation*} \ddot x + f(x, \dot x) = u. \end{equation*}

Перейдем от ОДУ 2-го порядка к системе ОДУ 1-го порядка. Сделаем замену \(x_1 = x, x_2 = \dot x\) и запишем начальные условия: \begin{equation*}\label{newSys} \begin{cases} \dot x_1 = x_2,\\ \dot x_2 = -f(x_1, x_2) + u,\\ x_1(t_0) = x_1^0, \ x_2(t_0) = x_2^0,\\ |u| \leq 1. \end{cases} \end{equation*}

Пусть \(f(0, 0) = 0\) (иначе воспользуемся заменой переменных). Требуется стабилизировать систему: \begin{equation*} \begin{cases} x_1(t_1) = x_2(t_1) = 0,\\ t_1 \rightarrow \text{min}. \end{cases} \end{equation*}

Принцип максимума Понтрягина для исходной задачи

Воспользуемся принципом максимума Понтрягина.

Функция Гамильтона–Понтрягина: \begin{equation*} H = \psi_1 x_2 - \psi_2 f(x_1, x_2) + \psi_2 u. \end{equation*}

Сопряженная система: \begin{equation*} \begin{cases} \dot \psi_1 = \psi_2 \frac{\partial f(x_1, x_2)}{\partial x_1},\\ \dot \psi_2 = -\psi_1 + \psi_2 \frac{\partial f(x_1, x_2)}{\partial x_2}.\\ \end{cases} \end{equation*} Условие максимума: \begin{equation*} u^* = \begin{cases} \sign \psi_2, \ \psi_2 \neq 0,\\ [-1, 1], \ \psi_2 = 0.\\ \end{cases} \end{equation*}

Если \(\psi_2 \equiv 0\) на \((\tau_1, \tau_2)\), то \(\dot \psi_2 = - \psi_1 + \psi_2 \frac{\partial f}{\partial x_2}\), но \(\psi_2 \equiv 0, \dot \psi_2 \equiv 0 \Rightarrow \psi_1 \equiv 0 \Rightarrow \psi \equiv 0 ?!\)

Следовательно, особый режим невозможен \(\Rightarrow u^* = \sign \psi_2\).

\begin{equation*} H = \psi_1 x_2 - \psi_2 f(x_1, x_2) + |\psi_2| \equiv \text{const}. \end{equation*}

Запишем задачу:

\begin{equation*} \begin{cases} \dot x_1 = x_2,\\ \dot x_2 = -f(x_1, x_2) + \sign \psi_2,\\ \dot \psi_1 = \psi_2 \frac{\partial f(x_1, x_2)}{\partial x_1},\\ \dot \psi_2 = -\psi_1 + \psi_2 \frac{\partial f(x_1, x_2)}{\partial x_2}. \end{cases} \end{equation*}

Теорема о чередовании нулей

Формулировка теоремы.
Если \(\tau_1 < \tau_2, [\tau_1, \tau_2] \subseteq [t_0, t_1]\), то:

  1. \( \begin{cases} \psi_2(\tau_1) = \psi_2(\tau_2) = 0,\\ x_2(\tau_1) = 0. \end{cases} \Rightarrow x_2(\tau_2) = 0. \)
  2. \( \begin{cases} \psi_2(\tau_1) = \psi_2(\tau_2) = 0,\\ x_2(\tau_1) \neq 0. \end{cases} \Rightarrow x_2(\tau_2) \neq 0, \exists \tau \in (\tau_1, \tau_2) : x_2(\tau) = 0. \)
  3. \( \begin{cases} x_2(\tau_1) = x_2(\tau_2) = 0,\\ x_2(t) \neq 0, \forall t \in (\tau_1, \tau_2),\\ \psi_2(\tau_1) = 0. \end{cases} \Rightarrow \psi_2(\tau_2) = 0. \)
  4. \( \begin{cases} x_2(\tau_1) = x_2(\tau_2) = 0,\\ x_2(t) \neq 0, \forall t \in (\tau_1, \tau_2),\\ \psi_2(\tau_1) \neq 0. \end{cases} \Rightarrow \psi_2(\tau_2) \neq 0, \exists \tau \in (\tau_1, \tau_2) : \psi_2(\tau) = 0. \)

Доказательство.
1) \begin{equation*} \psi_2(\tau_1) = 0, \ x_2(\tau_1) = 0 \Rightarrow \\ \Rightarrow H(\tau_1) = \psi_1(\tau_1) x_2(\tau_1) - \psi_2(\tau_1) f + |\psi_2(\tau_1)| = 0,\\ H \equiv \text{const} \Rightarrow \\ H(\tau_2) = \psi_1(\tau_2) x_2(\tau_2) - \psi_2(\tau_2) f + |\psi_2(\tau_2)| = 0 \Rightarrow \\ \Rightarrow \psi_1(\tau_2) x_2(\tau_2) = 0. \end{equation*}

Если \(\psi_1(\tau_2) = 0 \Rightarrow \psi \equiv 0 ?!\)

Тогда \(x_2(\tau_2) = 0\).

2) \begin{equation} \psi_2(\tau_1) = 0, \ x_2(\tau_1) \neq 0, \ \psi_1(\tau_1) \neq 0 \Rightarrow \\ \Rightarrow H(\tau_1) = \psi_1(\tau_1) x_2(\tau_1) - \psi_2(\tau_1) f + |\psi_2(\tau_1)| \neq 0,\\ H \equiv \text{const} \Rightarrow \\ H(\tau_2) = \psi_1(\tau_2) x_2(\tau_2) - \psi_2(\tau_2) f + |\psi_2(\tau_2)| \neq 0 \Rightarrow \\ \Rightarrow x_2(\tau_2) \neq 0. \end{equation}

Без ограничения общности, положим \(\psi_2(t) \neq 0, \forall t \in (\tau_1, \tau_2)\).

Первая ситуация, в которой \(\dot \psi_2(\tau_1) \dot \psi_2(\tau_2) < 0\)
Вторая ситуация, в которой \(\dot \psi_2(\tau_1) \dot \psi_2(\tau_2) < 0\)

Тогда возможны две ситуации, в каждой из которых \(\dot \psi_2(\tau_1) \dot \psi_2(\tau_2) < 0\):

\begin{equation*} \dot \psi_2(\tau_1) = - \psi_1(\tau_1) + \psi_2(\tau_1) \frac{\partial f}{\partial x_2} < 0 \ (> 0),\\ \dot \psi_2(\tau_2) = - \psi_1(\tau_2) + \psi_2(\tau_2) \frac{\partial f}{\partial x_2} > 0 \ (< 0),\\ \psi_2(\tau_1) = \psi_2(\tau_2) = 0 \Rightarrow \\ \dot \psi_2(\tau_1) \dot \psi_2(\tau_2) = \psi_1(\tau_1) \psi_1(\tau_2) < 0. \end{equation*}

Из (1)\[\psi_1(\tau_1) x_2(\tau_1) = \psi_1(\tau_2) x_2(\tau_2) \Rightarrow x_2(\tau_1) x_2(\tau_2) < 0.\]

Поскольку \(x_2()\) – непрерывная функция, то \(\exists \tau \in (\tau_1, \tau_2) : x_2(\tau) = 0\).

3) Рассмотрим функцию\[z(t) = \psi_1(t) x_2(t) + \psi_2(t) \frac{dx_2(t)}{dt}\].

\(z(t)\) – кусочна-непрерывна. Так как \(\dot x_2 = -f(x_1, x_2) + u\), то разрывы могут быть лишь в моменты переключений.

Пусть \(t_0\) – точка непрерывности. Тогда при \(t \in V_\delta(t_0)\):

\begin{equation*} \frac{dz(t)}{dt} = \psi_2 \frac{\partial f}{\partial x_1} x_2 + \psi_1 (-f + u) + (-\psi_1 + \psi_2 \frac{\partial f}{\partial x_2})(-f + u) + \\ + \ \psi_2(- \frac{\partial f}{\partial x_1} x_2 - \frac{\partial f}{\partial x_2} (-f + u)) = 0. \end{equation*}

Следовательно, \(z(t)\) – кусочно-постоянная.

Если же \(t_0\) – момент переключения, то \(\psi_2(t_0) = 0\).

Но тогда и \(z(t_0 - 0) = z(t_0 + 0) \Rightarrow z(t) \equiv \text{const}\).

\begin{equation*} z(\tau_1) = \phi_1(\tau_1) x_2(\tau_1) + \phi_2(\tau_1) \dot x_2(\tau_1) = 0,\\ z(\tau_2) = z(\tau_1) = \phi_1(\tau_2) x_2(\tau_2) + \phi_2(\tau_2) \dot x_2(\tau_2) = 0. \end{equation*}

Следовательно, \(\psi_2(\tau_2) = 0\).

4) Аналогично п. 3):

\begin{equation*} z(\tau_1) = \phi_1(\tau_1) x_2(\tau_1) + \phi_2(\tau_1) \dot x_2(\tau_1) \neq 0,\\ z(\tau_2) = z(\tau_1) = \phi_1(\tau_2) x_2(\tau_2) + \phi_2(\tau_2) \dot x_2(\tau_2) \Rightarrow \psi_2(\tau_2) \neq 0. \end{equation*}

\begin{equation*} \dot x_2(\tau_1) \dot x_2(\tau_2) < 0 \Rightarrow \psi_2(\tau_1) \psi_2(\tau_2) < 0 \Rightarrow \\ \Rightarrow \exists \tau \in (\tau_1, \tau_2) : \psi_2(\tau) = 0. \end{equation*}

Решение исходной задачи

Рассмотрим исходную задачу: \begin{equation*} \begin{cases} \dot x_1 = x_2,\\ \dot x_2 = -f(x_1, x_2) + u,\\ x_1(t_0) = x_1^0, \ x_2(t_0) = x_2^0,\\ x_1(t_1) = x_2(t_1) = 0. \end{cases} \end{equation*} \begin{equation*} t_1 - t_0 \rightarrow \min_{u(\cdot)}. \end{equation*}

Построим множество разрешимости (будем отталкиваться от $$t_1 = 0$$, так как система автономна): \begin{equation*} W(t, t_1, \theta) = W(t - t_1, 0, \theta). \end{equation*}

Сопряженная система: \begin{equation*} \begin{cases} \dot \psi_1 = \psi_2 \frac{\partial f(x_1, x_2)}{\partial x_1},\\ \dot \psi_2 = -\psi_1 + \psi_2 \frac{\partial f(x_1, x_2)}{\partial x_2}.\\ \end{cases} \end{equation*} Условие максимума: \begin{equation*} u^* = \begin{cases} \sign \psi_2, \ \psi_2 \neq 0,\\ [-1, 1], \ \psi_2 = 0.\\ \end{cases} \end{equation*}

$$\tau = 0: x_1(0) = x_2(0) = 0 \Rightarrow$$ удобно применить теорему.

a) Пусть $$\psi_2(0) = 0$$. Тогда $$\psi_1(0) \neq 0 \Rightarrow$$ нормируем $$\psi_1(0) = \pm 1$$:

1) $$\psi_1(0) = 1 \Rightarrow \psi_2(\tau) > 0, u(\tau) \equiv 1$$ при $$\tau \in (-\delta, 0)$$: \begin{equation*} (S_+) \begin{cases} \dot x_1 = x_2,\\ \dot x_2 = -f(x_1, x_2) + 1,\\ \dot \psi_1 = \psi_2 \frac{\partial f(x_1, x_2)}{\partial x_1},\\ \dot \psi_2 = -\psi_1 + \psi_2 \frac{\partial f(x_1, x_2)}{\partial x_2}. \end{cases} \end{equation*}

2) $$\psi_1(0) = -1 \Rightarrow \psi_2(\tau) < 0, u(\tau) \equiv -1$$ при $$\tau \in (-\delta, 0)$$: \begin{equation*} (S_-) \begin{cases} \dot x_1 = x_2,\\ \dot x_2 = -f(x_1, x_2) - 1,\\ \dot \psi_1 = \psi_2 \frac{\partial f(x_1, x_2)}{\partial x_1},\\ \dot \psi_2 = -\psi_1 + \psi_2 \frac{\partial f(x_1, x_2)}{\partial x_2}. \end{cases} \end{equation*}

Поскольку $$\psi(0), x(0)$$ определены, то можем интегрировать системы $$(S_+), (S_-)$$ в обратном времени с учетом дальнейших переключений (знаем все о системах).

б) Пусть теперь $$\psi_2(0) \neq 0 \Rightarrow \psi_2(0) > 0, (S_+)$$ или $$\psi_2(0) < 0, (S_-)$$.

По теореме о нулях: \begin{equation*} \exists \tau_п < 0: \psi_2(\tau_п) = 0. \end{equation*}

Удобно нормировать вектор $$\psi$$ в момент первого с конца переключения.

$$W^i_+, W^i_-$$ – траектории $$(x_1, x_2)$$, полученные из систем $$(S_+), (S_-)$$ соответственно, до первого момента переключения $$x_2 = 0$$, начиная с $$\theta$$.

С учетом возможных переключений можем построить множества: \begin{equation*} W_+ = W^0_+ \cup W^1_+ \cup W^2_+ \cdots \\ W_- = W^0_- \cup W^1_- \cup W^2_- \cdots \end{equation*}

Множества могут быть как конечными, так и бесконечными.

$$W_+ \cup W_-$$ – кривая переключений.

Таким образом, можем построить множество разрешимости и решить задачу быстродействия:

  1. Из точки (0, 0) выпускаем пробные траектории систем при $$u \equiv 1, u \equiv -1$$. Находим времена первого пересечения с осью абсцисс: $$t_1, t_2$$;
  2. По теореме о нулях, $$\exists \tau_1 \in [t_1, 0], \tau_2 \in [t_2, 0]$$, в которых $$\psi_2(\tau) = 0$$ и происходит переключение. Перебираем возможные $$\tau_1, \tau_2$$ по сетке;
  3. Нормируем $$\psi(\tau_1) / \psi(\tau_2)$$ и решаем задачу Коши для совместной системы;
  4. Получаем $$Г[\tau] = \cup_{\tau_1 \in [t_1, 0]} \{x(\tau, 0, \theta) |\ u = u^*\} \cup \cup_{\tau_2 \in [t_2, 0]} \{x(\tau, 0, \theta) |\ u = u^*\}$$. Выделяем $$\partial W(\tau, 0, \theta) \subseteq Г[\tau]$$ (возможны и точки самопересечения, и особые точки);
  5. $$\tau_1 < \tau_2 \Rightarrow W[\tau_1] \supset W[\tau_2]$$. Следовательно, можно разбить плоскость на изохроны и выбрать узел, аппроксимирующий точку $$(x^0_1, x^0_2)$$.

Список литературы

  • И.А. Чистяков "Лекции по оптимальному управлению", 2022
  • Э.Б. Ли, Л. Маркус "Основы теории оптимального управления", М.: Наука, 1972