Теорема А.А. Фельдбаума о числе переключений: различия между версиями

Материал из sawiki
Перейти к навигации Перейти к поиску
 
(не показано 47 промежуточных версий этого же участника)
Строка 1: Строка 1:
 +
[https://ru.wikipedia.org/wiki/%D0%A4%D0%B5%D0%BB%D1%8C%D0%B4%D0%B1%D0%B0%D1%83%D0%BC,_%D0%90%D0%BB%D0%B5%D0%BA%D1%81%D0%B0%D0%BD%D0%B4%D1%80_%D0%90%D1%80%D0%BE%D0%BD%D0%BE%D0%B2%D0%B8%D1%87 Александр Аронович Фельдбаум] — советский учёный, специалист в области автоматического управления и элементной базы ЭВМ. Один из основоположников оптимального управления, автор принципа дуального управления в теории самонастраивающихся и самообучающихся систем.  Именно он первым разъяснил и поставил общую задачу оптимального управления перед группой выдающихся математиков во главе с академиком Л. С. Понтрягиным, а также сформулировал и доказал теорему о числе переключений.
 +
__TOC__
 
== Постановка задачи ==
 
== Постановка задачи ==
 
Закон движения объекта записывается в виде линейной системы дифференциальных уравнений:
 
Закон движения объекта записывается в виде линейной системы дифференциальных уравнений:
\[
 
\frac{dx_i}{dt} = \sum\limits_{k = 1}^{n}a_{ik}x_k + \sum\limits_{l = 1}^m b_{il}u_l,
 
\]
 
или в векторной форме:
 
 
\begin{equation}
 
\begin{equation}
 
\frac{dx}{dt} = Ax + Bu,
 
\frac{dx}{dt} = Ax + Bu,
 
\end{equation}
 
\end{equation}
где $$A$$ — матрица коэффициентов, имеющая все действительные собственные значения.<br>
+
где $$A \in \mathbb{R}^{n \times n}$$ — матрица коэффициентов, имеющая все действительные собственные значения; $$B \in \mathbb{R}^{n \times m}.$$<br>
Будем рассматривать задачу быстродействия, то есть задачу о минимизации времени перехода: \[t_1 - t_0 = \int\limits_{t_0}^{t_1}dt.\]<br>
+
Будем рассматривать [[Задача быстродействия|задачу быстродействия]], то есть задачу о минимизации времени перехода: \[t_1 - t_0 = \int\limits_{t_0}^{t_1}dt.\]<br>
 
Множество допустимых управлений $$U$$ представляет собой параллелепипед, определенный неравенствами:
 
Множество допустимых управлений $$U$$ представляет собой параллелепипед, определенный неравенствами:
 
\begin{equation}
 
\begin{equation}
 
\alpha_i \leq u_i \leq \beta_i, i = 1, ..., m.
 
\alpha_i \leq u_i \leq \beta_i, i = 1, ..., m.
 
\end{equation}
 
\end{equation}
Гамильтониан $$\mathscr{H}(\psi, x, u)$$ системы $$(1)$$ имеет вид:
 
\[
 
\mathscr{H} = (\psi, Ax) + (\psi, Bu) = \sum\limits_{j = 1}^n \psi_j \sum\limits_{i = 1}^n a_{ji}x_i + \sum\limits_{j = 1}^n \psi_j \sum\limits_{i = 1}^m b_{ji}u_i.
 
\]
 
 
<br>
 
<br>
Вспомогательная система уравнений записывается следующим образом:
+
Сопряженная система уравнений записывается следующим образом:
\[
 
\frac{d\psi_j}{dt} = - \sum\limits_{i = 1}^na_{ji}\psi_j, j = 1, ..., n,
 
\]
 
или в векторной форме:
 
 
\begin{equation}
 
\begin{equation}
 
\frac{d\psi}{dt} = -A^{T}\psi.
 
\frac{d\psi}{dt} = -A^{T}\psi.
 
\end{equation}
 
\end{equation}
На основании принципа максимума можно заключить, что если $$u(t)$$ — оптимальное управление, переводящее точку $$x_0(t)$$ в точку $$x_k(t)$$, то существует такое решение $$\psi(t)$$ вспомогательной системы $$(3)$$, что:
+
На основании [[Принцип максимума Л.С. Понтрягина для общей задачи оптимального управления|принципа максимума]] можно заключить, что если $$u(t)$$ — оптимальное управление, переводящее точку $$x_0(t)$$ в точку $$x_k(t)$$, то существует такое решение $$\psi(t)$$ системы $$(3)$$, что:
 
\begin{equation}
 
\begin{equation}
(\psi(t), Bu(t)) = M(\psi(t)),
+
(\psi(t), Bu(t)) = M(\psi(t), x(t)),
 
\end{equation}
 
\end{equation}
где $$M(\psi, x) = \sup\limits_{u \in U} \mathscr{H}(\psi, x, u).$$
+
где $$M(\psi, x) = \sup\limits_{u \in U} \mathscr{H}(\psi, x, u); \,\mathscr{H}(\psi, x, u)$$ — гамильтониан системы $$(1)$$, имеющий вид:
 +
\[
 +
\mathscr{H} = (\psi, Ax) + (\psi, Bu) = \sum\limits_{j = 1}^n \psi_j \sum\limits_{i = 1}^n a_{ji}x_i + \sum\limits_{j = 1}^n \psi_j \sum\limits_{i = 1}^m b_{ji}u_i.
 +
\]
  
== Определение точки переключения ==
+
== Теорема А.А.Фельдбаума о числе переключений ==
Точку разрыва оптимального управления называют точкой переключения.
+
'''Определение'''.<br>
 +
Точку разрыва оптимального управления называют точкой переключения.<br>
  
== Формулировка теоремы А.А.Фельдбаума ==
+
'''Формулировка теоремы'''.<br>
Пусть множество допустимых управлений $$U$$ представляет собой параллелепипед, определенный неравенствами $$(2)$$, и все собственные значения матрицы $$A$$ действительны. Тогда для каждого ненулевого решения $$\psi(t)$$ уравнений $$(3)$$ соотношение $$(4)$$ однозначно определяет управление $$u(t) = (u_1(t), ..., u_m(t)).$$ При этом оказывается, что каждая из функций $$u_k (k = 1, ..., m)$$ кусочно-постоянна , принимает только значения $$\alpha_k$$ и $$\beta_k$$ и имеет не более $$(n - 1)$$ переключений (не более $$n$$ интервалов постоянства), где $$n$$ - порядок системы уравнений $$(1)$$.
+
Пусть множество допустимых управлений $$U$$ представляет собой параллелепипед, определенный неравенствами $$(2)$$, и все собственные значения матрицы $$A$$ действительны. Тогда для каждого ненулевого решения $$\psi(t)$$ уравнений $$(3)$$ соотношение $$(4)$$ однозначно определяет управление $$u(t) = (u_1(t), ..., u_m(t)).$$ При этом каждая из функций $$u_k (k = 1, ..., m)$$ кусочно-постоянна, принимает только значения $$\alpha_k$$ и $$\beta_k$$ и имеет не более $$(n - 1)$$ переключений (не более $$n$$ интервалов постоянства), где $$n$$ &mdash; размерность фазового вектора $$x$$ системы $$(1)$$.<br>
  
== Доказательство теоремы А.А.Фельдбаума ==
+
'''Доказательство'''.<br>
 
Запишем функцию $$(\psi(t), Bu)$$ в виде:
 
Запишем функцию $$(\psi(t), Bu)$$ в виде:
 
\[
 
\[
(\psi(t), Bu) = \sum\limits_{j = 1}^n \sum\limits_{i = 1}^m \psi_jb_{ji}u_i = \sum\limits_{i = 1}^m (\sum\limits_{j = 1}^n \psi_jb_{ji}u_i).
+
(\psi(t), Bu) = \sum\limits_{j = 1}^n \sum\limits_{i = 1}^m \psi_jb_{ji}u_i = \sum\limits_{i = 1}^m \left(\sum\limits_{j = 1}^n \psi_jb_{ji}u_i\right).
 
\]<br>
 
\]<br>
 
Эта функция достигает максимума при условии, что каждое из слагаемых:
 
Эта функция достигает максимума при условии, что каждое из слагаемых:
 
\[
 
\[
\sum\limits_{j = 1}^m \psi_jb_{ji}u_i ,\, i = 1, ..., m
+
\sum\limits_{j = 1}^n \psi_jb_{ji}u_i ,\, i = 1, ..., m,
 
\]
 
\]
 
принимает максимальное значение. Следовательно,
 
принимает максимальное значение. Следовательно,
Строка 52: Строка 46:
 
u_i =  
 
u_i =  
 
\begin{cases}
 
\begin{cases}
\alpha_i, & \text{если} \sum\limits_{j = 1}^m \psi_jb_{ji} < 0,\\
+
\alpha_i, & \text{если} \sum\limits_{j = 1}^n \psi_jb_{ji} < 0,\\
\beta_i, & \text{если} \sum\limits_{j = 1}^m \psi_jb_{ji} > 0
+
\beta_i, & \text{если} \sum\limits_{j = 1}^n \psi_jb_{ji} > 0.
 
\end{cases}
 
\end{cases}
 
\]
 
\]
Таким образом, точками переключения для управления $$u_t$$ будут те значения $$t$$, при которых $$\sum\limits_{j = 1}^m \psi_jb_{ji} = 0.$$<br>
+
Таким образом, точками переключения для управления $$u(t)$$ будут те значения $$t$$, при которых $$\sum\limits_{j = 1}^n \psi_jb_{ji} = 0.$$<br>
Если известно решение линейных однородных уравнений с постоянными коэффициентами, то каждая из функций $$\psi_1(t), ..., \psi_n(t)$$ записывается в виде:
+
В силу известных теорем о линейных уравнениях с однородными коэффициентами, каждое из решений системы $$(3):$$ $$\psi_1(t), ..., \psi_n(t)$$ записывается в виде:
 
\[
 
\[
 
f_1(t)e^{\lambda_1t} + f_2(t)e^{\lambda_2t} + ... + f_n(t)e^{\lambda_nt},
 
f_1(t)e^{\lambda_1t} + f_2(t)e^{\lambda_2t} + ... + f_n(t)e^{\lambda_nt},
 
\]
 
\]
 
где $$\lambda_1, ..., \lambda_n$$ — попарно различные собственные значения матрицы $$A^T$$; $$f_1(t), ..., f_n(t)$$ — многочлены, степень которых на единицу меньше кратности соответствующих собственных чисел.<br>
 
где $$\lambda_1, ..., \lambda_n$$ — попарно различные собственные значения матрицы $$A^T$$; $$f_1(t), ..., f_n(t)$$ — многочлены, степень которых на единицу меньше кратности соответствующих собственных чисел.<br>
Все числа $$\lambda_1, ..., \lambda_r$$ действительны, так как по условию все собственные значения матрицы $$A$$, а, следовательно, и матрицы $$A^T$$ действительны. Обозначим через $$\nu_i$$ кратность собственного значения $$\lambda_i$$, тогда степень многочлена $$f_i(t)$$ не превышает числа $$\nu_i - 1$$. Поэтому по лемме, доказанной ниже, число действительных корней функции $$\sum\limits_{j = 1}^\psi_jb_{ji}$$  не превышает:
+
Все числа $$\lambda_1, ..., \lambda_r$$ действительны, так как по условию все собственные значения матрицы $$A$$, а, следовательно, и матрицы $$A^T$$ действительны. Обозначим через $$\nu_i$$ кратность собственного значения $$\lambda_i$$, тогда степень многочлена $$f_i(t)$$ не превышает числа $$\nu_i - 1$$. Поэтому по вспомогательной лемме число действительных корней функции $$\sum\limits_{j = 1}^n \psi_jb_{ji}$$  не превышает:
 
\[
 
\[
(\nu_1 - 1) + (\nu_2 - 1) + ... + (\nu_r - 1) + r - 1 = \nu_1 + ... + \nu_r - 1 = n - 1
+
(\nu_1 - 1) + (\nu_2 - 1) + ... + (\nu_r - 1) + r - 1 = \nu_1 + ... + \nu_r - 1 = n - 1.
 
\]
 
\]
Таким образом, теорема доказана.
+
Таким образом, теорема доказана. $$\blacksquare$$
  
== Лемма ==
+
== Вспомогательная лемма ==
 
Пусть $$\lambda_1, ..., \lambda_r$$ — действительные попарно различные числа; $$f_1(t), ..., f_n(t)$$ — многочлены с действительными коэффициентами, имеющими степени соответственно $$\nu_1, \nu_2, ..., \nu_r.$$ Тогда функция  
 
Пусть $$\lambda_1, ..., \lambda_r$$ — действительные попарно различные числа; $$f_1(t), ..., f_n(t)$$ — многочлены с действительными коэффициентами, имеющими степени соответственно $$\nu_1, \nu_2, ..., \nu_r.$$ Тогда функция  
 
\begin{equation}
 
\begin{equation}
Строка 75: Строка 69:
 
имеет не более $$ \nu_1 + ... + \nu_r + r - 1 $$ действительных корней.
 
имеет не более $$ \nu_1 + ... + \nu_r + r - 1 $$ действительных корней.
  
== Доказательство леммы ==
+
'''Доказательство'''.<br>
При $$r = 1$$ лемма справедлива, так как функция $$f_1(t)e^{\lambda_1t}$$ имеет не более $$\nu_1$$ действительных корней. Пусть лемма справедлива для $$(m - 1)$$ слагаемых, докажем ее для $$m$$ слагаемых.<br>
+
При $$r = 1$$ лемма справедлива, так как функция $$f_1(t)e^{\lambda_1t}$$ имеет не более $$\nu_1$$ действительных корней. Пусть лемма справедлива для $$(r - 1)$$ слагаемых, докажем ее для $$r$$ слагаемых.<br>
Предположим, что лемма неверна, тогда функция имеет, по крайней мере, $$\nu_1 + ... + \nu_r + m$$ действительных корней. Умножим функцию $$(5)$$ на $$e^{-\lambda_rt}$$, что не меняет числа ее корней, тогда:
+
Предположим, что лемма неверна, тогда функция имеет, по крайней мере, $$\nu_1 + ... + \nu_r + r$$ действительных корней. Умножим функцию $$(5)$$ на $$e^{-\lambda_rt}$$, что не меняет числа ее корней:
 
\[
 
\[
 
f_1(t)e^{(\lambda_1 - \lambda_r)t} + ... + f_{r - 1}(t)e^{(\lambda_{r - 1} - \lambda_r)t} + f_r(t).
 
f_1(t)e^{(\lambda_1 - \lambda_r)t} + ... + f_{r - 1}(t)e^{(\lambda_{r - 1} - \lambda_r)t} + f_r(t).
 
\]
 
\]
Эта функция также имеет не менее $$\nu_1 + ... + \nu_r + m$$ действительных корней. $$(\nu_{r + 1})$$-ая производная этой функции имеет не менее
+
$$(\nu_{r} + 1)$$-ая производная этой функции имеет не менее
 
\begin{equation}
 
\begin{equation}
(\nu_1 + ... + \nu_r + m) - (\nu_r + 1) = \nu_1 + ... + \nu_{r - 1} + (m - 1)
+
(\nu_1 + ... + \nu_r + r) - (\nu_r + 1) = \nu_1 + ... + \nu_{r - 1} + (r - 1)
 
\end{equation}
 
\end{equation}
действительных корней. Легко получить $$(\nu_{r + 1})$$-ую производную в виде:
+
действительных корней. Легко получить $$(\nu_{r} + 1)$$-ую производную в виде:
 
\begin{equation}
 
\begin{equation}
 
g_1(t)e^{(\lambda_1 - \lambda_r)t} + ... + g_{r - 1}(t)e^{(\lambda_{r - 1} - \lambda_r)t},
 
g_1(t)e^{(\lambda_1 - \lambda_r)t} + ... + g_{r - 1}(t)e^{(\lambda_{r - 1} - \lambda_r)t},
 
\end{equation}
 
\end{equation}
 
где числа $$\lambda_1 - \lambda_r, ..., \lambda_{r - 1} - \lambda_r$$ попарно различны, а степени многочленов $$g_i(t)$$ соответственно равны $$\nu_i$$.  
 
где числа $$\lambda_1 - \lambda_r, ..., \lambda_{r - 1} - \lambda_r$$ попарно различны, а степени многочленов $$g_i(t)$$ соответственно равны $$\nu_i$$.  
По индукции функция $$(7)$$ имеет не более $$\nu_1 + ... + \nu_{r - 1} + (r - 1) - 1$$ действительных корней, что противоречит $$(6)$$. Следовательно, лемма справедлива.
+
По индукции функция $$(7)$$ имеет не более $$\nu_1 + ... + \nu_{r - 1} + (r - 1) - 1$$ действительных корней, что противоречит $$(6)$$. Следовательно, лемма справедлива. $$\blacksquare$$

Текущая версия на 11:33, 10 декабря 2021

Александр Аронович Фельдбаум — советский учёный, специалист в области автоматического управления и элементной базы ЭВМ. Один из основоположников оптимального управления, автор принципа дуального управления в теории самонастраивающихся и самообучающихся систем. Именно он первым разъяснил и поставил общую задачу оптимального управления перед группой выдающихся математиков во главе с академиком Л. С. Понтрягиным, а также сформулировал и доказал теорему о числе переключений.

Постановка задачи

Закон движения объекта записывается в виде линейной системы дифференциальных уравнений: \begin{equation} \frac{dx}{dt} = Ax + Bu, \end{equation} где $$A \in \mathbb{R}^{n \times n}$$ — матрица коэффициентов, имеющая все действительные собственные значения; $$B \in \mathbb{R}^{n \times m}.$$
Будем рассматривать задачу быстродействия, то есть задачу о минимизации времени перехода: \[t_1 - t_0 = \int\limits_{t_0}^{t_1}dt.\]
Множество допустимых управлений $$U$$ представляет собой параллелепипед, определенный неравенствами: \begin{equation} \alpha_i \leq u_i \leq \beta_i, i = 1, ..., m. \end{equation}
Сопряженная система уравнений записывается следующим образом: \begin{equation} \frac{d\psi}{dt} = -A^{T}\psi. \end{equation} На основании принципа максимума можно заключить, что если $$u(t)$$ — оптимальное управление, переводящее точку $$x_0(t)$$ в точку $$x_k(t)$$, то существует такое решение $$\psi(t)$$ системы $$(3)$$, что: \begin{equation} (\psi(t), Bu(t)) = M(\psi(t), x(t)), \end{equation} где $$M(\psi, x) = \sup\limits_{u \in U} \mathscr{H}(\psi, x, u); \,\mathscr{H}(\psi, x, u)$$ — гамильтониан системы $$(1)$$, имеющий вид: \[ \mathscr{H} = (\psi, Ax) + (\psi, Bu) = \sum\limits_{j = 1}^n \psi_j \sum\limits_{i = 1}^n a_{ji}x_i + \sum\limits_{j = 1}^n \psi_j \sum\limits_{i = 1}^m b_{ji}u_i. \]

Теорема А.А.Фельдбаума о числе переключений

Определение.
Точку разрыва оптимального управления называют точкой переключения.

Формулировка теоремы.
Пусть множество допустимых управлений $$U$$ представляет собой параллелепипед, определенный неравенствами $$(2)$$, и все собственные значения матрицы $$A$$ действительны. Тогда для каждого ненулевого решения $$\psi(t)$$ уравнений $$(3)$$ соотношение $$(4)$$ однозначно определяет управление $$u(t) = (u_1(t), ..., u_m(t)).$$ При этом каждая из функций $$u_k (k = 1, ..., m)$$ кусочно-постоянна, принимает только значения $$\alpha_k$$ и $$\beta_k$$ и имеет не более $$(n - 1)$$ переключений (не более $$n$$ интервалов постоянства), где $$n$$ — размерность фазового вектора $$x$$ системы $$(1)$$.

Доказательство.
Запишем функцию $$(\psi(t), Bu)$$ в виде: \[ (\psi(t), Bu) = \sum\limits_{j = 1}^n \sum\limits_{i = 1}^m \psi_jb_{ji}u_i = \sum\limits_{i = 1}^m \left(\sum\limits_{j = 1}^n \psi_jb_{ji}u_i\right). \]
Эта функция достигает максимума при условии, что каждое из слагаемых: \[ \sum\limits_{j = 1}^n \psi_jb_{ji}u_i ,\, i = 1, ..., m, \] принимает максимальное значение. Следовательно, \[ u_i = \begin{cases} \alpha_i, & \text{если} \sum\limits_{j = 1}^n \psi_jb_{ji} < 0,\\ \beta_i, & \text{если} \sum\limits_{j = 1}^n \psi_jb_{ji} > 0. \end{cases} \] Таким образом, точками переключения для управления $$u(t)$$ будут те значения $$t$$, при которых $$\sum\limits_{j = 1}^n \psi_jb_{ji} = 0.$$
В силу известных теорем о линейных уравнениях с однородными коэффициентами, каждое из решений системы $$(3):$$ $$\psi_1(t), ..., \psi_n(t)$$ записывается в виде: \[ f_1(t)e^{\lambda_1t} + f_2(t)e^{\lambda_2t} + ... + f_n(t)e^{\lambda_nt}, \] где $$\lambda_1, ..., \lambda_n$$ — попарно различные собственные значения матрицы $$A^T$$; $$f_1(t), ..., f_n(t)$$ — многочлены, степень которых на единицу меньше кратности соответствующих собственных чисел.
Все числа $$\lambda_1, ..., \lambda_r$$ действительны, так как по условию все собственные значения матрицы $$A$$, а, следовательно, и матрицы $$A^T$$ действительны. Обозначим через $$\nu_i$$ кратность собственного значения $$\lambda_i$$, тогда степень многочлена $$f_i(t)$$ не превышает числа $$\nu_i - 1$$. Поэтому по вспомогательной лемме число действительных корней функции $$\sum\limits_{j = 1}^n \psi_jb_{ji}$$ не превышает: \[ (\nu_1 - 1) + (\nu_2 - 1) + ... + (\nu_r - 1) + r - 1 = \nu_1 + ... + \nu_r - 1 = n - 1. \] Таким образом, теорема доказана. $$\blacksquare$$

Вспомогательная лемма

Пусть $$\lambda_1, ..., \lambda_r$$ — действительные попарно различные числа; $$f_1(t), ..., f_n(t)$$ — многочлены с действительными коэффициентами, имеющими степени соответственно $$\nu_1, \nu_2, ..., \nu_r.$$ Тогда функция \begin{equation} f_1(t)e^{\lambda_1t} + f_2(t)e^{\lambda_2t} + ... + f_n(t)e^{\lambda_nt} \end{equation} имеет не более $$ \nu_1 + ... + \nu_r + r - 1 $$ действительных корней.

Доказательство.
При $$r = 1$$ лемма справедлива, так как функция $$f_1(t)e^{\lambda_1t}$$ имеет не более $$\nu_1$$ действительных корней. Пусть лемма справедлива для $$(r - 1)$$ слагаемых, докажем ее для $$r$$ слагаемых.
Предположим, что лемма неверна, тогда функция имеет, по крайней мере, $$\nu_1 + ... + \nu_r + r$$ действительных корней. Умножим функцию $$(5)$$ на $$e^{-\lambda_rt}$$, что не меняет числа ее корней: \[ f_1(t)e^{(\lambda_1 - \lambda_r)t} + ... + f_{r - 1}(t)e^{(\lambda_{r - 1} - \lambda_r)t} + f_r(t). \] $$(\nu_{r} + 1)$$-ая производная этой функции имеет не менее \begin{equation} (\nu_1 + ... + \nu_r + r) - (\nu_r + 1) = \nu_1 + ... + \nu_{r - 1} + (r - 1) \end{equation} действительных корней. Легко получить $$(\nu_{r} + 1)$$-ую производную в виде: \begin{equation} g_1(t)e^{(\lambda_1 - \lambda_r)t} + ... + g_{r - 1}(t)e^{(\lambda_{r - 1} - \lambda_r)t}, \end{equation} где числа $$\lambda_1 - \lambda_r, ..., \lambda_{r - 1} - \lambda_r$$ попарно различны, а степени многочленов $$g_i(t)$$ соответственно равны $$\nu_i$$. По индукции функция $$(7)$$ имеет не более $$\nu_1 + ... + \nu_{r - 1} + (r - 1) - 1$$ действительных корней, что противоречит $$(6)$$. Следовательно, лемма справедлива. $$\blacksquare$$