"ЖУРНАЛ РАДИОЭЛЕКТРОНИКИ" N 12, 2002 |
А. А. Строцев
Ростовский военный институт ракетных войск
Получена 18.12.2002 г.
В статье рассмотрен синтез равномерно оптимального управления поиском в большой поисковой системе, в случае, когда движение цели можно считать условно детерминированным.
Введение. В [1] рассмотрена задача поиска неподвижной цели многопозиционной информационной системой. Однако искомая цель часто является подвижной с детерминированными уравнениями динамики и стохастическими начальными условиями. Поиск таких целей с условно детерминированным движением рассмотрен, например, в [2]. В отличие от задач поиска неподвижной цели оптимизация поиска условно детерминированных динамических целей не позволяет в общем случае получить равномерно оптимальные стратегии поиска. Т.е. стратегии, обладающей свойством: поиск, который заканчивается в произвольный момент времени, оптимален. Отметим, что в практическом плане применение именно равномерно оптимальных стратегий поиска приводит к реализации оптимального поиска в быстро меняющейся обстановке практически в каждый момент времени. Таким образом, синтез равномерно оптимального управления поиском целей с условно детерминированным движением является актуальной задачей.
1.Постановка задачи. Рассматривается большая поисковая система, действия отдельных поисковых единиц которой описываются функцией плотности поиска (стратегией поиска) , [2]. Положение новой цели в области поиска задаётся начальной плотностью распределения . Уравнение движения цели имеет вид:
ż=f(z,v,t) (1)
где , - вектор управления, , .
Тогда уравнение динамики апостериорной плотности распределения положения цели может быть получено в виде [2]
, (2)
, (3)
где обладает следующими свойствами:
1. ; для всех ,; (4)
2. - есть вероятность обнаружения цели в интервале времени при условии, что цель находится в некоторой небольшой области точки и не обнаружена до момента .
Полагается, что область поиска , динамика цели, описываемая выражением (1), и начальная плотность распределения положения цели таковы, что для всех .
Требуется найти равномерно оптимальную по критерию минимума вероятности необнаружения цели к моменту времени стратегию поиска для задачи (2)-(4).
2. Модель задачи синтеза равномерно оптимальной стратегии поиска условно детерминированной цели. Преобразуем исходную задачу. Уравнение (2) сводится к линейному с использованием подстановки
, (5)
где ненормированная мера определяется как вероятность того, что цель находится в некоторой небольшой области точки и не обнаружена до момента .
Подставляя (5) в (2) и (3) получим
,(6)
. (7)
Обозначим
, (8)
, . (9)
Тогда характеристические уравнения для (6), (7) принимают вид:
, , (10)
, , (11)
, , (12)
, (13)
При этом требуется найти минимизирующую вероятность необнаружения цели к моменту времени [2]:
. (14)
Разложим функцию в ряд Тейлора в окрестности опорной траектории , заданной уравнением
, . (15)
Полагая отклонения от опорной траектории малыми и ограничиваясь линейными членами ряда, выражение (1) с учётом (15) перепишем в виде
, (16)
где
,
.
Подставляя (16) в (10) получим независимое от других переменных системы (10)-(13) уравнение
, . (17)
Для каждого решение (17) можно записать в виде
. (18)
Таким образом, получаем следующую задачу нахождения оптимальной стратегии поиска :
, (19)
; для всех , . (20)
Отметим, что связано с решением исходной задачи через решение (16):
, (21)
где - фундаментальная матрица системы (16), ,
. (22)
Т.е., учитывая (21), (22),
. (23)
Полученная модель исходной задачи отличается от случая неподвижной цели наличием в функционале известных элементов уравнения динамики цели, которые не влияют на свойства получаемого решения. Т.е. для задачи (19), (20) можно применить разработанный, например, в [2], [3] для неподвижной цели аппарат и получить равномерно оптимальную стратегию поиска. Однако часто достаточно получить приближённое численное решение задачи.
3. Алгоритм приближённого решения оптимизационной задачи. Поскольку рассматриваемое в такой постановке задачи управление поиском не будет в точности воспроизводиться некоторой реальной системой [2], то достаточно найти приближённое решение.
Перейдём к дискретному приближению исходной задачи. Разобьем интервал на частей длительностью точками . Положим, что интеграл практически постоянен на достаточно малых областях , , , , и представим в виде
. (24)
Тогда (19) представимо
, (25)
где , , а ограничение (20)
. (26)
Введём обозначения
,
,
, (27)
тогда решение задачи (19), (20) сводится к последовательному решению следующих задач математического программирования:
найти
, (28)
в условиях ограничений
, , , . (29)
Переход от оптимального решения (28), (29) к оптимальному решению исходной задачи осуществляется в соответствии с (23):
. (30)
Отметим, что (27), (28) отражают свойство равномерно оптимальной стратегии поиска, отмеченной Аркиным в [3].
4. Пример синтеза равномерно оптимальной стратегии поиска условно детерминированной динамической цели. В качестве примера применения построенного в п.3 алгоритма рассмотрим синтез равномерно оптимальной стратегии поиска в следующей задаче: , - отрезок , , , , , , ,
.
Начальная плотность распределения положения цели задана в виде нормальной плотности распределения .
Требуется найти , , .
В результате решения последовательности задач математического программирования вида (28), (29), с учётом (30) получим оптимальную стратегию поиска, вид которой показан на рис. 1.
Рис.1
Из анализа рис.1 видно, что полученная стратегия поиска обладает свойством, отмеченным в [2], [3] применительно к равномерно оптимальной стратегии поиска неподвижной цели: существует область , увеличивающаяся со временем, такая, что стратегия поиска положительна внутри области и равна нулю в .
При применении значение вероятности необнаружения цели в условиях рассматриваемого примера равна , а при равномерном распределении поисковых усилий , что более чем на порядок больше.
Заключение. Синтез равномерно оптимальных стратегий в задаче оптимального поиска условно детерминированной динамической цели достигнут за счёт использования независимости части характеристических уравнений при некотором упрощении модели движения цели. Однако в отличие от задач наблюдения в задаче поиска это упрощение не оказывает значительного влияния.
СПИСОК ЛИТЕРАТУРЫ
1. Строцев А.А. Оптимальный поиск неподвижной цели многопозиционной информационной системой. – Интернет-публикация, М.: Журнал радиоэлектроники , № 4, 2002.
2. Хеллман О. Введение в теорию оптимального поиска. – М.: Наука, 1985.
3. Аркин В.И. Задачи оптимального распределения поисковых усилий. – Теория вероятностей и её применения, 1964, т. 9, № 1.