“ЖУРНАЛ РАДИОЭЛЕКТРОНИКИ” N 8, 2011

оглавление

удк 004.942:62-506

система управления составной поверхностью

главного зеркала радиотелескопа, функционирующая на основе мультиагентных технологий

 

М. В. Белов
Санкт-Петербургский государственный политехнический университет

 

Получена 22 июля 2011 г.

 

Аннотация. Обсуждается возможность использования для реализации системы контроля и управления динамикой составной отражающей поверхности главного рефлектора большого радиотелескопа миллиметрового диапазона мультиагентных технологий. Основное внимание уделяется формализации процесса функционирования мультиагентной системы управления и взаимодействия ее с составным управляемым объектом, являющимся эквивалентом внешней среды для коалиции агентов.

Ключевые слова: радиотелескоп, главный рефлектор, составная отражающая поверхность, система управления поверхностью, мультиагентная (МА) система, свойства МА-системы, формальное описание МА-системы.

Abstract. It is discussed the opportunity of using the multiagent technologies for realizing control and dynamics’ management system of composite reflecting surface of the large millimeter radio telescope’s main reflector. The main point is the formalization of process operations of the multiagent control system and its interaction with composite managed object, which is the equivalent of external environment for the agents’ coalition.

Key worlds: radio telescope, main reflector, composite reflecting surface, surface control system, multiagent system, properties of the multiagent system, formal description of the multiagent system. 

 

1. Введение

         Разработка и исследование интеллектуальных систем управления представляет собой одно из перспективных направлений повышения эффективности контроля и эффективного разрешения динамических ситуаций, возникающих в практике эксплуатации больших полноповоротных радиотелескопов миллиметрового и субмиллиметрового диапазона с главным рефлектором диаметром до 100 м, оснащенным управляемой составной многопанельной отражающей параболической поверхностью [1-5]. Особенно актуальной при этом является задача автоматического поддержания высокой эффективности приема наблюдаемых сверхвысокочастотных космических излучке6ний в условиях значительных колебаний уровней дестабилизирующих возмущений, порожденных гравитационными, термическими, аэродинамическими процессами. Управляя положением зеркальных щитов составной отражающей поверхности в реальном времени возникновения возмущений, можно поддерживать требуемую эффективность приема (усиление главной антенны) на заданном уровне независимо от угломестного и азимутального положения главного рефлектора, независимо от воздействия солнечной радиации или ветрового напора. Исследования в области архитектурно-структурной организации интеллектуальных систем управления подобными сложными многоэлементными объектами показывают, что в качестве эффективных моделей такой организации можно рассматривать многоагентные (мультиагентные) системы (МА-системы) [6-11]. Именно мультиагентные системы представляют собой одно из наиболее перспективных направлений развития распределенных систем управления сложными многомерными объектами, подобными составной отражающей поверхности.

         Архитектурно-структурная организация системы управления активной поверхностью на основе концепции многоагентной системы позволяет обеспечить новые качественные признаки, повышающие эффективность функционирования многопанельного объекта управления в сложных (особенно в нештатных и экстремальных) ситуациях за счет использования следующих преимуществ [7-9]:

-   Параллелизм обработки информации на основе коалиции агентов;

-   Уменьшение объема передаваемой информации (отдельным агентам передаются высокоуровневые частичные решения);

-   Гибкость, обеспечивающая возможность использования агентов различной мощности при совместном решении поставленной управленческой или информационной задачи;

-   Повышение надежности системы управления путем перераспределения функций между агентами в случае частичного или полного отказа какого-либо из агентов.

         В настоящей статье дается обоснование возможности использования для построения системы управления активной поверхности главного зеркала мультиагентных технологий и излагается формальное описание данной управляющей среды как коалиции агентов.

 

2. Характеризация системы управления активной поверхностью как мультиагентной системы  

         В соответствии с законами геометрической оптики излучение радиоастрономического объекта наблюдения, попадающее в конечном итоге на облучатель/приемник, размещенный в сопряженном (вторичном) фокусе контр-рефлектора и главного рефлектора, достигает поверхности главного зеркала в форме параллельного пучка и, отражаясь от последней, должно быть синфазным в любой плоскости, ортогональной отражающей поверхности. Условием сохранения синфазности отраженного главным зеркалом космического излучения является наличие идеальной параболической отражающей поверхности при условии таких же свойств у эллипсоидальной поверхности конррефлектора. Однако идеальную параболическую поверхность у главного зеркала получить трудно. Т.к. поверхность главного зеркала крупных радиотелескопов состоит из большого количества перемещаемых зеркальных панелей, которые крепятся к несущей конструкции радиотелескопа посредством регулируемых домкратов-актуаторов, то, изменяя состояние длин стержней последних, можно добиться минимальной ошибки аппроксимации реальной составной отражающей поверхностью параболоида вращения, компенсируя тем самым ошибки изготовления и сборки многоэлементной отражающей поверхности главного рефлектора, температурные и гравитационные деформации зеркальных щитов и парируя ветровые возмущения.

Из-за функционирования радиотелескопа при воздействии различных дестабилизирующих факторов – гравитационных, термических, аэродинамических, система управления пространственным положением зеркальных панелей должна гибко реагировать на изменение внешних условий функционирования и оперативно перестраивать алгоритм управления активной составной поверхностью. Такая высокая степень адаптивности режима работы средств управления к состоянию окружения может быть достигнута только в том случае, когда обеспечивается постоянный контроль состояния внешней среды (температур поверхностей зеркальных щитов, азимутального и угломестного положения главной антенны, угловых скоростей ее вращения в азимутальной и угломестной плоскостях, скорости ветрового напора и проч.) и управляющие средства имеют несколько разных регулирующих законов, которые могут быть оперативно задействованы при изменении состояния внешних факторов без изменения общей структурной организации регуляторов. Естественно, переключение управляющих алгоритмов зачастую сопровождается коррекцией текущих целей управления активной поверхностью, изменением общей схемы регулировки, перераспределением управляющих задач между уровнями управления, что свойственно системам, реагирующим на изменение состояния внешней среды и изменяющим свое поведение и воздействия на исполнительные механизмы в направлении достижения текущих целей.

В силу высокой размерности объекта управления – активной многопанельной поверхности (насчитывающей от нескольких сотен до 1,5-2 тысяч подвижных зеркальных щитов) и, как следствие, сложности и структурной развитости системы управления этим многомерным объектом, вычислительные средства этой управляющей системы имеют многопроцессорную иерархическую структуру, при этом процессорные центры разных уровней управления функционируют зачастую в полуавтономных и близких к автономным режимах, взаимодействуя друг с другом по схемам горизонтального и вертикального сжатия [12]. Принцип горизонтального сжатия предусматривает концентрацию в выделенных управляющих центрах нескольких взаимоувязанных задач, облегчая тем самым процесс информационного взаимодействия между ними и исключая лишние промежуточные передаточные звенья и структурные элементы. При вертикальном сжатии управляющая среда строится на основе использования многозвенной иерархически организованной сетевой клиент-серверной архитектуры, средств централизованного и локально-централизованного управления потоками данных и потоками работ, распределенных баз данных, позволяющих оперативно взаимодействовать различным процессорным звеньям друг с другом, оперативно контролировать и корректировать текущее состояние как отдельных секторов объекта управления – активной поверхности, так и составного зеркала главного рефлектора в целом. Все это позволяет утверждать, что система управления активной поверхностью как группа регулирующих центров в целом обладает большинством базовых свойств, присущих многоагентным (мультиагентным) системам (МА-системам) управления, в частности, таким, как [6,9,11]:

1.     Автономность – любой агент многоагентной системы может функционировать без прямого вмешательства оператора или вышестоящего в иерархии центра управления, самостоятельно отслеживая состояние собственных параметров и свои действия.

2.     Реактивность – агент МА-системы способен воспринимать окружающую среду и адекватно на нее реагировать, корректируя свои цели и синтезируемые сигналы управления.

3.     Проактивность – любой агент мультиагентной системы, обладая целенаправленным поведением, может проявлять инициативу путем переключения целей, изменения приоритетов управления и режимов работы, способен планировать свои взаимоотношения с внешней средой, совершать действия, направленные на достижение целей.   

4.     Коммуникативность – каждый  агент способен  взаимодействовать с другими агентами и подсистемами мультиагентной системы.

5.     Коллегиальность – любой агент МА-коалиции способен функционировать в интересах групповой цели мультиагентной системы, т.е. он приспособлен к коллективному целенаправленному поведению группы взаимодействующих агентов.

6.     Прогнозируемость – агент коалиции по данным восприятия окружающей среды (объекта воздействий – активной отражающей поверхности) и структуре своего внутреннего состояния может промоделировать генезис окружения и предсказать ход изменения его состояния.

7.     Адаптивность, при наличии которой агент МА-системы способен подстраивать свой алгоритм функционирования с учетом внешних воздействий в условиях неполной информации об объекте управления.

8.     Обучаемость, когда агент коалиции имеет в своем составе не только средства прогнозирования или моделирования состояний объекта управления, но и компоненты коррекции как алгоритмов прогнозирования (моделирования), так и эталонных моделей управляемого объекта.

9.     Интерактивность, предусматривающая наличие у каждого агента МА-системы свойства и механизмов коммуникативности не только с другими агентами и подсистемами управляющих средств, но и механизмов интерактивного взаимодействия с операторами комплекса управления радиотелескопом через подсистемы визуализации состояний объектов управления и контроля.

         Перечисленные свойства присущи практически всем управляющим звеньям распределенной иерархической системы управления активной поверхностью, как на нижнем управляющем уровне, занимающимся непосредственным секторальным регулированием положения зеркальных щитов поверхности и контролем их пространственного и температурного состояния; на среднем уровне, обеспечивающем координацию функционирования агентов-регуляторов нижнего уровня, в т.ч. целеполагание и выбор управляющих алгоритмов для соответствующих секторов поверхности, с учетом данных о состоянии щитов объекта управления и окружающей воздушной среды (ее температуре, ветром напоре); так и на верхнем уровне (метауровне), задающем общий план изменения пространственного положения главной антенны на основе целевой задачи наблюдений источника космических радиоизлучений и глобальной стратегии решения общей задачи контроля и стабилизации динамики поверхности главного зеркала как сложного составного многомерного объекта в условиях сильного влияния разнородных возмущений.    

  

3. Формальное описание функционирования мультиагентной                 системы управления активной поверхностью

         Дадим теперь формальное описание процесса функционирования мультиагентной системы управления активной поверхностью главного рефлектора большого радиотелескопа в терминах теории агентов.

         3.1. Исходные положения об МА-системе. Известно [6,8],  что мультиагентной системой называется коалиция интеллектуальных агентов , тесно взаимодействующая с окружающей средой, обладающей конечным множеством состояний , с помощью функции восприятия  внешней среды и оператора действия , реализуемого функцией . Последняя в соответствии с текущим внутренним состоянием  МА-системы обеспечивает формирование действий коалиции агентов , проводящих к изменению текущего состояния  среды в соответствии с порядком формирования ее поведения, задаваемым функцией , при этом по завершении выполнения МА-системой функции восприятия  текущего состояния  среды и формирования компоненты  множества восприятия  в коалиции агентов запускается функции построения  и обновления  модельных представлений  об окружающей среде и функция  обновления внутреннего состояния  агентов МА-системы. Обобщенно такое описание МА-системы можно записать в виде следующей совокупности:

.                                        (1)

Применительно к условиям системы управления активной поверхностью главного зеркала радиотелескопа в выражении (1) необходимо уточнить структуры множеств и особенности формирования функций.

         Итак, коалиция  агентов, образующих в МА-систему, взаимодействует с внешней средой, под которой, применительно к условиям управления активной поверхностью главного зеркала радиотелескопа, следует понимать не столько воздушную среду, окружающую зеркальные щиты составной поверхности, сколько саму поверхность этих щитов. В расширенном представлении любое состояние  такой внешней среды, т.е. составной отражающей поверхности, характеризуется не только вектором смещения  реперных точек  зеркальных пластин по нормали от поверхности стабилизации  аппроксимирующего параболоида вращения, но также и векторами дополнительных параметров – составным вектором положения штоков актуаторов , обеспечивающих регулировку положения щитов, составным вектором поверхностных температур зеркальных панелей , значений температуры окружающей воздушной среды  и скорости ветра . Однако следует отметить, что большая часть дополнительных параметров, являясь различными по источникам, тем не менее, приводит к одинаковым по сути своей деформирующим механическим процессам пластин составной отражающей поверхности и это, в конечном итоге, проявляется в изменении состояния координат вектора смещения  реперных точек. Следовательно, применительно к условиям эксплуатации многоэлементного главного рефлектора радиотелескопа координаты вектора  можно считать фазовыми координатами текущего состояния отражающей поверхности, т.е.:

.                                                                                              (2)

Конструктивные особенности составной отражающей поверхности главного зеркала таковы, что значения координат вектора состояния  определяются положением штоков акуаторов  (положением регулируемых связей отражающих пластин). Тогда функция изменения  состояния (поведения)  составной поверхносмти сопоставляет ее текущему состоянию  и выбранным агентами МА-системы текущим действиям (положениям штоков актуаторов)  непустое множество возможных следующих состояний многоэлементного зеркала, т.е.:

 или ,  (3)

где  есть функция отражения конкретного действия  коалиции агентов на текущее состояние  среды.

Значение состояния координат вектора , переводящего вектор смещения из состояния  в , зависит от внутреннего состояния МА-системы , т.е. определяется функцией принятия решения , сопоставляющей текущему внутреннему состоянию  МА-системы некоторые их действия :

 или ,                                                   (4)

где  – функция преобразования текущего внутреннего состояния  в конкретное действие  МА-системы, при этом внутренне состояние  есть результат выполнения функции обновления  внутреннего состояния МА-системы, которая соотносит предыдущему внутреннему состоянию  и текущему состоянию смещения  составной поверхности новое  внутреннее состояние МА-системы:

 или ,  (5)

где  соответствующая функция отображения текущих состояний векторов  и  в новое  внутреннее состояние МА-системы.   

Заметим, что описание мультиагентной системы вида (3)-(5) не несет никакой информации о ее внутренней структуре и сводит это описание практически к модели конечного автомата с входным алфавитом , множеством состояний  и выходным алфавитом . Поскольку МА-система постоянно взаимодействует с многоэлементной поверхностью главного зеркала радиотелескопа, то процесс функционирования такого автомата можно описать функцией истории  его отношений с объектом воздействий, являющейся упорядоченной последовательностью пар состояние–действие :

,                                                                  (6)

которая обладает следующими свойствами:

Свойство 1.                       Реакция объекта воздействий соответствует допустимой реакции на действия МА-системы, определяемые ее функциями  и :

.                             (7)

Свойство 2.                      Внутреннее состояние МА-системы  изменяется в соответствии с функцией  обновления ее состояния:

.                                      (8)

Отметим, что в (7) и (8) с помощью нотации  обозначен -й элемент последовательности (6), а с помощью нотаций ,  – соответствующий элемент пары .

Чтобы МА-система могла адекватно реагировать на изменения состояния вектора смещений , она должен обладать некоторой информацией о характеристиках объекта воздействий, его свойствах и текущем их состоянии. Именно эту информацию и называют представлениями мультиагентной системы, при этом можно выделить следующие виды представлений [6]:

§     Представления о текущем состоянии объекта воздействий, обычно именуемые восприятием.

§     Представления каждого из агентов МА-системы о совершаемых ею действиях или, являющиеся по сути своей, восприятием действий.

§     Представления о закономерностях поведения объекта воздействий, позволяющие агенту МА-системы прогнозировать последствия своих действий, называемые знаниями.

§     Представления каждого из агентов МА-системы о возможных действиях других агентов для каждого из состояний объекта воздействий, образующие т.н. социальные представления.

Охарактеризуем порядок формирования представлений МА-системы в переложении на условия функционирования составной отражающей поверхности главного зеркала радиотелескопа. 

3.2. Восприятия мультиагентной системы. Обычно Восприятие МА-системы объекта воздействий описывается отображением вида:

 или ,                                                                                                   (9)

где  непустое конечное множество восприятий, а второе соотношение в (9) определяет для данного состояния  составной отражающей поверхности множество восприятий неотличимых от  для мультиагентной системы:

.                                         (10)

Поскольку, зачастую, каждый -й агент, входящий в коалицию агентов МА-системы, имеет собственные каналы восприятия, при этом

,                                                                                 (11)

то восприятие мультиагентной системы есть пересечение восприятий состояния объекта воздействий всех агентов коалиции, т.е.:

                (12)

где  есть функция восприятия -м агентом действий, совершенных МА-системой.

Таким образом, два состояния  и  воспринимаются коалицией агентов одинаково, если части состояния, соответствующие состоянию  составной поверхности, воспринимаются одинаково всеми агентами коалиции , а части состояния, соответствующие действиям системы, либо совпадают (что необходимо для отработки ситуации, когда ), либо воспринимаются одинаково всеми агентами коалиции относительно хотя бы одного состояния  объекта воздействий, воспринимаемом одинаково с  всеми агентами коалиции .

Для каждого -го агентов мультиагентной коалиции отношение Восприятия действий  задается следующим образом

                                                                          (13)

и оно определяет доступную -му агенту информацию о совершаемых МА-системой действиях. Для коалиции агентов соотношение восприятия действий есть пересечение восприятий  всех агентов МА-системы:

.                                                       (14)

Восприятие МА-системы  называется корректным восприятием, если оно является отношением эквивалентности вида (10) и для него справедливы следующие свойства [6,9]:

Свойство 1.                       Рефлексивность. Состояние  рассматривается МА-системой как одна из возможных альтернатив при восприятии состояния , т.е. одна из альтернатив всегда соответствует реальности:

.                                                                        (15)

Свойство 2.                       Симметрия. Если МА-система может спутать состояние  с состоянием , то она может спутать и состояние  с состоянием , т.е. можно говорить о том, что состояния  и  неотличимы друг от друга или они эквивалентны:

.                                      (16)

Свойство 3.                       Транзитивность. Если МА-система не может отличить состояние  от , а состояние  от , то она не может отличить  от :

.         (17)

В (15) и (16) оператор  означает отношение вида «если…, то…».

Корректное восприятие , являясь отношением эквивалентности, разбивает множество  на множество классов эквивалентности . Мощность множества классов эквивалентности  позволяет судить о сенсорных возможностях МА-системы – чем больше эта мощность, тем четче МА-система способна воспринимать состояние объекта воздействий. При  МА-система обладает совершенными сенсорными способностями и в состоянии отличить любые два различных состояния составной поверхности. Когда , сенсорных способностей у МА-системы нет – она не способна отличить состояние  от , при этом для любого агента  коалиции, образующей МА-систему, и для любого класса эквивалентности  существует единственный класс  эквивалентности , причем такой, что .

Относительно восприятия действий МА-коалицией  можно также установить условия Корректности, когда таковое имеет место, если для любого  отношение

                                                                         (18)

является отношением эквивалентности.

         Отношения восприятия (9) и восприятия действий (14) совместно задают отношение эквивалентности  на множестве  следующим образом:

         .(19)

Отношение эквивалентности (19) задает множество классов эквивалентности  на множестве   следовательно, его можно рассматривать как функцию:

.                                                                            (20)

Здесь функцию  в (19) и (20) обычно называют функцией полного восприятия, а множество  – множеством полных восприятий.

Заметим, что, если все отношения восприятий  и  всех агентов МА-коалиции являются отношениями эквивалентности, то и их пересечение, объединение и комбинация также являются отношениями эквивалентности. Таким образом, отношение восприятия коалиции (12) является отношением эквивалентности и задает фактор-множество на множестве , которое назовем множеством восприятий коалиции .

         В переложении на условия функционирования составной отражающей поверхности главной антенны радиотелескопа множество полных восприятий  есть совокупность векторов полных восприятий следующего вида:

.                                    (21)

Здесь:

 соответствует -му А-сектору управляемой поверхности и -му локальному агенту нижнего уровня управления, обеспечивающего непосредственного взаимодействие с данным А-сектором;

 – вектор данных, характеризующих текущие положения штоков актуаторов, с помощью которых осуществляется прецизионная регулировка пространственного положения щитов -го А-сектора составной поверхности;

-е подмножество массива невязок  положения реперных точек зеркальных пластин, входящих в -й А-сектор, причем

            ,(22)

где  – вектор пространственных координат   реперной точки  зеркальной панели,  – вектор координат  -й реперной точки, находящейся на стабилизируемой поверхности  аппроксимирующего параболоида при отсутствии возмущений, причем

,                                                                           (23)

а ,  – вектор возмущений;

 – вектор данных о температуре поверхностей щитов -го А-сектора составной поверхности;

 – температура воздушной массы, окружающей главный рефлектор;

 – значение средней скорости ветрового напора на зеркало рефлектора. 

           3.3. Знания или модельные представления мультиагентной системы. Для описания модельных представлений МА-системы о поведении объекта воздействий функцию  зададим в виде

.                                                                              (24)

Согласно (24), если некоторая тройка  входит в отношение , то по представлениям мультиагентной системы, при выполнении действия  с объектом воздействий с состоянием  этот объект перейдет в состояние . Таким образом, представления МА-системы по своей структуре аналогичны описанию поведения объекта воздействий  и, по сути, являются моделью объекта воздействий (составной отражающей поверхности) с точки зрения МА-коалиции, при этом:

             (25)

и совокупность всех возможных представлений образует модельное множество .    

         Заметим, что применительно к задаче исследования настоящей работы моделью объекта воздействий является модельное описание составной отражающей поверхности в виде некоторого эталонного аппроксимирующего параболоида вращения , который строится на основе составного массива векторов  реальных координат реперных точек зеркальных щитов поверхности главного рефлектора. Здесь составной вектор  есть не что иное, как элемент  множества восприятий  МА-системы управления, т.е. , а составной вектор , соответствующий текущему эталонному состоянию  поверхности аппроксимирующего параболоида, является элементом модельного множества  или .

Для моделирования представлений агентов МА-коалиции о возможных последствиях действий других агентов отношение модельных отображений  (24) необходимо расширить, для чего обычно вводятся представления о возможных действиях других агентов коалиции для каждого из состояний объекта воздействий, или социальные представления, описываемые отношением

 или , (26)

при этом Множество социальных представлений обозначим через .

Текущие Модельные представления МА-системы управления – текущие знания о состоянии объекта воздействий, т.е. о пространственном состоянии элементов составной отражающей поверхности в точках , вырабатываются на основе полных восприятий (19) и социальных модельных представлений (26) следующим образом:

 или

 (27)

т.е. с точки зрения МА-коалиции возможны такие изменения состояний объекта воздействий, которые возможны по представлениям хотя бы одного из агентов коалиции, с учетом возможных действий других агентов по социальным представлениям агентов коалиции.

Представления коалиции агентов должны изменяться на каждом шаге ее взаимодействия с объектом воздействий (составной отражающей поверхностью), для чего в состав функций МА-системы включается Функция обновления модельных представлений вида:

,                                                      (28)

сопоставляющая части текущего внутреннего состояния МА-коалиции , текущим представлениям (моделям) , совершённому коалицией действию  и полному восприятию нового состояния объекта воздействий  новую часть внутреннего состояния  и новое отношение модельных представлений .

В результате, процесс обновления представлений МА-коалиции моделируется детерминированным конечным автоматом с входным алфавитом  и множеством внутренних состояний , которое является частью множества  внутренних состояний агентов коалиции в том смысле, что , где  есть некоторая дополнительная часть состояния неопределенной пока структуры, относительно которой заметим следующее – «Если положить, что коалиция агентов имеет абсолютную память, то множество  может совпадать с множеством возможных полных восприятий  и использоваться для хранения восприятия предыдущего состояния поверхности». В этом случае функция  может вычисляться по следующему алгоритму:

.                                 (29)

Таким образом, после каждой итерации взаимодействия с объектом воздействия в базу представлений коалиции агентов добавляется множество фактов вида , при этом добавленные в базу знаний МА-системы факты описывают результаты только что прошедшей итерации ее взаимодействия с отражающей поверхностью.

Включение в состав МА-системы функции  обновления модельных представлений, в свою очередь, предусматривает расширение функция обновления внутреннего состояния (5) коалиции агентов к виду

.                                                       (30)

В том случае, когда мультиагентная система только начинает взаимодействовать с составной отражающей поверхностью, вместо общего действия передается пустое множество , т.к. агенты МА-системы еще не совершали никаких действий.

          3.4. Управление поведением мультиагентной системы и выбором ее действий. Рациональность поведения является основным свойством мультиагентной системы, в тоже время именно это свойство сложнее всего поддается формализации. Наиболее часто рациональность отождествляется с управляемым целями поведением, при этом подразумевается, что коалиция агентов МА-системы не просто взаимодействует с объектом взаимодействия, а пытается при этом достичь определенных целей.

Известно [6], что под целью часто понимается некоторое подмножество состояний объекта воздействий , одного из которых МА-системе необходимо достичь. Расширенными целями часто называют множество конечных цепочек состояний объекта воздействий . Расширенная цель считается достигнутой в том случае, если история взаимодействия коалиции агентов с объектом воздействий имеет конечный префикс, состояния объекта воздействий в котором совпадают с состояниями одной из цепочек множества . Такие цели относятся к целям с конечным горизонтом, т.е. к целям, которые могут быть однажды достигнуты.

Другим видом целей являются инвариантные свойства, которые должны выполняться на протяжении всего, потенциально бесконечного, взаимодействия МА-системы с объектом воздействий. Инвариантные свойства также можно описать с помощью множества состояний объекта воздействий , подразумевая, что свойство выполнено, пока объект воздействий находится в одном из этих состояний. По аналогии с расширенными целями, можно описать и расширенный вариант инвариантного свойства с помощью множества бесконечных цепочек . В этом случае свойство считается выполненным, если состояния объекта воздействий в истории взаимодействия МА-системы с ним являются префиксом одной из цепочек в множестве .

Применительно к мультиагентным системам управления составной отражающей поверхности наиболее предпочтительным описанием цели коалиции агентов является представление ее в виде функции-критерия:

,                                                     (31)

при этом каждая из  функций-критериев  агентов, входящих в коалицию, может принимать три значения:

§     completed, когда цель окончательно достигнута;

§     continue, если история взаимодействия соответствовала цели, но окончательно цель еще не достигнута;

§     failure, если цель не была достигнута и не может быть достигнута и в будущем.

Заметим, что множество  является частью внутреннего состояния МА-системы .

На вход функции-критерия подается часть истории взаимодействия МА-системы с объектом воздействий, т.е. с составной поверхностью, содержащая информацию о восприятии соответствующих пространственных состояний панелей поверхности и информацию о представлениях коалиции агентов на данный момент (в т.ч. о модельных представлениях МА-системы). Результатом функции-критерия является флаг, показывающий достигнута ли цель и возможно ли её достижение в будущем.

Отметим, что у ограниченной ресурсами МА-системы не всегда есть возможность достижения всех своих целей, поэтому зачастую множество всех целей агента называют желаниями МА-системы , а подмножество  тех целей, которые коалиция агентов собирается реализовать – намерениями МА-системы. В целом можно выделить следующие свойства намерений:

Свойство 1.                      Намерения задают направление деятельности – коалиция агентов пытается найти действия, способные осуществить намерения и выполнить их.

Свойство 2.                      Намерения ограничивают будущий выбор – МА-система не может формировать новые намерения, несовместимые с уже принятыми, т.е. ведущие к невыполнимости множества намерений.

Свойство 3.                      Намерения имеют долгое время жизни – если МА-система сформировала план реализации намерения, но он не привел к успеху, то система будет формировать новые планы и пытаться реализовать намерение другим способом.

Свойство 4.                      Намерение может быть отброшено только при осуществлении определенного усилия в случаях, если коалиция агентов пришла к выводу, что реализовать намерение невозможно (не удается сформировать план, ведущий к достижению намерения) или оно уже неактуально для коалиции.

Свойство 5.                      Намерения влияют на будущие планы – если МА-система выработала намерение, то она может строить планы на будущее с предположением, что это намерение реализовано.

Таким образом, подмножество целевых критериев  должно быть выполнимо по представлениям МА-системы, т.е. все намерения коалиции должны быть достижимы в совокупности или выполнимы. Под выполнимостью намерений здесь понимается наличие у коалиции агентов плана, ведущего к осуществлению всех намерений.

         План у МА-коалиции можно рассматривать как конечный автомат

,                                                          (32)

входной алфавит которого является множеством  возможных полных восприятий  коалицией состояний объекта воздействий и действий агентов МА-системы, выходной алфавит совпадает с множеством  действий коалиции, а множество внутренних состояний автомата планирования есть декартово произведение внутренних состояний планов агентов

,                                                  (33)

с вектором начального состояния  и отношением переходов

,                                                 (34)

определяющим по полному восприятию  текущего состояния составной отражающей поверхности и действий МА-коалиции, набору сигналов , переданных агентами коалиции друг другу, и текущему внутреннему состоянию плана  следующее состояние плана , а также действие , которое необходимо выполнить МА-системе.

         Возможным результатом плана  в начальном состоянии внешней среды  и в начальном состоянии плана  по модельным представлениям коалиции агентов  обычно называется множество цепочек , где для каждой -й цепочки  и , и, если для любого  существуют такие состояния векторов ,  и , что  и , то для  существует такое действие , что  и .

Заметим, что результат плана по представлениям МА-системы может отличаться от реальных результатов плана в том случае, если представления коалиции агентов расходятся с реальностью. Будем считать, что план  реализует цель  по модельным представлениям МА-системы  в текущем состоянии объекта воздействий, воспринимаемом как , если для любой цепочки  выполнено . Множество всех возможных планов обозначим как . В тех случаях, когда это не будет вести к двусмысленности, будем отождествлять план с его отношением переходов .

План коалиции агентов не является статичным – при изменении желаний или представлений МА-системы он может быть перестроен. Этот процесс можно смоделировать функцией обновления плана:

,                                               (35)

сопоставляющей текущему модельному представлению , текущей цели , текущему плану  и полному восприятию текущего состояния внешней среды и действий коалиции агентов  новый план .  

В большинстве случаев новый план будет совпадать со старым, однако, если цели (желания) или модельные представления МА-системы радикально изменились или произошедшие в объекте воздействий изменения не были предусмотрены исходным планом, может быть построен новый план. Заметим также, что с каждым планом можно ассоциировать некоторое множество целей , которые реализуются планом по модельным представлениям коалиции агентов и которые содержались в целевом множестве коалиции на момент построения. Именно эти цели и соответствующие им законы управления, как уже упоминалось, и являются намерениями мультиагентной системы.

         Выбор действия МА-системы является одним из важнейших этапов его работы. В типовой ситуации МА-коалиция, основываясь на полном восприятии  текущего фазового состояния  объекта воздействий (в совокупности с другими дополнительными параметрами, характеризующем состояние  – подробнее см. соотношение (21)), на текущем внутреннем состоянии  МА-системы, на текущем модельном представлении МА-коалиции об объекте воздействий  и руководствуясь текущим состоянием плана , а также знанием о предыдущем действии  коалиции агентов, выбирает свое следующее плановое действие  при наличии ограничений  на выбор действия:

.           (36)

         Заметим, что данный способ выбора действия МА-системы учитывает текущую цель  управления объектом воздействий (составной отражающей поверхности главного рефлектора) посредством использования функции обновления плана , задаваемой соотношением (35). Однако в условиях всепогодности применения современных больших полноповоротных радиотелескопов миллиметрового диапазона приводящих к значительным колебаниях «мощности» деформирующих процессов, искажающих реальную форму составной поверхности главного рефлектора, необходимо изменять порядок выбора текущей цели управления активной поверхностью главного зеркала. Этот выбор может быть осуществлен, если определена т.н. Стратегия управления  для каждого агента, под которой в приложении к -му агенту  понимается отображение, сопоставляющее любой непустой конечной последовательности состояний объекта (точнее состояний сектора поверхности, управляемого агентом нижнего уровня, либо объекта управления в целом для агента среднего уровня) выбор воздействий агента таким образом, что , т.е. выбор действия агента не противоречит текущему -му состоянию составной поверхности. Стратегией коалиции агентов при этом является набор стратегий  всех агентов, входящих в коалицию.

Последовательность  назовем возможным результатом стратегии  в состоянии , если  и

               (37)

Здесь  – отношение переходов, описывающее возможные изменения

состояния составной поверхности в зависимости от действий  всех агентов МА-системы, а множество всех возможных результатов стратегии  в состоянии  обозначим как .

 

4. Заключение

Представление средств управления активной поверхностью главного зеркала радиотелескопа в виде многоагентной интеллектуальной системы не требует глобальной трансформации и реконфигурации структуры управляющих звеньев, поскольку существующая инфраструктура распределенной иерархической управляющей среды изначально обладает практически всеми свойствами коалиции интеллектуальных агентов. Основная модернизация необходима только для программно-математического обеспечения центров управления в целях расширения функциональности агентов соответствующих управляющих уровней для реализации базового набора свойств агента – Автономности, Реактивности, Проактивности, Коммуникативности. Также требуется несколько видоизменить программные механизмы координации и кооперации функционирования управляющих агентных центров в обеспечения корректной коллегиальной работы коалиции агентов, образующих мультиагентную систему.     

В конечном итоге интеллектуализация процессов регулировки пространственного положения зеркальных щитов составной поверхности главного рефлектора большого радиотелескопа миллиметрового и субмиллиметрового диапазона существенно повышает эффективность приема антенной системой космических радиоизлучений за счет повышения точности соответствия реальной многопанельной отражающей поверхности эталонному аппроксимирующему параболоиду вращения в условиях сильного влияния множества неблагоприятных факторов – гравитационных, термических, аэродинамических, акселерационных.

 

Литература

1.     Jacob W.M. Baars. the paraboloidal reflector antenna in radio astronomy and communication: Theory and practice.//astrophysics and space science library. v.348. –  New York, Springer Science+Business Media, LLC. 2007. – 253p.

2.     Greve A., Bremer M.  Thermal design and thermal behaviour of radio telescopes and their enclosures.// astrophysics and space science library. v.364. – London, New York, Springer Heidelberg Dordrecht. 2010. – 398p.

3.     Grue G., Alvito G., Ambrosini R. et al. The Sardinia Radio Telescope// Memorie della Supplementi Societa Astronomica Italiana. 2004. Vol. 5. pp.351-356.

4.     Kaercher H.J, Baars J.W. Design of the Large Millimeter Telescope//Gran Telescopio Millimetrico (LMT/GTM), Proc. SPIE. 2000. Vol. 4015, pp. 155-168.

5.     Lacasse R.J. The Green Bank Telescope Active Surface System.//National Radio Astronomy Observatory (NRAO)//Technical Report 184, GBT Memo Series, 1998.

6.     Бугайченко Д.Ю. Математическая модель и спецификация интеллектуальных агентных систем. // Системное программирование, 2006, № 2. – С. 94–115.

7.     Городецкий В.И. Многоагентные системы: современное состояние исследований и перспективы применения // Новости искусственного интеллекта, 1996, № 1. – С. 44-59.

8.     Городецкий В.И., Грушинский М.С., Хабалов А.В. Многоагентные системы (обзор) // Новости искусственного интеллекта, 1997, № 1. – С. 12-47.

9.     Городецкий В.И. Многоагентные системы: основные свойства и модели координации поведения // Информационные технологии и вычислительные системы, 1998, № 1. – С.22-34.

10. Евгенев Г.Б. Мультиагентные системы компьютеризации инженерной деятельности // Информационные технологии, 2000, № 3. – С. 2-7.

11. Рассел С., Норвиг П. Искусственный интеллект: Современный подход. Пер. с англ. – М.: Изд. дом «Вильямс», 2006. – 1406с.

12. Информационные системы./Волкова В.Н., Кузин Б.И., Барабанова И.М. и др. Под общ. ред. В.Н. Волковой и Б.И. Кузина – СПб.: Изд-во СПбГПУ, 2004. – 224с.