c1.gif (954 bytes) "ЖУРНАЛ РАДИОЭЛЕКТРОНИКИ"  N 3 , 2000

оглавление

дискуссия

c2.gif (954 bytes)

ФРАКТАЛЬНАЯ ШКАЛА ДЛЯ ИЗМЕРЕНИЯ ФОРМЫ РАСПРЕДЕЛЕНИЙ ВЕРОЯТНОСТИ

Ю.Н. Кликушин

Омский Государственный технический университет

Получена 10 марта 2000 г.

Описана технология шкалирования формы распределений вероятности случайных сигналов, основанная на представлении подобных сигналов в виде особых фрактальных функций. В качестве числового показателя, с помощью которого собственные имена распределений вероятности отображаются в порядковую шкалу, предлагается использовать характерный уровень насыщения фрактальных функций. Приведены результаты исследования метрологических характеристик полученной фрактальной шкалы распределений.

При разработке интеллектуальных средств измерений, контроля и диагностики возникают задачи автоматического распознавания и классификации объекта исследований, чаще всего представленного некоторой совокупностью выборочных значений, например, временным рядом наблюдений. В случае, когда исходные данные носят случайный характер, распознавание заключается в идентификации вида распределения вероятностей этих данных, так как именно знание этой стороны структуры входной информации позволяет выбрать оптимальные алгоритмы ее дальнейшей обработки [1]. Современные методы идентификации распределений вероятности, подробный обзор которых представлен в работе [2], отличаются значительным разнообразием и используют для формирования критериев распознавания методы теорий вероятности и информации.

Однако, ни один из известных методов не позволяет упорядочить форму распределений в виде регулярной шкалы в полном диапазоне возможных "значений" величины, определяемой рассматриваемым понятием, поскольку до сих пор не установлена методологическая основа исследований в этой области.

В данной работе представлены результаты исследования возможности создания порядковых идентификационных шкал для распределений вероятности, основанных на фрактальных моделях исследуемых процессов.

В основе эмпирических методов фрактального анализа лежит, так называемый метод Херста или (R/S) – метод [3], ориентированный на выявление и оценку нестационарных компонент случайного процесса. Занимаясь изучением динамики стока рек, Херст предложил эмпирическую модель, обобщающую и классифицирующую многие другие природные явления, в виде зависимости отношения размаха R накопленного отклонения от среднего к среднеквадратическому отклонению S, от времени наблюдения (или объема выборки N):

,

(1)

где: A – некоторая постоянная; Н – показатель Херста. В последствии, Бенуа Мандельброт, на основе анализа обобщенного броуновского движения, показал, что возможные значения показателя Херста лежат в диапазоне H=(0..1) и их можно использовать в качестве классификационного параметра исследуемого процесса следующим образом. Если Н<0.5, то процесс обладает знакопеременной тенденцией и называется антиперсистентным. Если Н>0.5, то процесс относится к классу персистентных, т.е. сохраняющих тенденцию к возрастанию или убыванию. При Н=0.5 имеет место случай, соответствующий классу стационарных случайных процессов.

Знание параметра Н позволяет оценить такие важнейшие показатели, как фрактальная размерность (размерность Хаусдорфа – Безиковича) D=2-H и коэффициент долговременной корреляции По существу модель (1) является новой формой представления сигналов на фрактальной плоскости, образованной координатными осями X=LOG(N) и Y=LOG(R/S), где показатель Херста Н определяет наклон аппроксимирующей прямой фрактальной линии к оси абсцисс.

Основной недостаток метода Херста состоит в том, что он не различает стационарных случайных сигналов – вне зависимости от формы распределения вероятностей показатель Херста для этих сигналов равен 0.5.

Чтобы устранить указанный недостаток предлагается модернизировать фрактальные единицы измерения, для чего: вместо параметра Херста вычислять параметр NF, названный виртуальным (кажущимся) объемом:

,

(2)

где: max{xi}, min{xi} – соответственно, максимальное и минимальное значения из ряда наблюдений {x1, x2, …, xn}; X0 – оценка среднего арифметического ряда наблюдений; N – объем выборки; Kf – фрактальный коэффициент передачи; СКО – среднеквадратическое отклонение.

Для ответа на вопрос: насколько хорошо виртуальный объем может выполнять функцию разделяющего (идентификационного) параметра, автором было проведено компьютерное моделирование, методика которого заключалась в следующем.

С помощью программных генераторов формировались выборки случайных чисел. Для каждой выборки вычислялась фрактальная функция (2). В свою очередь фрактальная функция усреднялась по количеству реализаций. По усредненной фрактальной функции оценивались параметры NF и Kf, которые сопоставлялись с именем соответствующего программного генератора. Для усредненной зависимости NF=f(N) подбиралась аналитическая модель и оценивалась ее погрешность.

На рис.1 представлены результаты исследований усредненных по 10 реализациям фрактальных зависимостей первого и второго порядка для двумодального (2MOD), равномерного (EVEN), нормального (GAUS) и Коши (COSH) распределений. Наличие характерных участков насыщения на фрактальных линиях сигналов с различными распределениями и линейная упорядоченность фрактальных линий второго порядка указывают на объективное существование порядковой шкалы для распределений вероятности.

Рис.1. Экспериментальные фрактальные линии первого (а) и второго (б) порядка для 2МОД (2MOD), РАВН (EVEN), НОРМ (GAUS) и КОШИ (COSH) распределений

Для обеспечения единого аналитического описания фрактальных линий всех форм распределений вероятности на плоскости X=NF, Y=N было предложено использовать модель вида:

(3)

 в которой присутствует только один идентификационный параметр – N* - критический объем. Критический объем определяется как такой объем выборки, при котором фрактальный коэффициент передачи составляет » 0.707 от номинального (для данного вида распределения) значения.

Проверка согласия аналитического выражения (3) с ходом реальных фрактальных функций (рис.1,а) на качественном уровне позволяет оценить диапазоны изменения фрактальных параметров N*, NF и Kf распределений вероятности. Так, например, при N>>N* имеем: NF=N* и Kf =0. Такая ситуация имеет место для ограниченных распределений типа 2МОД, АРКС и РАВН, у которых, соответственно, NF(2МОД)=4, NF(АРКС)=8, NF(РАВН)=12 и сами значения виртуального объема NF от объема выборки N не зависят. Другой крайний случай имеет место при N<<N*. Тогда NF» N и Kf » 1, что наблюдается для распределений типа КОШИ.

На основании вышеизложенного, можно утвержать, что: все многообразие форм распределений вероятности заключено в диапазоне от 2МОД до КОШИ со значениями фрактального коэффициента передачи Kf от 0 до 1 при уровне виртуального объема 2£ NF£ N.

Результаты исследования метрологических характеристик фрактальной шкалы распределений (ФШР) представлены в табл.1. для объема выборки N=400 при 10 реализациях В качестве «оцифрованных» отметок ФШР использовались имена симметричных распределений вероятности, наиболее часто встречающихся в практике статистических измерений. Качество калибровки ФШР определяется качеством используемых эталонов – программных генераторов распределений. В данном случае для генерации некоторых видов распределений (СИМП, НОРМ) использовались приближенные, наиболее простые (с позиции программной реализации) композиционные модели вида:

СИМПFOR I=1 TO N: P(I)=RND+RND-1:NEXT I

НОРМFOR I=1 TO N: Q=0: FOR J=1 TO 12: Q=Q+RND: NEXT J: P(I)=Q-6: NEXT I. Здесь RND – функция, генерирующая равномерно распределенные в диапазоне от 0 до 1 случайные числа; P(I) – массив случайных чисел с заданным распределением.

В погрешность модели входит систематическая составляющая, обусловленная смещением реальной характеристики (3) из начала координат на Nmin = 2. При введении соответствующей поправки на смещение погрешность модели будет меньше, приведенной в таблице оценки.

Таблица 1. 

Вид распределения

2МОД

АРКС

РАВН

СИМП

НОРМ

ЛАПЛ

КОШИ

Идеализированные (оцифрованные) отметки шкалы

4

8

12

21

36

100

400

Виртуальный объем NF при N=400

3.996

8.13

11.7

21.2

36.9

102,6

430

Фрактальный коэфф.-т передачи Kf при N=400

0.01

0.02

0.03

0.053

0.09

0.25

1.07

Погрешность (для Рд=0.95) модели,%

0.14

1.4

2.5

1

2.7

3

8

Случ. погрешность (для Рд=0.95),%

2.5

10.7

15.5

15.6

24

27

10

Пока не ясно, почему наибольшие уровни случайных погрешностей наблюдаются для отметок ФШР, принадлежащих нормальному (НОРМ) и лапласовскому (ЛАПЛ) распределениям.

Рассмотренная технология фрактального шкалирования была реализована в виде программного обеспечения распознающей системы интеллектуального анализатора сигналов. В табл.2 даны результаты работы системы в режиме самокалибровки, когда на вход подаются выборки объема N=400 в количестве 100 реализаций от внутренних эталонных генераторов. В составе этих генераторов присутствовали такие, которые формировали данные, имеющие асимметричные распределения: ЛЭКС – левоасимметричное экспоненциальное; ЭКСП – правоасимметричное экспоненциальное и РЕЛЕ – релеевское. Коэффициенты, стоящие на пересечении строк и столбцов табл.2 имеют смысл условных вероятностей принятия решения о том, какое эталонное имя присвоено выборкам, извлеченным из каждого конкретного генератора случайных чисел. Если диагональные коэффициенты равны 1, это значит, что система абсолютно правильно идентифицирует входные данные.

Таблица 2.

N=400
L=100

2МОД

АРКС

РАВН

СИМП

НОРМ

ЛАПЛ

КОШИ

Погрешность, %

2МОД

1.00

0

0

0

0

0

0

0

АРКС

0

1.00

0

0

0

0

0

0

РАВН

0

0

1.00

0

0

0

0

0.8

СИМП

0

0

0

1.00

0

0

0

1.2

РЕЛЕ

0

0

0

0.43

0.57

0

0

 

НОРМ

0

0

0

0.07

0.93

0

0

5.5

ЛЭКС

0

0

0

0.04

0.84

0.12

0

 

ЭКСП

0

0

0

0.06

0.79

0.15

0

 

ЛАПЛ

0

0

0

0

0.07

0.93

0

2.1

КОШИ

0

0

0

0

0

0.04

0.96

11

В графе "Погрешность, %" прведены оценки погрешности смещения реальных значений идентификационного параметра NF от эталонных значений этого же параметра, используемых в качестве оцифрованных отметок ФШР. Для асимметричных распределений в этой шкале эталонов нет, поэтому соответствующие погрешности определены быть не могут. Интересно, что такие асимметричные выпуклые распределения, как ЛЭКС и ЭКСП оказались "притянутыми" (примерно на 80%) к симметричному НОРМ распределению, а не к симметричному ЛАПЛ распределению, соответственно, левой и правой половинками которого ЛЭКС и ЭКСП являются.

Полученные результаты указывают на перспективность использования технологии фрактального шкалирования для идентификации распределений вероятности случайных сигналов с достоверностью не менее 90% и погрешностью не более 15% по всему диапазону (от 2МОД до КОШИ) симметричных распределений.

Таким образом, метод виртуальных объемов позволил:

  • установить новый, до сих пор неизвестный, тип закономерности между распределениями вероятности в виде фрактальной порядковой шкалы;
  • оценить основные метрологические свойства ФШР, в частности, впервые определить диапазон существования возможных видов распределений;
  • разработать более прогрессивную технологию (по сравнению, например, с методами гистограмм или проверки гипотез) идентификации – технологию измерения формы распределения вероятностей.

ЛИТЕРАТУРА

  1. Новицкий П.В., Зограф И.А. Оценка погрешностей результатов измерений. – Л.: Энергоатомиздат, 1991. – 304 с.
  2. Губарев В.В. Вероятностные модели: Справочник в 2-х частях. – Новосибирск.: НЭТИ, 1992. – 422 с.
  3. Федер Е. Фракталы: Пер. с англ. – М.: Мир, 1991. – 254 с.

Автор: Кликушин Юрий Николаевич, доцент кафедры "Информационно-измерительная техника" Омского государственного технического университета
Адрес: 644050, Омск-50, пр.Мира, 11, ОмГТУ
Тел. (381-2) 65-37-07

E-mail: lab308@omgtu.omskelecom.ru

c3.gif (955 bytes)

оглавление

дискуссия

c4.gif (956 bytes)